Esettanulmány: Tartalom moderálása
Több mint 30 XNUMX internetes dokumentum selejtezve és megjegyzésekkel ellátva a tartalommoderáláshoz
amelyek arra törekszenek, hogy biztosítsák azt az online teret, ahol kapcsolódunk és kommunikálunk.
Ahogy a közösségi média használata folyamatosan növekszik, a
Az internetes zaklatás problémája a
jelentős akadály az arra törekvő platformok számára
biztonságos online teret biztosít. Megdöbbentő
Az egyének 38%-a találkozik ezzel
káros magatartás a mindennapokban,
hangsúlyozva a találékonyság sürgető igényét
tartalommoderálási megközelítések.
A szervezetek ma a használatára támaszkodnak
mesterséges intelligencia a tartós megszólítására
az internetes zaklatás proaktív problémája.
Kiberbiztonság:
A Facebook közösségi normák végrehajtásáról szóló negyedik negyedéves jelentése felfedte – intézkedés 4 millió zaklató és zaklató tartalommal, 6.3%-os proaktív észlelési arány mellett
Oktatás:
A 2021 tanulmány megállapította, hogy 36.5%év közötti egyesült államokbeli tanulók %-a 12 & 17 évek óta tapasztaltak internetes zaklatást iskolai tanulmányaik során.
Egy 2020-as jelentés szerint a globális tartalommoderációs megoldások piacának értéke 4.07-ben 2019 milliárd USD volt, és 11.94-re várhatóan eléri a 2027 milliárd USD-t 14.7 százalékos CAGR mellett.
Való világmegoldás
Globális beszélgetéseket moderáló adatok
Az ügyfél robusztus automatizált
tartalom moderálása Gépi tanulás
modelljét a Cloud-kínálatához, amelyhez ők
domain-specifikus szállítót kerestek, akik
pontos edzési adatokkal segítheti őket.
A természetes nyelvi feldolgozásban (NLP) szerzett széleskörű tudásunkat kihasználva több mint 30,000 XNUMX angol és spanyol nyelvű dokumentum összegyűjtésében, kategorizálásában és annotálásában segítettünk ügyfelünknek az automatizált tartalommoderálási gépi tanulási modell felépítésében, amely mérgező, felnőtt vagy szexuális tartalommá kettévált. kategóriák.
Probléma
- 30,000 XNUMX dokumentumot spanyol és angol nyelven is összegyűjt az interneten a kiemelt tartományokból
- Az összegyűjtött tartalom kategorizálása rövid, közepes és hosszú szegmensekre
- Az összeállított adatok mérgező, felnőtteknek szóló vagy nyíltan szexuális tartalomként való címkézése
- Minimum 90%-os pontosságú, kiváló minőségű kommentárok biztosítása.
Megoldás
- Az interneten 30,000 XNUMX spanyol és angol nyelvű dokumentumot selejteztek le a BFSI-től, az egészségügytől, a gyártástól és a kiskereskedelemtől. A tartalom tovább bomlott rövid, közepes és hosszú dokumentumokra
- A besorolt tartalom sikeres címkézése mérgező, felnőtteknek szóló vagy nyíltan szexuális tartalomként
- A 90%-os minőség elérése érdekében a Shaip kétszintű minőségellenőrzési folyamatot vezetett be:
» 1. szint: Minőségbiztosítási ellenőrzés: Az érvényesítendő fájlok 100%-a.
» 2. szint: Kritikus minőségelemzés Ellenőrzés: Shaips CQA csapata a retrospektív minták 15-20%-át értékeli.
Eredmény
A betanítási adatok segítettek az automatizált tartalommoderálási ML modell felépítésében, amely számos, a biztonságosabb online környezet fenntartása szempontjából előnyös eredményt hozhat. A legfontosabb eredmények közül néhány:
- Hatékonyság hatalmas mennyiségű adat feldolgozásához
- Következetesség a moderációs politikák egységes érvényesítésében
- Skálázhatóság a növekvő felhasználói bázishoz és tartalommennyiséghez való alkalmazkodáshoz
- A valós idejű moderálás képes azonosítani és
távolítsa el a potenciálisan káros tartalmat a keletkezésükkor - Költséghatékonyság az emberi moderátoroktól való függés csökkentésével
Példák a tartalom moderálására
Mondja el, hogyan tudunk segíteni a következő AI kezdeményezésében.