Esettanulmány: Utterance Collection
Több mint 7 millió kijelentést szállítottunk többnyelvű digitális asszisztensek létrehozásához 13 nyelven
Való világmegoldás
A globális beszélgetéseket működtető adatok
Az Utterance képzésre azért van szükség, mert nem minden ügyfél használja a pontos szavakat vagy kifejezéseket, miközben scriptes formátumban kommunikál, vagy kérdéseket tesz fel hangsegédeinek. Ezért kell bizonyos hangalkalmazásokat oktatni a spontán beszédadatokra. Pl. „Hol van a legközelebbi kórház?” „Fid a Hospital near me” vagy „Van egy kórház a közelben?” mindegyik ugyanazt a keresési szándékot jelzi, de másképpen vannak megfogalmazva.
Probléma
Az ügyfelek Digital Assistant beszéd ütemtervének végrehajtásához a világ különböző nyelvein, a csapatnak nagy mennyiségű betanítási adatot kellett beszereznie a beszédfelismerő mesterséges intelligencia modellhez. Az ügyfél kritikus követelményei a következők voltak:
- Nagy mennyiségű betanítási adat beszerzése (legfeljebb 3-30 másodperc hosszúságú, egyetlen beszélővel kapcsolatos kimondás) a beszédfelismerő szolgáltatásokhoz 13 globális nyelven
- A szállító minden egyes nyelvhez szöveges felszólításokat generál a beszélőknek, hogy rögzítsék őket (kivéve, ha a
kliens kellékek), és írja át a kapott hangot. - Adja meg a hangadatokat és a rögzített megnyilatkozások átírását a megfelelő JSON-fájlokkal
tartalmazza az összes felvétel metaadatait. - Biztosítsa a beszélők változatos keverékét kor, nem, iskolai végzettség és nyelvjárás szerint
- Biztosítsa a rögzítési környezetek változatos keverékét az előírásoknak megfelelően.
- Minden hangfelvételnek legalább 16 kHz-es, de lehetőleg 44 kHz-esnek kell lennie
„Sok szállító értékelése után az ügyfél a párbeszédes AI-projektekben szerzett szakértelme miatt választotta a Shaipet. Lenyűgözött bennünket Shaip projektvégrehajtási kompetenciája, szakértelmük a szakértő nyelvészektől a szükséges megnyilatkozások forrásában, átírásában és továbbításában 13 nyelven, szigorú határidőn belül és a szükséges minőségben.”
Megoldás
A társalgási mesterséges intelligencia mélyreható ismerete révén szakértő nyelvészekből és annotátorokból álló csapattal segítettünk az ügyfeleknek összegyűjteni, átírni és megjegyzésekkel ellátni az adatokat az AI-alapú beszédfeldolgozási többnyelvű Voice Suite képzésében.
A Shaip által végzett munka kiterjedt, de nem korlátozódott arra, hogy nagy mennyiségű hangképzési adatot szerezzen be a beszédfelismeréshez, hangfelvételeket írjon át több nyelven az 1. és 2. szintű nyelvi ütemtervünkön szereplő összes nyelvre, valamint a megfelelő szállítást. JSON a metaadatokat tartalmazó fájlokat. Shaip 3-30 másodperces kijelentéseket gyűjtött össze, miközben fenntartotta a kívánt minőségi szintet, amely szükséges az ML-modellek komplex projektekhez való betanításához.
- Összegyűjtött, átírt és megjegyzésekkel ellátott hanganyag: 22,250 óra
- Támogatott nyelvek: 13 (dán, koreai, szaúd-arábiai arab, holland, anyaországi és tajvani kínai, kanadai francia, mexikói spanyol, török, hindi, lengyel, japán, orosz)
- Kijelentések száma: 7M +
- Idővonal: 7-8 hónap
A 16 kHz-es hangkimondások gyűjtése során a beszélők egészséges keverékét biztosítottuk életkor, nem, iskolai végzettség és dialektusok szerint különböző felvételi környezetekben.
Eredmény
A szakértő nyelvészektől származó kiváló minőségű hangadatok lehetővé tették az ügyfelek számára, hogy pontosan megtanítsák többnyelvű beszédfelismerési modelljüket 13 Global Tier 1 és 2 nyelven. Az aranystandard képzési adatkészletekkel az ügyfél intelligens és robusztus digitális segítséget kínálhat a jövőbeli valós problémák megoldásához.
Szakértelem
Ajánlott források
Vásárlói útmutató
Vevői útmutató: Beszélgetési AI
A chatbot, amellyel beszélgetett, egy fejlett társalgási mesterséges intelligencia rendszeren fut, amelyet rengeteg beszédfelismerő adatkészlet felhasználásával képeztek ki, teszteltek és építettek fel.
Blog
A társalgási AI állapota 2021
A Conversational AI 2021 infografikák arról beszélnek, hogy mi a Conversational AI, annak evolúciójáról, típusairól, a beszélgetési AI piacáról régióra, felhasználási esetekről, kihívásokról stb.
Blog
3 A társalgási AI fejlődésének akadályai
A Shaip elindítja a beszélgetéses intelligencia fejlődését, mint ügyfélelkötelező eszköz azáltal, hogy felajánlja a szükséges jegyzetekkel ellátott audioadatokat 50+ nyelven.
Mondja el, hogyan tudunk segíteni a következő AI kezdeményezésében.