Esettanulmány: Utterance Collection

Több mint 7 millió kijelentést szállítottunk többnyelvű digitális asszisztensek létrehozásához 13 nyelven

Szólásgyűjtemény

Való világmegoldás

A globális beszélgetéseket működtető adatok

Az Utterance képzésre azért van szükség, mert nem minden ügyfél használja a pontos szavakat vagy kifejezéseket, miközben scriptes formátumban kommunikál, vagy kérdéseket tesz fel hangsegédeinek. Ezért kell bizonyos hangalkalmazásokat oktatni a spontán beszédadatokra. Pl. „Hol van a legközelebbi kórház?” „Fid a Hospital near me” vagy „Van egy kórház a közelben?” mindegyik ugyanazt a keresési szándékot jelzi, de másképpen vannak megfogalmazva.

Szólásgyűjtemény1

Probléma

Az ügyfelek Digital Assistant beszéd ütemtervének végrehajtásához a világ különböző nyelvein, a csapatnak nagy mennyiségű betanítási adatot kellett beszereznie a beszédfelismerő mesterséges intelligencia modellhez. Az ügyfél kritikus követelményei a következők voltak:

  • Nagy mennyiségű betanítási adat beszerzése (legfeljebb 3-30 másodperc hosszúságú, egyetlen beszélővel kapcsolatos kimondás) a beszédfelismerő szolgáltatásokhoz 13 globális nyelven
  • A szállító minden egyes nyelvhez szöveges felszólításokat generál a beszélőknek, hogy rögzítsék őket (kivéve, ha a
    kliens kellékek), és írja át a kapott hangot.
  • Adja meg a hangadatokat és a rögzített megnyilatkozások átírását a megfelelő JSON-fájlokkal
    tartalmazza az összes felvétel metaadatait.
  • Biztosítsa a beszélők változatos keverékét kor, nem, iskolai végzettség és nyelvjárás szerint
  • Biztosítsa a rögzítési környezetek változatos keverékét az előírásoknak megfelelően.
  • Minden hangfelvételnek legalább 16 kHz-es, de lehetőleg 44 kHz-esnek kell lennie

Gyorsítsa fel a társalgási AI -t
alkalmazásfejlesztés 100% -ban

„Sok szállító értékelése után az ügyfél a párbeszédes AI-projektekben szerzett szakértelme miatt választotta a Shaipet. Lenyűgözött bennünket Shaip projektvégrehajtási kompetenciája, szakértelmük a szakértő nyelvészektől a szükséges megnyilatkozások forrásában, átírásában és továbbításában 13 nyelven, szigorú határidőn belül és a szükséges minőségben.”

Megoldás

A társalgási mesterséges intelligencia mélyreható ismerete révén szakértő nyelvészekből és annotátorokból álló csapattal segítettünk az ügyfeleknek összegyűjteni, átírni és megjegyzésekkel ellátni az adatokat az AI-alapú beszédfeldolgozási többnyelvű Voice Suite képzésében.

A Shaip által végzett munka kiterjedt, de nem korlátozódott arra, hogy nagy mennyiségű hangképzési adatot szerezzen be a beszédfelismeréshez, hangfelvételeket írjon át több nyelven az 1. és 2. szintű nyelvi ütemtervünkön szereplő összes nyelvre, valamint a megfelelő szállítást. JSON a metaadatokat tartalmazó fájlokat. Shaip 3-30 másodperces kijelentéseket gyűjtött össze, miközben fenntartotta a kívánt minőségi szintet, amely szükséges az ML-modellek komplex projektekhez való betanításához.

  • Összegyűjtött, átírt és megjegyzésekkel ellátott hanganyag: 22,250 óra
  • Támogatott nyelvek: 13 (dán, koreai, szaúd-arábiai arab, holland, anyaországi és tajvani kínai, kanadai francia, mexikói spanyol, török, hindi, lengyel, japán, orosz)
  • Kijelentések száma: 7M +
  • Idővonal: 7-8 hónap

Ai-alapú beszédfeldolgozó többnyelvű hangcsomag

A 16 kHz-es hangkimondások gyűjtése során a beszélők egészséges keverékét biztosítottuk életkor, nem, iskolai végzettség és dialektusok szerint különböző felvételi környezetekben.

Eredmény

A szakértő nyelvészektől származó kiváló minőségű hangadatok lehetővé tették az ügyfelek számára, hogy pontosan megtanítsák többnyelvű beszédfelismerési modelljüket 13 Global Tier 1 és 2 nyelven. Az aranystandard képzési adatkészletekkel az ügyfél intelligens és robusztus digitális segítséget kínálhat a jövőbeli valós problémák megoldásához.

Kiváló minőségű kijelentés hangadatok

Szakértelem

Beszédórák összegyűjtve
0 +
Hangadatgyűjtők csapata
0
PII-kompatibilis
0 %
Remek szám
0 +
Adatelfogadás és -pontosság
> 0
Fortune 500 ügyfélkör
0 +

Mondja el, hogyan tudunk segíteni a következő AI kezdeményezésében.