A legmegbízhatóbb beszédadatgyűjtési szolgáltatások az Ön mesterséges intelligenciájához
Tanítsa NLP -modelljeit, VA -jait, TTS -prototípusait és egyebeket minőségi beszélgetési adatokkal audio- és beszédadat -gyűjtési szolgáltatásaink segítségével
Fedezze fel az audio adatfolyamokat szűk keresztmetszetek nélkül
Kiemelt ügyfelek
Professzionális audio/hang adatgyűjtési szolgáltatások
Bármely tárgy. Bármely forgatókönyv.
A Shaipnél szakértelmünk abban rejlik, hogy kiváló minőségű beszédadatkészleteket hozzon létre, amelyeket különféle AI/ML követelményekhez terveztek. Nyelvek és rekordok széles választékát kínáljuk különféle beállításokkal, így adatkészleteink átfogóak és adaptálhatók. Oa hangsúly a legnagyobb mennyiségű egyéni beszédadatot tartalmazó modelleken van a lehető legrövidebb idő alatt. Velünk a fedélzeten a következőkre számíthatsz:
- Kiváló minőségű többnyelvű hang-/hangadatok a pontosság javítása érdekében
- A lehető legmagasabb szintű tartományspecifitás a target változatos forgatókönyv felépítés
- Méretezze ML-modelljét, hogy megfeleljen a különböző demográfiai adatoknak és ágazatoknak
- Felvételi környezetek: Stúdió minőség, kristálytiszta hanggal minimális háttérzajjal, és Természeti környezetek, ahol a felvételek környezeti hangokat tartalmaznak, hogy utánozzák a valós helyzeteket.
100 +
55 ezer +
Beszédórák adatai
250 +
Projektek
60 +
Nyelvek (100+ dialektus)
8 / 16 / 44 / 48 kHz
Mintavételi sebesség
Szakértelem
Igazítsa a hangadatokat a következőhöz: az intelligensebb NLP-modellekhez
A Shaip teljes körű beszéd-/hangadat-gyűjtési szolgáltatásokat kínál több mint 100 nyelven, hogy lehetővé tegye a hangtechnológiák használatát a világ különböző tájainak közönsége számára. Bármilyen kiterjedésű és méretű projekteken dolgozhatunk; a meglévő polcról származó audio adathalmazok engedélyezésétől az egyéni audio adatgyűjtés kezeléséig, a hangátírástól és a megjegyzésektől. Függetlenül attól, hogy milyen nagy a beszédadat-gyűjtési projektje, testre szabhatjuk a hanggyűjtési szolgáltatásokat az Ön igényeinek megfelelően, hogy kiváló minőségű, nyelvjárásokat, hangokat és nyelveket célzó NLP-adatkészleteket hozzunk létre. Válasszon a beszédadat-készletek és az audio-adatgyűjtési erőforrások széles választékából, a hangot lehetővé tevő intelligens beállításokhoz.
Monológ forgatókönyv és spontán beszéd
Az egyetlen hangszóróból származó beszéd feldolgozására összpontosít. Használjon parancsfájllal ellátott promptokat az egycsatornás hangfájlokba való betáplálásához, biztosítva az adott személyre jellemző egyedi beszédminták, hangok és árnyalatok rögzítését.
Párbeszéd forgatókönyve és spontán beszéd
Kétszemélyes interakció, valós beszélgetések és párbeszédek replikálása többnyelvű megjelenítéssel kétcsatornás fájlok és átírt források segítségével.
Csoport / Muti-party
beszélgetések
Többszemélyes beszélgetések, csoportdinamika, átfedések és változatos hangnemek rögzítése a beszédmodellek pontos képzése érdekében.
Ébresztőszó / Kulcskifejezés / Kijelentésgyűjtemény
Tanítsd meg az AI-kat, hogy azonosítsák a kulcsfontosságú kifejezéseket vagy a hasonló jelentésű szavakat vagy kijelentéseket, változatos, gazdag és hiteles megnyilatkozások segítségével a fejlett természetes nyelvi feldolgozás és megértés érdekében.
Akusztikus adatok
Gyűjtemény
Professzionálisan tudunk stúdióminőségű hangadatokat rögzíteni, legyen szó éttermekről, irodákról, otthonokról vagy különféle környezetekről és nyelvekről, miközben szélesebb akusztikus tartományt lefed (Átfogó hangadatkészletek).
Automatikus beszédfelismerés (ASR)
Növelje automatikus beszédfelismerő (ASR) rendszereinek pontosságát azáltal, hogy hozzáférést biztosít a legmodernebb, változatos beszéd-/audio-adatkészletekhez a demográfiai adatok széles skálájából.
Többnyelvű beszéd/audio képzési adatok
Szakképzett nyelvi szakembereink világszerte többnyelvű hang-/beszédadatokat kínálnak különböző nyelveken és dialektusokban. Ez az erőfeszítés elősegíti a globális kommunikációt és áthidalja a nyelvi akadályokat, hozzájárulva a befogadóbb és hatékonyabb AI-megoldásokhoz.
Text-to-Speech
(TTS)
Készítsen szövegfelolvasó (TTS) többnyelvű modellt globális munkaerőnk segítségével, akik több mint 150 nyelven és dialektusban segítenek beszédadatokat gyűjteni, hogy az autóba épített vezérlőktől a chatbotokig és a tanulási megoldásokig magas színvonalú tanulási megoldásokat fejleszthessenek mesterségesintelligencia-modelljeihez. minőségi audio adatok.
Call Center
beszélgetések
Valódi csereügynökök és ügyfelek között, számos nyelv támogatásával, például spanyol, német, amerikai angol, bengáli, japán, kínai és hindi.
Sikertörténetek
Társalgó AI-adatkészletek több mint 3 órányi adattal 8 nyelven
Az indiai nyelvek többnyelvű platformjának kiépítése érdekében az ügyfél a Shaip-pel együttműködve nagy adatkészleteket gyűjt, szegmentál és ír át több indiai nyelven. Ez segítene hatékony beszédmodellek kifejlesztésében, amelyek az ügyfél innovatív új platformját erősíthetik.
Probléma: Több mint 3,000 órányi hangadat gyűjtött 8 indiai nyelven, szegmentálva és átírva az automatikus beszédfelismerés fejlesztése érdekében.
Megoldás: Adatgyűjtést, szegmentálást, átírást biztosítottunk, és JSON-fájlokat szállítottunk metaadatokkal. 3000 órányi hangadatot gyűjtöttünk össze 8 indiai nyelven az ügyfél beszédtechnológiai projektjéhez.
Az okok, amelyek miatt Shaipet választotta megbízható beszédadat -gyűjtő partnereként
Emberek (People)
Dedikált és kiképzett csapatok:
- Több mint 30,000 munkatárs az adatok létrehozásához, címkézéséhez és minőségbiztosításához
- Hitelesített projektmenedzsment csapat
- Tapasztalt termékfejlesztő csapat
- Tehetséggondozási és beszállítói csapat
folyamat
A legnagyobb hatékonyságot az alábbiak biztosítják:
- Robusztus 6 Sigma Stage-Gate folyamat
- 6 Sigma fekete övből álló elkötelezett csapat - A legfontosabb folyamattulajdonosok és a minőségi megfelelés
- Folyamatos fejlesztés és visszacsatolási hurok
Emelvény
A szabadalmaztatott platform előnyöket kínál:
- Webalapú végpontok közötti platform
- Kifogástalan minőség
- Gyorsabb TAT
- Zökkenőmentes szállítás
Emberek (People)
Dedikált és kiképzett csapatok:
- Több mint 30,000 munkatárs az adatok létrehozásához, címkézéséhez és minőségbiztosításához
- Hitelesített projektmenedzsment csapat
- Tapasztalt termékfejlesztő csapat
- Tehetséggondozási és beszállítói csapat
folyamat
A legnagyobb hatékonyságot az alábbiak biztosítják:
- Robusztus 6 Sigma Stage-Gate folyamat
- 6 Sigma fekete övből álló elkötelezett csapat - A legfontosabb folyamattulajdonosok és a minőségi megfelelés
- Folyamatos fejlesztés és visszacsatolási hurok
Emelvény
A szabadalmaztatott platform előnyöket kínál:
- Webalapú végpontok közötti platform
- Kifogástalan minőség
- Gyorsabb TAT
- Zökkenőmentes szállítás
Beszéd/audio adatkészletek
Részletek | Corpus ID (egyedi) | Kulcsszó | Nyelvi adatkészlet | Nyelvi kód | Mintavételi ráta | Adatkészlet típusa | Összes audio óra | Rövid leírás | Adatkészlet leírása | Hangcsatorna | Felvételi platform | MI VAGYUNK (%) | Audió Formátum | Átírási formátum | Használja az ügyet | Hangszórók száma | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
New York-i angol_GC_8 | New York angol | New York angol | hu | 8 kHz | Általános beszélgetés | 107 | New York-i angol általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 118, Férfi 114, Ismeretlen 0 | Kapcsolat | |
Russian_SM_48 | orosz | orosz | ru-RU | 48 kHz | Írásos monológ | 2,398 | Orosz forgatókönyvű monológ | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1689 Férfi 1937 Ismeretlen 214 | Kapcsolat | |
pandzsábi_MA | pandzsábi | pandzsábi (csővezetékben) | pandzsábi | Media Audio | 40 | pandzsábi (In Pipeline) Média audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Punjabi_GC | pandzsábi | pandzsábi (csővezetékben) | pandzsábi | Általános beszélgetés | 100 | pandzsábi (In Pipeline) Általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
pandzsábi_CC_8 | pandzsábi | pandzsábi (csővezetékben) | pandzsábi | Hívóközpont | 60 | pandzsábi (In Pipeline) Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
lengyel Lengyelország_SM_48 | Lengyel (Lengyelország) | Lengyel (Lengyelország) | pl-PL | 48 kHz | Írásos monológ | 1,482 | Lengyel Lengyelország – forgatókönyves monológ | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1324 Férfi 701 Ismeretlen 24 | Kapcsolat | |
lengyel_MA_16 | lengyel | lengyel | hu_PL | 16 kHz | Media Audio | 269 | Lengyel média hang | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 173 Férfi 354 Ismeretlen 6 | Kapcsolat | |
Oriya_MA | oriya | Oriya (Csővezetékben) | vagy_IN | Media Audio | 40 | Oriya (In Pipeline) Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Oriya_GC | oriya | Oriya (Csővezetékben) | vagy_IN | Általános beszélgetés | 100 | Oriya (In Pipeline) Általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Oriya_CC_8 | oriya | Oriya (Csővezetékben) | vagy_IN | Hívóközpont | 60 | Oriya (In Pipeline) Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Új-Zéland_MA_16 | Új-Zéland angol | Új-Zéland angol | hu_NZ | 16 kHz | Media Audio | 400 | Új-zélandi angol média hang | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 367, férfi 678, Ismeretlen 26 | Kapcsolat | |
Új-Zéland_GC_8 | Új-Zéland angol | Új-Zéland angol | hu_NZ | 8 kHz | Általános beszélgetés | 148 | Új-zélandi angol általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 167, férfi 121, Ismeretlen 4 | Kapcsolat | |
New York angol_MA_16 | New York angol | New York angol | hu | 16 kHz | Media Audio | 140 | New York-i angol média hangadatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 66, Férfi 230, Ismeretlen 11 | Kapcsolat | |
Skót_GC_8 | skót (angol akcentussal) | skót (angol akcentussal) | hu_AB | 8 kHz | Általános beszélgetés | 292 | A skót általános beszélgetés adatai | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 285 , Férfi 260, Ismeretlen 3 | Kapcsolat | |
New York angol_CC_8 | New York angol | New York angol | hu | 8 kHz | Hívóközpont | 103 | New York-i angol Call-center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 610, Férfi 532, Ismeretlen 0 | Kapcsolat | |
Hollandia_SM_48 | Holland | Holland | nl-NL | 48 kHz | Írásos monológ | 1,205 | Holland forgatókönyvű monológ | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1285 Férfi 531 Ismeretlen 3 | Kapcsolat | |
Mexican_SM_48 | Spanyol (Mexikó) | Spanyol (Mexikó) | es-MX | 48 kHz | Írásos monológ | 1,492 | Mexikói spanyol forgatókönyvű monológ | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1016 Férfi 1069 Ismeretlen 95 | Kapcsolat | |
Marathi_MA | marathi | marathi (csővezetékben) | mr_IN | Media Audio | 40 | Marathi (In Pipeline) Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Marathi_GC | marathi | marathi (csővezetékben) | mr_IN | Általános beszélgetés | 100 | Marathi (In Pipeline) Általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Marathi_CC_8 | marathi | marathi (csővezetékben) | mr_IN | Hívóközpont | 60 | Marathi (In Pipeline) Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Malayalam_MA | Malayalam | Malayalam (csővezetékben) | ml_IN | Media Audio | 40 | Malayalam (In Pipeline) Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Malayalam_GC | Malayalam | Malayalam (csővezetékben) | ml_IN | Általános beszélgetés | 100 | Malayalam (In Pipeline) Általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Malayalam_CC_8 | Malayalam | Malayalam (csővezetékben) | ml_IN | Hívóközpont | 60 | Malayalam (In Pipeline) Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
maláj_MA_16 | maláj | maláj | ms_MY | 16 kHz | Media Audio | 344 | Malay Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 236, Férfi 626, Ismeretlen 47 | Kapcsolat | |
maláj_GC_8 | maláj | maláj | ms_MY | 8 kHz | Általános beszélgetés | 266 | Maláj általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, maláj Malajziában | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 316, Férfi 176 , Ismeretlen 0 | Kapcsolat | |
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Általános beszélgetés | 553 | Telugu általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 574 , Férfi 564, Ismeretlen 0 | Kapcsolat | |
Egyesült Királyság angol_WW_16 | Angol angol | Angol angol | hu_uk | 16 kHz | Wake Word | 200 hangszórók | Wake Word brit angol | kulcskifejezések adatgyűjtés
| 1 csatorna | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nem: 50% férfi, 50% nő, +/- 10%. | Kapcsolat | |
Welsh_GC_8 | walesi (angol akcentus) | walesi (angol akcentus) | hu_WL | 8 kHz | Általános beszélgetés | 278 | Walesi általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 270, Férfi 324, Ismeretlen 0 | Kapcsolat | |
vietnami_MA_16 | vietnami | vietnami | vi_VN | 16 kHz | Media Audio | 257 | Vietnami Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 249, férfi 200, Ismeretlenek 45 | Kapcsolat | |
vietnami_GC_8 | vietnami | vietnami | vi_VN | 8 kHz | Általános beszélgetés | 295 | Vietnami általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, északi (pl. Hanoi), középső és déli (pl. Ho Si Minh-város). | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 400, férfi 380, Ismeretlenek 2 | Kapcsolat | |
Turkish Turkey_SM_48 | Török Törökország | Török Törökország | tr-TR | 48 kHz | Írásos monológ | 2,027 | Török Törökország | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1561 Férfi 1241 Ismeretlen 31 | Kapcsolat | |
Thai_MA_8 | thai | thai | th_TH | 16 kHz | Media Audio | 173 | Thai Media audio | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 143, Férfi 502, Ismeretlen 26 | Kapcsolat | |
Thai_GC_8 | thai | thai | th_TH | 8 kHz | Általános beszélgetés | 183 | Thai általános beszélgetés | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, barátok között használt informális nyilvántartás | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 338, Férfi 96, Ismeretlen 8 | Kapcsolat | |
telugu_MA | telugu | telugu (folyamatban) | te_IN | Media Audio | 20 | Telugu (In Pipeline) Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Telugu_GC | telugu | telugu (folyamatban) | te_IN | Általános beszélgetés | 50 | Telugu (In Pipeline) Általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Telugu_CC_8 | telugu | telugu (folyamatban) | te_IN | Hívóközpont | 30 | Telugu (In Pipeline) Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Media Audio | 648 | Telugu Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 207, Férfi 963, Ismeretlen 2 | Kapcsolat | |
Koreai_SM_48 | koreai | koreai | ko-KR | 48 kHz | Írásos monológ | 1,955 | Koreai forgatókönyvű monológ | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1195 Férfi 1134 Ismeretlen 122 | Kapcsolat | |
tamil_MA | tamil | tamil (csővezetékben) | ta_IN | Media Audio | 40 | Tamil (In Pipeline) Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Tamil_GC | tamil | tamil (csővezetékben) | ta_IN | Általános beszélgetés | 100 | Tamil (In Pipeline) Általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Tamil_CC_8 | tamil | tamil (csővezetékben) | ta_IN | Hívóközpont | 60 | Tamil (In Pipeline) Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
svéd_MA_16 | svéd | svéd | sv_SE | 16 kHz | Media Audio | 278 | Svéd média hangadatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 195, férfi 500, Ismeretlen 21 | Kapcsolat | |
Swedish_CC_8 | svéd | svéd | sv_SE | 8 kHz | Hívóközpont | 250 | Svéd Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1581, férfi 727, Ismeretlen 2 | Kapcsolat | |
szuahéli_MA_16 | szuahéli | szuahéli | sw_KE | 16 kHz | Media Audio | 265 | Szuahéli Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 118, Férfi 493, Ismeretlen 25 | Kapcsolat | |
szuahéli_CC_8 | szuahéli | szuahéli | sw_KE | 8 kHz | Hívóközpont | 230 | Szuahéli Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 611, Férfi 833, Ismeretlen 0 | Kapcsolat | |
dél-afrikai angol_MA_16 | Dél-afrikai angol | Dél-afrikai angol | hu_ZA | 16 kHz | Media Audio | 251 | Dél-afrikai angol média hangadatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 235, Férfi 432, Ismeretlen 36 | Kapcsolat | |
dél-afrikai angol_CC_8 | Dél-afrikai angol | Dél-afrikai angol | hu_ZA | 8 kHz | Hívóközpont | 261 | Dél-afrikai angol Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1274 , Férfi 935 , Ismeretlen 1 | Kapcsolat | |
Szingapúr_MA_16 | Szingapúr angol | Szingapúr angol | hu_SG | 16 kHz | Media Audio | 247 | Singapore Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 160, Férfi 455, Ismeretlen 37 | Kapcsolat | |
Singapore_CC_8 | Szingapúr angol | Szingapúr angol | hu_SG | 8 kHz | Hívóközpont | 218 | Szingapúri Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 2139 , Férfi 884, Ismeretlen 21 | Kapcsolat | |
Boston_CC_8 | Boston angol | Boston angol | hu | 8 kHz | Hívóközpont | 177 | Boston Call-center adatai | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 605, Férfi: 711 és Ismeretlen: 0 | Kapcsolat | |
angol Deep South_CC_8 | Angol mély dél | Angol mély dél | hu | 8 kHz | Hívóközpont | 151 | Angol Deep South Call-center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 221 , Férfi 1004 , Ismeretlen 7 | Kapcsolat | |
Danish_SM_48 | dán | dán | da-DK | 48 kHz | Írásos monológ | 2,579 | Dán forgatókönyvű monológ | Egyetlen hangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek, dán Dániából | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1551 Férfi 1233 Ismeretlen 42 | Kapcsolat | |
dán_MA_16 | dán | dán | da_DK | 16 kHz | Media Audio | 664 | Danish Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 369, Férfi: 864, Ismeretlen: 27 | Kapcsolat | |
Danish_GC_8 | dán | dán | da_DK | 8 kHz | Általános beszélgetés | 372 | Dán általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 311, Férfi: 417, Ismeretlen: 0 | Kapcsolat | |
Hagyományos kínai_SM_48 | Hagyományos kínai | Hagyományos kínai | zh-TW | 48 kHz | Írásos monológ | 1,028 | Hagyományos kínai | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1069 Férfi 262 Ismeretlen 3 | Kapcsolat | |
Kínai egyszerűsített_SM_48 | Egyszerűsített kínai | Egyszerűsített kínai | zh-CN | 48 kHz | Írásos monológ | 2,762 | Egyszerűsített kínai | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1920 Férfi 1535 Ismeretlen 270 | Kapcsolat | |
kínai_MA_16 | Kínai angol | Kínai angol | hu | 16 kHz | Media Audio | 249 | Kínai média hangadatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 126, Férfi: 346 és Ismeretlen: 6 | Kapcsolat | |
kínai_CC_8 | Kínai angol | Kínai angol | hu | 8 kHz | Hívóközpont | 169 | Kínai Call-center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 1790, Férfi: 523 és Ismeretlen: 13 | Kapcsolat | |
Kanadai_SM_48 | Kanadai francia | Kanadai francia | fr-CA | 48 kHz | Írásos monológ | 1,222 | Kanadai francia | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 974 Férfi 631 Ismeretlen 1 | Kapcsolat | |
Boston_MA_16 | Boston angol | Boston angol | hu | 16 kHz | Media Audio | 93 | Boston Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 43, Férfi: 181 és Ismeretlen: 2 | Kapcsolat | |
Boston_GC_8 | Boston angol | Boston angol | hu | 8 kHz | Általános beszélgetés | 32 | Boston általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 53, Férfi: 83 és Ismeretlen: 0 | Kapcsolat | |
Angol Deep South_GC_8 | Angol mély dél | Angol mély dél | hu | 8 kHz | Általános beszélgetés | 56 | Angol Deep South Általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 99, Férfi 31, Ismeretlen 0 | Kapcsolat | |
Bengali_MA | bengáli | bengáli (csővezetékben) | bn_IN | Media Audio | 40 | Bengáli (In Pipeline) Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Bengali_GC | bengáli | bengáli (csővezetékben) | bn_IN | Általános beszélgetés | 100 | Bengáli (In Pipeline) Általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Bengali_CC_8 | bengáli | bengáli (csővezetékben) | bn_IN | Hívóközpont | 60 | Bengáli (In Pipeline) Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
asszámi_MA | Asszámi | asszámi (folyamatban) | mint a | Media Audio | 40 | Assamese (In Pipeline) Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Assamese_GC | Asszámi | asszámi (folyamatban) | mint a | Általános beszélgetés | 100 | asszámi (In Pipeline) Általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
asszámi_CC_8 | Asszámi | asszámi (folyamatban) | mint a | Hívóközpont | 60 | Assamese (In Pipeline) Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Arab_SM_48 | arab | arab | ar-SA | 48 kHz | Írásos monológ | 1,947 | Arab írásos monológ | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 838 Férfi 1209 Ismeretlen 78 | Kapcsolat | |
Arab_GC_8 | arab | arab | ar_AE | 8 kHz | Általános beszélgetés | 292 | Arab Általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, arab az Öböl menti országokból | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 171, Férfi: 534 és Ismeretlen: 1 | Kapcsolat | |
afrikaans_MA_16 | Afrikaans | Afrikaans | af_ZA | 16 kHz | Media Audio | 658 | Afrikaans médiafájlok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 750, Férfi: 1278 és Ismeretlen: 52 | Kapcsolat | |
afrikaans_GC_8 | Afrikaans | Afrikaans | af_ZA | 8 kHz | Általános beszélgetés | 368 | Afrikaans Általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, Afrikában beszélt afrikaans | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 502, Férfi: 390 és Ismeretlen: 2 | Kapcsolat | |
hu_US_MA_16 | Afro-amerikai népnyelv | Afro-amerikai népnyelv | hu | 16 kHz | Media Audio | 154 | Afro-amerikai népnyelvi médiaadatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 151, Férfi: 150 és Ismeretlen: 10 | Kapcsolat | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Media Audio | 216 | MAGYAR Média audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 75, Férfi 380, Ismeretlen 0 | Kapcsolat | |
koreai_MA_16 | koreai | koreai | ko_KR | 16 kHz | Media Audio | 204 | Koreai média hangadatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 70 Férfi 303, Ismeretlen 25 | Kapcsolat | |
Koreai_CC_8 | koreai | koreai | ko_KR | 8 kHz | Hívóközpont | 107 | Koreai Call-center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1086, Férfi 210 , Ismeretlen 4 | Kapcsolat | |
kannada_MA | kannada | kannada (In Pipeline) | kn_IN | Media Audio | 40 | Kannada (In Pipeline) Média audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Kannada_GC | kannada | kannada (In Pipeline) | kn_IN | Általános beszélgetés | 100 | Kannada (In Pipeline) Általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
kannada_CC_8 | kannada | kannada (In Pipeline) | kn_IN | Hívóközpont | 60 | Kannada (In Pipeline) Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Japanese_SM_48 | japán | japán | ja-JP | 48 kHz | Írásos monológ | 2,335 | Japán forgatókönyvű monológ | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1460 Férfi 1221 Ismeretlen 194 | Kapcsolat | |
Ír_GC_8 | ír | ír | hu_IE | 8 kHz | Általános beszélgetés | 192 | Ír általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 213 , Férfi 153 , Ismeretlen 0 | Kapcsolat | |
indonéz_MA_16 | indonéz | indonéz | én csináltam | 16 kHz | Media Audio | 643 | Indonéz média hangadatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 746, Férfi 1507, Ismeretlen 129 | Kapcsolat | |
Indonéz_GC_8 | indonéz | indonéz | én csináltam | 8 kHz | Általános beszélgetés | 496 | Indonéz általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, indonéz nyelv | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 524, Férfi 454, Ismeretlen 2 | Kapcsolat | |
spanyol_MA_16 | spanyol angol | spanyol angol | hu | 16 kHz | Media Audio | 155 | Spanyol Call Media hang | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 140, Férfi 219, Ismeretlen 5 | Kapcsolat | |
Hispanic_CC_8 | spanyol angol | spanyol angol | hu | 8 kHz | Hívóközpont | 212 | Spanyol Call-center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 822, Férfi 1262, Ismeretlen 0 | Kapcsolat | |
hu_US_CC_8 | Afro-amerikai népnyelv | Afro-amerikai népnyelv | hu | 8 kHz | Hívóközpont | 211 | Afro-amerikai népnyelvű Call-center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő: 612, Férfi: 1242 és Ismeretlen: 12 | Kapcsolat | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Hívóközpont | 208 | MAGYAR Call-center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 822, Férfi 1262 , Ismeretlen 0 | Kapcsolat | |
Hindi_SM_48 | hindi | hindi | hi-IN | 48 kHz | Írásos monológ | 2,867 | Hindi scripted monológ | Egyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek | Monó | Mobile App | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 1977 Férfi 1864 Ismeretlen 147 | Kapcsolat | |
hindi_MA_16 | hindi | hindi | szia_IN | 16 kHz | Media Audio | 219 | Hindi Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 83 , Férfi 309, Ismeretlen 0 | Kapcsolat | |
Héber_MA_16 | héber | héber | ő_IL | 16 kHz | Media Audio | 427 | Héber média hangadatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 361 , Férfi 513, Ismeretlen 13 | Kapcsolat | |
Héber_Általános beszélgetés_8 | héber | héber | ő_IL | 8 kHz | Általános beszélgetés | 399 | Héber általános beszélgetési adatok | Írás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, héber Izraelben | Kettős | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 414 , Férfi 399 , Ismeretlen 1 | Kapcsolat | |
gudzsaráti_MA | gudzsaráti | gudzsaráti (csővezetékben) | gu_IN | Media Audio | 40 | Gudzsaráti (In Pipeline) Media audio adatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
Gujarati_GC | gudzsaráti | gudzsaráti (csővezetékben) | gu_IN | Általános beszélgetés | 100 | Gudzsaráti (In Pipeline) Általános beszélgetési adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
gudzsaráti_CC_8 | gudzsaráti | gudzsaráti (csővezetékben) | gu_IN | Hívóközpont | 60 | Gudzsaráti (In Pipeline) Call-Center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | asztali | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Kapcsolat | ||||
német_IVR_8 | Német | Német | de-De | 8 kHz | IVR | 200 | Német IVR adatok | Embertől Gépig. IVR típusú áramlás, ahol van egy TTS üzenet (pl. "Hogyan segíthetek"), amelyet spontán emberi válasz követ. | Monó | asztali | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 10115 Férfi 8750 Ismeretlen 0 | Kapcsolat | ||
német_CC_8 | Német | Német | de-De | 8 kHz | Hívóközpont | 64 | Német Call-center adatok | Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, | Monó | asztali | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 478 Férfi 1440 Ismeretlen 0 | Kapcsolat | ||
Angol Mély Dél_MA_16 | Angol mély dél | Angol mély dél | hu | 16 kHz | Media Audio | 266 | Angol Deep South Media hangadatok | Licencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 perc | Monó | Webes beszerzés | 5.0 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Nő 204, Férfi 356, Ismeretlen 21 | Kapcsolat |
Szolgáltatások
A szakértő audio adatgyűjtés nem minden kéznél van az átfogó AI beállításokhoz. A Shaipnél a következő szolgáltatásokat is figyelembe veheti, hogy a szokásosnál szélesebb körben elterjessze a modelleket:
Szöveges adatgyűjtés
Szolgáltatások
A Shaip kognitív adatgyűjtési szolgáltatások valódi értéke abban rejlik, hogy kulcsot ad a szervezeteknek a strukturálatlan adatokban található kritikus információk feloldásához
Képes adatgyűjtési szolgáltatások
Győződjön meg arról, hogy a számítógépes látásmodell minden képet pontosan azonosít, hogy zökkenőmentesen képezze a jövő új generációs AI modelljeit
Video adatgyűjtési szolgáltatások
Most összpontosítson a számítógépes látásra az NLP -vel együtt, hogy a modelljeit tökéletesen megtanítsa tárgyak, egyének, elrettentők és egyéb vizuális elemek azonosítására
Ajánlott források
Felajánlás
Hangjegyzet az intelligens AI -k számára
A hangjegyzetek szolgáltatása a kezdetek óta a Shaip erőssége. Fejlesszen, képezzen és tökéletesítsen társalgási mesterséges intelligenciát, chatbotokat és beszédfelismerő motorokat a legmodernebb hangjegyzet-szolgáltatásainkkal.
Vásárlói útmutató
Vevői útmutató: Teljes útmutató a társalgási AI-hoz
A chatbot, amellyel beszélgetett, egy fejlett társalgási mesterséges intelligencia rendszeren fut, amelyet rengeteg beszédfelismerő adatkészlet felhasználásával képeztek ki, teszteltek és építettek fel.
Adatkatalógus
Készen kapható beszédadatok katalógusa és engedélyezése
A mesterséges intelligencia-projektekben sokféle általános alkalmazás létezik a beszédadatokhoz. Hatalmas mennyiségű kiváló minőségű adatot kínálunk a hangfelismeréshez.
Szeretné felépíteni saját hangadatkészletét?
Lépjen kapcsolatba házon belüli beszédadatgyűjtési szakértőnkkel, és állítsa be az Ön igényeinek leginkább megfelelő hangtárat
Gyakran feltett kérdések (GYIK)
A beszédadatgyűjtés egy ML-modellhez a beszélt nyelv hangfelvételeinek gyűjtésének folyamatára utal. Ez a gyűjtemény segít a gépi tanulási algoritmusok betanításában és finomításában, különösen azokban, amelyek az emberi hangok megértésére és feldolgozására összpontosítanak.
Amikor az automatikus beszédfelismerés (ASR) számára kíván hangadatokat gyűjteni, először meg kell határoznia a projekt konkrét igényeit, beleértve a kívánt nyelvet, akcentust és beszédtípust. A paraméterek beállítása után győződjön meg arról, hogy megszerezte az összes szükséges engedélyt a felhasználói adatok védelméhez. Ezután használjon megfelelő rögzítőeszközt vagy szoftvert a tiszta hangminták rögzítéséhez. Minden felvételt gondosan meg kell jelölni az átiratával vagy más vonatkozó metaadatokkal, és szisztematikusan tárolni kell a könnyű hozzáférés érdekében.
A beszédadatkészlet a gépi tanulásban kulcsfontosságú a beszélt nyelv felismerésére, átírására vagy értelmezésére szabott modellek betanításában, tesztelésében és érvényesítésében. Az ilyen adatkészletek számtalan alkalmazás előtt nyitják meg az utat, a hangasszisztensektől és az átírási szolgáltatásoktól a hangbiometrikus adatokig.
A különböző nyelvekről és akcentusokról származó pontos adatok gyűjtéséhez elengedhetetlen a kívánt nyelvi háttérrel rendelkező anyanyelvi beszélőkkel való együttműködés. Törekedjen változatos és reprezentatív mintára, amely a demográfiai árnyalatok széles spektrumát fedi le. Használjon szabványos felvevőberendezést egységes környezetben, hogy biztosítsa a hang egységességét. És ami nagyon fontos, minden adatrészletet jelöljön meg részletes átírással és metaadatokkal, jelezve az adott nyelvet és akcentust.