A legmegbízhatóbb beszédadatgyűjtési szolgáltatások az Ön mesterséges intelligenciájához

Tanítsa NLP -modelljeit, VA -jait, TTS -prototípusait és egyebeket minőségi beszélgetési adatokkal audio- és beszédadat -gyűjtési szolgáltatásaink segítségével

Audio adatgyűjtés

Fedezze fel az audio adatfolyamokat szűk keresztmetszetek nélkül

Kiemelt ügyfelek

Professzionális audio/hang adatgyűjtési szolgáltatások

Bármely tárgy. Bármely forgatókönyv.

A Shaipnél szakértelmünk abban rejlik, hogy kiváló minőségű beszédadatkészleteket hozzon létre, amelyeket különféle AI/ML követelményekhez terveztek. Nyelvek és rekordok széles választékát kínáljuk különféle beállításokkal, így adatkészleteink átfogóak és adaptálhatók. Oa hangsúly a legnagyobb mennyiségű egyéni beszédadatot tartalmazó modelleken van a lehető legrövidebb idő alatt. Velünk a fedélzeten a következőkre számíthatsz: 

Beszédgyűjtemény
  • Kiváló minőségű többnyelvű hang-/hangadatok a pontosság javítása érdekében
  • A lehető legmagasabb szintű tartományspecifitás a target változatos forgatókönyv felépítés
  •  Méretezze ML-modelljét, hogy megfeleljen a különböző demográfiai adatoknak és ágazatoknak
  • Felvételi környezetek: Stúdió minőség, kristálytiszta hanggal minimális háttérzajjal, és Természeti környezetek, ahol a felvételek környezeti hangokat tartalmaznak, hogy utánozzák a valós helyzeteket.

100 +

Érintett országok

55 ezer +

Beszédórák adatai

250 +

projektek

60 +

Nyelvek (100+ dialektus)

8 / 16 / 44 / 48 kHz

Mintavételi sebesség

Szakértelem

Igazítsa a hangadatokat a következőhöz: az intelligensebb NLP-modellekhez

A Shaip teljes körű beszéd-/hangadat-gyűjtési szolgáltatásokat kínál több mint 100 nyelven, hogy lehetővé tegye a hangtechnológiák használatát a világ különböző tájainak közönsége számára. Bármilyen kiterjedésű és méretű projekteken dolgozhatunk; a meglévő polcról származó audio adathalmazok engedélyezésétől az egyéni audio adatgyűjtés kezeléséig, a hangátírástól és a megjegyzésektől. Függetlenül attól, hogy milyen nagy a beszédadat-gyűjtési projektje, testre szabhatjuk a hanggyűjtési szolgáltatásokat az Ön igényeinek megfelelően, hogy kiváló minőségű, nyelvjárásokat, hangokat és nyelveket célzó NLP-adatkészleteket hozzunk létre. Válasszon a beszédadat-készletek és az audio-adatgyűjtési erőforrások széles választékából, a hangot lehetővé tevő intelligens beállításokhoz.

Monológ beszéd

Monológ Beszéd Gyűjtemény

Az egyetlen hangszóróból származó beszéd feldolgozására összpontosít. Használjon parancsfájllal ellátott promptokat az egycsatornás hangfájlokba való betáplálásához, biztosítva az adott személyre jellemző egyedi beszédminták, hangok és árnyalatok rögzítését.

Párbeszéd beszéd

Párbeszéd beszéd
Gyűjtemény

Kétszemélyes interakció, valós beszélgetések és párbeszédek replikálása többnyelvű megjelenítéssel kétcsatornás fájlok és átírt források segítségével.

Többpárti beszélgetések

Csoport / Muti-party
beszélgetések

Többszemélyes beszélgetések, csoportdinamika, átfedések és változatos hangnemek rögzítése a beszédmodellek pontos képzése érdekében.

Természetes nyelvi megnyilatkozás

Természetes nyelvű beszédgyűjtemény

Tanítsd meg az AI-kat, hogy azonosítsák a hasonló jelentésű kifejezéseket vagy ébresszen szavakat változatos, gazdag és hiteles megnyilatkozások segítségével a fejlett természetes nyelvi feldolgozás és megértés érdekében.

Akusztikus beszéd

Akusztikus adatok
Gyűjtemény

Professzionálisan tudunk stúdióminőségű hangadatokat rögzíteni, legyen szó éttermekről, irodákról, otthonokról vagy különféle környezetekről és nyelvekről, miközben szélesebb akusztikus tartományt lefed (Átfogó hangadatkészletek).

Automatikus beszédfelismerés

Automatikus beszédfelismerés (ASR)

Növelje automatikus beszédfelismerő (ASR) rendszereinek pontosságát azáltal, hogy hozzáférést biztosít a legmodernebb, változatos beszéd-/audio-adatkészletekhez a demográfiai adatok széles skálájából.

Természetes nyelvi megnyilatkozás

Többnyelvű beszéd/audio képzési adatok

Szakképzett nyelvi szakembereink világszerte többnyelvű hang-/beszédadatokat kínálnak különböző nyelveken és dialektusokban. Ez az erőfeszítés elősegíti a globális kommunikációt és áthidalja a nyelvi akadályokat, hozzájárulva a befogadóbb és hatékonyabb AI-megoldásokhoz.

Digitális virtuális asszisztensek

Text-to-Speech
(TTS)

Készítsen szövegfelolvasó (TTS) többnyelvű modellt globális munkaerőnk segítségével, akik több mint 150 nyelven és dialektusban segítenek beszédadatokat gyűjteni, hogy az autóba épített vezérlőktől a chatbotokig és a tanulási megoldásokig magas színvonalú tanulási megoldásokat fejleszthessenek mesterségesintelligencia-modelljeihez. minőségi audio adatok.

Call center felvételek

Call Center
felvételek

Valódi csereügynökök és ügyfelek között, számos nyelv támogatásával, például spanyol, német, amerikai angol, bengáli, japán, kínai és hindi.

Sikertörténetek

Társalgó AI-adatkészletek több mint 3 órányi adattal 8 nyelven

Az indiai nyelvek többnyelvű platformjának kiépítése érdekében az ügyfél a Shaip-pel együttműködve nagy adatkészleteket gyűjt, szegmentál és ír át több indiai nyelven. Ez segítene hatékony beszédmodellek kifejlesztésében, amelyek az ügyfél innovatív új platformját erősíthetik.

Probléma: Több mint 3,000 órányi hangadat gyűjtött 8 indiai nyelven, szegmentálva és átírva az automatikus beszédfelismerés fejlesztése érdekében.

Megoldás: Adatgyűjtést, szegmentálást, átírást biztosítottunk, és JSON-fájlokat szállítottunk metaadatokkal. 3000 órányi hangadatot gyűjtöttünk össze 8 indiai nyelven az ügyfél beszédtechnológiai projektjéhez.

Beszédadatgyűjtési esettanulmány

Az okok, amelyek miatt Shaipet választotta megbízható beszédadat -gyűjtő partnereként

Emberek (People)

Emberek (People)

Dedikált és kiképzett csapatok:

  • Több mint 30,000 munkatárs az adatok létrehozásához, címkézéséhez és minőségbiztosításához
  • Hitelesített projektmenedzsment csapat
  • Tapasztalt termékfejlesztő csapat
  • Tehetséggondozási és beszállítói csapat
folyamat

folyamat

A legnagyobb hatékonyságot az alábbiak biztosítják:

  • Robusztus 6 Sigma Stage-Gate folyamat
  • 6 Sigma fekete övből álló elkötelezett csapat - A legfontosabb folyamattulajdonosok és a minőségi megfelelés
  • Folyamatos fejlesztés és visszacsatolási hurok
Emelvény

Emelvény

A szabadalmaztatott platform előnyöket kínál:

  • Webalapú végpontok közötti platform
  • Kifogástalan minőség
  • Gyorsabb TAT
  • Zökkenőmentes szállítás

Beszéd/audio adatkészletek

RészletekNyelvi adatkészletMintavételi rátaAdatkészlet típusaÖsszes audio óraRövid leírásAdatkészlet leírásaHangcsatornaFelvételi platformMI VAGYUNK (%)Audió FormátumÁtírási formátumHasználja az ügyetHangszórók számaCTA
Beszédhu_US_CC_8Afro-amerikai népnyelvAfro-amerikai népnyelvhu8 kHzHívóközpont211Afro-amerikai népnyelvű Call-center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 612, Férfi: 1242 és Ismeretlen: 12
Beszédhu_US_MA_16Afro-amerikai népnyelvAfro-amerikai népnyelvhu16 kHzMedia Audio154Afro-amerikai népnyelvi médiaadatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 151, Férfi: 150 és Ismeretlen: 10
Beszédafrikaans_GC_8AfrikaansAfrikaansaf_ZA8 kHzÁltalános beszélgetés368Afrikaans Általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, Afrikában beszélt afrikaansKettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 502, Férfi: 390 és Ismeretlen: 2
Beszédafrikaans_MA_16AfrikaansAfrikaansaf_ZA16 kHzMedia Audio658Afrikaans médiafájlokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 750, Férfi: 1278 és Ismeretlen: 52
BeszédArab_GC_8arabarabar_AE8 kHzÁltalános beszélgetés292Arab Általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, arab az Öböl menti országokbólKettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 171, Férfi: 534 és Ismeretlen: 1
BeszédArab_SM_48arabarabar-SA48 kHzÍrásos monológ1,947Arab írásos monológEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 838 Férfi 1209 Ismeretlen 78
Beszédasszámi_CC_8Asszámiasszámi (folyamatban) mint aHívóközpont60Assamese (In Pipeline) Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédAssamese_GCAsszámiasszámi (folyamatban) mint aÁltalános beszélgetés100asszámi (In Pipeline) Általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
Beszédasszámi_MAAsszámiasszámi (folyamatban) mint aMedia Audio40Assamese (In Pipeline) Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédBengali_CC_8bengálibengáli (csővezetékben) bn_INHívóközpont60Bengáli (In Pipeline) Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédBengali_GCbengálibengáli (csővezetékben) bn_INÁltalános beszélgetés100Bengáli (In Pipeline) Általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédBengali_MAbengálibengáli (csővezetékben) bn_INMedia Audio40Bengáli (In Pipeline) Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédBoston_CC_8Boston angolBoston angolhu8 kHzHívóközpont177Boston Call-center adataiÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 605, Férfi: 711 és Ismeretlen: 0
BeszédBoston_GC_8Boston angolBoston angolhu8 kHzÁltalános beszélgetés32Boston általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 53, Férfi: 83 és Ismeretlen: 0
BeszédBoston_MA_16Boston angolBoston angolhu16 kHzMedia Audio93Boston Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 43, Férfi: 181 és Ismeretlen: 2
BeszédKanadai_SM_48Kanadai franciaKanadai franciafr-CA48 kHzÍrásos monológ1,222Kanadai franciaEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 974 Férfi 631 Ismeretlen 1
Beszédkínai_CC_8Kínai angolKínai angolhu8 kHzHívóközpont169Kínai Call-center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 1790, Férfi: 523 és Ismeretlen: 13
Beszédkínai_MA_16Kínai angolKínai angolhu16 kHzMedia Audio249Kínai média hangadatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 126, Férfi: 346 és Ismeretlen: 6
BeszédKínai egyszerűsített_SM_48Egyszerűsített kínaiEgyszerűsített kínaizh-CN48 kHzÍrásos monológ2,762Egyszerűsített kínaiEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1920 Férfi 1535 Ismeretlen 270
BeszédHagyományos kínai_SM_48Hagyományos kínaiHagyományos kínaizh-TW48 kHzÍrásos monológ1,028Hagyományos kínaiEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1069 Férfi 262 Ismeretlen 3
BeszédDanish_GC_8dándánda_DK8 kHzÁltalános beszélgetés372Dán általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 311, Férfi: 417, Ismeretlen: 0
Beszéddán_MA_16dándánda_DK16 kHzMedia Audio664Danish Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő: 369, Férfi: 864, Ismeretlen: 27
BeszédDanish_SM_48dándánda-DK48 kHzÍrásos monológ2,579Dán forgatókönyvű monológEgyetlen hangú felvételek, amelyek általában az 5-30 másodperces tartományba esnek, dán DániábólMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1551 Férfi 1233 Ismeretlen 42
Beszédangol Deep South_CC_8Angol mély délAngol mély délhu8 kHzHívóközpont151Angol Deep South Call-center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 221 , Férfi 1004 , Ismeretlen 7
BeszédAngol Deep South_GC_8Angol mély délAngol mély délhu8 kHzÁltalános beszélgetés56Angol Deep South Általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 99, Férfi 31, Ismeretlen 0
BeszédAngol Mély Dél_MA_16Angol mély délAngol mély délhu16 kHzMedia Audio266Angol Deep South Media hangadatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 204, Férfi 356, Ismeretlen 21
Beszédnémet_CC_8NémetNémetde-De8 kHzHívóközpont64Német Call-center adatok Írás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Monóasztali. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 478 Férfi 1440 Ismeretlen 0
Beszédnémet_IVR_8NémetNémetde-De8 kHz IVR200Német IVR adatokEmbertől Gépig. IVR típusú áramlás, ahol van egy TTS üzenet (pl. "Hogyan segíthetek"), amelyet spontán emberi válasz követ.Monóasztali. Wav .jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés Nő 10115 Férfi 8750 Ismeretlen 0
Beszédgudzsaráti_CC_8gudzsarátigudzsaráti (csővezetékben) gu_INHívóközpont60Gudzsaráti (In Pipeline) Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédGujarati_GCgudzsarátigudzsaráti (csővezetékben) gu_INÁltalános beszélgetés100Gudzsaráti (In Pipeline) Általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
Beszédgudzsaráti_MAgudzsarátigudzsaráti (csővezetékben) gu_INMedia Audio40Gudzsaráti (In Pipeline) Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédHéber_Általános beszélgetés_8héberhéberő_IL8 kHzÁltalános beszélgetés399Héber általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, héber IzraelbenKettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 414 , Férfi 399 , Ismeretlen 1
BeszédHéber_MA_16héberhéberő_IL16 kHzMedia Audio427Héber média hangadatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 361 , Férfi 513, Ismeretlen 13
Beszédhindi_MA_16hindihindiszia_IN16 kHzMedia Audio219Hindi Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 83 , Férfi 309, Ismeretlen 0
BeszédHindi_SM_48hindihindihi-IN48 kHzÍrásos monológ2,867Hindi scripted monológEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1977 Férfi 1864 Ismeretlen 147
BeszédHINGLISH_CC_8HinglishHinglishhg_IN8 kHzHívóközpont208MAGYAR Call-center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 822, Férfi 1262 , Ismeretlen 0
BeszédHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedia Audio216MAGYAR Média audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 75, Férfi 380, Ismeretlen 0
BeszédHispanic_CC_8spanyol angolspanyol angolhu8 kHzHívóközpont212Spanyol Call-center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 822, Férfi 1262, Ismeretlen 0
Beszédspanyol_MA_16spanyol angolspanyol angolhu16 kHzMedia Audio155Spanyol Call Media hangLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 140, Férfi 219, Ismeretlen 5
BeszédIndonéz_GC_8indonézindonézén csináltam8 kHzÁltalános beszélgetés496Indonéz általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, indonéz nyelvKettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 524, Férfi 454, Ismeretlen 2
Beszédindonéz_MA_16indonézindonézén csináltam16 kHzMedia Audio643Indonéz média hangadatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 746, Férfi 1507, Ismeretlen 129
BeszédÍr_GC_8írírhu_IE8 kHzÁltalános beszélgetés192Ír általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 213 , Férfi 153 , Ismeretlen 0
BeszédJapanese_SM_48japánjapánja-JP48 kHzÍrásos monológ2,335Japán forgatókönyvű monológEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1460 Férfi 1221 Ismeretlen 194
Beszédkannada_CC_8kannadakannada (In Pipeline) kn_INHívóközpont60Kannada (In Pipeline) Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédKannada_GCkannadakannada (In Pipeline) kn_INÁltalános beszélgetés100Kannada (In Pipeline) Általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
Beszédkannada_MAkannadakannada (In Pipeline) kn_INMedia Audio40Kannada (In Pipeline) Média audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédKoreai_CC_8koreaikoreaiko_KR8 kHzHívóközpont107Koreai Call-center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1086, Férfi 210 , Ismeretlen 4
Beszédkoreai_MA_16koreaikoreaiko_KR16 kHzMedia Audio204Koreai média hangadatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 70 Férfi 303, Ismeretlen 25
BeszédKoreai_SM_48koreaikoreaiko-KR48 kHzÍrásos monológ1,955Koreai forgatókönyvű monológEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1195 Férfi 1134 Ismeretlen 122
Beszédmaláj_GC_8malájmalájms_MY8 kHzÁltalános beszélgetés266Maláj általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, maláj MalajziábanKettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 316, Férfi 176 , Ismeretlen 0
Beszédmaláj_MA_16malájmalájms_MY16 kHzMedia Audio344Malay Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 236, Férfi 626, Ismeretlen 47
BeszédMalayalam_CC_8MalayalamMalayalam (csővezetékben) ml_INHívóközpont60Malayalam (In Pipeline) Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédMalayalam_GCMalayalamMalayalam (csővezetékben) ml_INÁltalános beszélgetés100Malayalam (In Pipeline) Általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédMalayalam_MAMalayalamMalayalam (csővezetékben) ml_INMedia Audio40Malayalam (In Pipeline) Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédMarathi_CC_8marathimarathi (csővezetékben) mr_INHívóközpont60Marathi (In Pipeline) Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédMarathi_GCmarathimarathi (csővezetékben) mr_INÁltalános beszélgetés100Marathi (In Pipeline) Általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédMarathi_MAmarathimarathi (csővezetékben) mr_INMedia Audio40Marathi (In Pipeline) Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédMexican_SM_48Spanyol (Mexikó)Spanyol (Mexikó)es-MX48 kHzÍrásos monológ1,492Mexikói spanyol forgatókönyvű monológEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1016 Férfi 1069 Ismeretlen 95
BeszédHollandia_SM_48HollandHollandnl-NL48 kHzÍrásos monológ1,205Holland forgatókönyvű monológEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1285 Férfi 531 Ismeretlen 3
BeszédNew York angol_CC_8New York angolNew York angolhu8 kHzHívóközpont103New York-i angol Call-center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 610, Férfi 532, Ismeretlen 0
BeszédNew York-i angol_GC_8New York angolNew York angolhu8 kHzÁltalános beszélgetés107New York-i angol általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 118, Férfi 114, Ismeretlen 0
BeszédNew York angol_MA_16New York angolNew York angolhu16 kHzMedia Audio140New York-i angol média hangadatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 66, Férfi 230, Ismeretlen 11
BeszédÚj-Zéland_GC_8Új-Zéland angol Új-Zéland angol hu_NZ8 kHzÁltalános beszélgetés148Új-zélandi angol általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 167, férfi 121, Ismeretlen 4
BeszédÚj-Zéland_MA_16Új-Zéland angol Új-Zéland angol hu_NZ16 kHzMedia Audio400Új-zélandi angol média hangLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 367, férfi 678, Ismeretlen 26
BeszédOriya_CC_8oriyaOriya (Csővezetékben) vagy_INHívóközpont60Oriya (In Pipeline) Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédOriya_GCoriyaOriya (Csővezetékben) vagy_INÁltalános beszélgetés100Oriya (In Pipeline) Általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédOriya_MAoriyaOriya (Csővezetékben) vagy_INMedia Audio40Oriya (In Pipeline) Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
Beszédlengyel_MA_16lengyellengyelhu_PL16 kHzMedia Audio269Lengyel média hangLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 173 Férfi 354 Ismeretlen 6
Beszédlengyel Lengyelország_SM_48Lengyel (Lengyelország)Lengyel (Lengyelország)pl-PL48 kHzÍrásos monológ1,482Lengyel Lengyelország – forgatókönyves monológEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1324 Férfi 701 Ismeretlen 24
Beszédpandzsábi_CC_8pandzsábipandzsábi (csővezetékben) pandzsábiHívóközpont60pandzsábi (In Pipeline) Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédPunjabi_GCpandzsábipandzsábi (csővezetékben) pandzsábiÁltalános beszélgetés100pandzsábi (In Pipeline) Általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
Beszédpandzsábi_MApandzsábipandzsábi (csővezetékben) pandzsábi Media Audio40pandzsábi (In Pipeline) Média audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédRussian_SM_48oroszoroszru-RU48 kHzÍrásos monológ2,398Orosz forgatókönyvű monológEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1689 Férfi 1937 Ismeretlen 214
BeszédSkót_GC_8skót (angol akcentussal)skót (angol akcentussal)hu_AB8 kHzÁltalános beszélgetés292A skót általános beszélgetés adataiÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 285 , Férfi 260, Ismeretlen 3
BeszédSingapore_CC_8Szingapúr angolSzingapúr angolhu_SG8 kHzHívóközpont218Szingapúri Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 2139 , Férfi 884, Ismeretlen 21
BeszédSzingapúr_MA_16Szingapúr angolSzingapúr angolhu_SG16 kHzMedia Audio247Singapore Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 160, Férfi 455, Ismeretlen 37
Beszéddél-afrikai angol_CC_8Dél-afrikai angolDél-afrikai angolhu_ZA8 kHzHívóközpont261Dél-afrikai angol Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1274 , Férfi 935 , Ismeretlen 1
Beszéddél-afrikai angol_MA_16Dél-afrikai angolDél-afrikai angolhu_ZA16 kHzMedia Audio251Dél-afrikai angol média hangadatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 235, Férfi 432, Ismeretlen 36
Beszédszuahéli_CC_8szuahéliszuahélisw_KE8 kHzHívóközpont230Szuahéli Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 611, Férfi 833, Ismeretlen 0
Beszédszuahéli_MA_16szuahéliszuahélisw_KE16 kHzMedia Audio265Szuahéli Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 118, Férfi 493, Ismeretlen 25
BeszédSwedish_CC_8svédsvédsv_SE8 kHzHívóközpont250Svéd Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1581, férfi 727, Ismeretlen 2
Beszédsvéd_MA_16svédsvédsv_SE16 kHzMedia Audio278Svéd média hangadatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 195, férfi 500, Ismeretlen 21
BeszédTamil_CC_8tamiltamil (csővezetékben) ta_INHívóközpont60Tamil (In Pipeline) Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédTamil_GCtamiltamil (csővezetékben) ta_INÁltalános beszélgetés100Tamil (In Pipeline) Általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
Beszédtamil_MAtamil tamil (csővezetékben) ta_INMedia Audio40Tamil (In Pipeline) Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédTelugu_GC_8telugutelugute_IN8 kHzÁltalános beszélgetés553Telugu általános beszélgetési adatokÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 574 , Férfi 564, Ismeretlen 0
Beszédtelugu_MA_16telugutelugute_IN16 kHzMedia Audio648Telugu Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 207, Férfi 963, Ismeretlen 2
BeszédTelugu_CC_8telugutelugu (folyamatban) te_INHívóközpont30Telugu (In Pipeline) Call-Center adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédTelugu_GCtelugutelugu (folyamatban) te_INÁltalános beszélgetés50Telugu (In Pipeline) Általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,asztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
Beszédtelugu_MAtelugutelugu (folyamatban) te_INMedia Audio20Telugu (In Pipeline) Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés
BeszédThai_GC_8thaithaith_TH8 kHzÁltalános beszélgetés183Thai általános beszélgetésÍrás nélküli telefonbeszélgetés két ember között. kb. Hang időtartama (tartomány) - 15-60 perc, barátok között használt informális nyilvántartásKettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 338, Férfi 96, Ismeretlen 8
BeszédThai_MA_8thaithaith_TH16 kHzMedia Audio173Thai Media audioLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 143, Férfi 502, Ismeretlen 26
BeszédTurkish Turkey_SM_48Török TörökországTörök Törökországtr-TR48 kHzÍrásos monológ2,027Török TörökországEgyhangú felvételek, amelyek általában az 5-30 másodperces tartományba esnekMonóMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 1561 Férfi 1241 Ismeretlen 31
Beszédvietnami_GC_8vietnamivietnamivi_VN8 kHzÁltalános beszélgetés295Vietnami általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc, északi (pl. Hanoi), középső és déli (pl. Ho Si Minh-város).Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 400, férfi 380, Ismeretlenek 2
Beszédvietnami_MA_16vietnamivietnamivi_VN16 kHzMedia Audio257Vietnami Media audio adatokLicencképes köztulajdonban lévő audio/video fájlok, például interjúk, podcastok stb. – 1-5 fő. kb. Hang időtartama (tartomány) 15-60 percMonóWebes beszerzés5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 249, férfi 200, Ismeretlenek 45
BeszédWelsh_GC_8walesi (angol akcentus)walesi (angol akcentus)hu_WL8 kHzÁltalános beszélgetés278Walesi általános beszélgetési adatokÍrás nélküli, szintetikus telefonbeszélgetés „ügynök” és „ügyfél” között, kb. Hang időtartama (tartomány) 5-15 perc,Kettősasztali5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNő 270, Férfi 324, Ismeretlen 0
BeszédEgyesült Királyság angol_WW_16Angol angolAngol angolhu_uk16 kHzWake Word200 hangszórókWake Word brit angolkulcskifejezések adatgyűjtés
  • 200 hangszórók
  • 4 egyedi kulcskifejezés hangszórónként
  • 25-30 ismételt kulcskifejezés rögzítése egyedi kulcskifejezésenként
  • 25-30 hangfájl egyedi kulcskifejezésenként
  • Összesen 120 rögzített megszólalás beszélőnként
1 csatornaMobile App5.0. Wav.jsonASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezésNem: 50% férfi, 50% nő, +/- 10%.

Szolgáltatások

A szakértő audio adatgyűjtés nem minden kéznél van az átfogó AI beállításokhoz. A Shaipnél a következő szolgáltatásokat is figyelembe veheti, hogy a szokásosnál szélesebb körben elterjessze a modelleket:

Szöveges adatgyűjtés

Szöveges adatgyűjtés
Szolgáltatások

A Shaip kognitív adatgyűjtési szolgáltatások valódi értéke abban rejlik, hogy kulcsot ad a szervezeteknek a strukturálatlan adatokban található kritikus információk feloldásához

Kép adatgyűjtés

Képes adatgyűjtési szolgáltatások

Győződjön meg arról, hogy a számítógépes látásmodell minden képet pontosan azonosít, hogy zökkenőmentesen képezze a jövő új generációs AI modelljeit

Videó adatgyűjtés

Video adatgyűjtési szolgáltatások

Most összpontosítson a számítógépes látásra az NLP -vel együtt, hogy a modelljeit tökéletesen megtanítsa tárgyak, egyének, elrettentők és egyéb vizuális elemek azonosítására

Shaip vegye fel velünk a kapcsolatot

Szeretné felépíteni saját hangadatkészletét?

Lépjen kapcsolatba házon belüli beszédadatgyűjtési szakértőnkkel, és állítsa be az Ön igényeinek leginkább megfelelő hangtárat

  • A regisztrációval egyetértek Shaippal Adatkezelési tájékoztató és a Általános Szerződési Feltételek és hozzájárulok a Shaip B2B marketingkommunikációjának fogadásához.

A beszédadatgyűjtés egy ML-modellhez a beszélt nyelv hangfelvételeinek gyűjtésének folyamatára utal. Ez a gyűjtemény segít a gépi tanulási algoritmusok betanításában és finomításában, különösen azokban, amelyek az emberi hangok megértésére és feldolgozására összpontosítanak.

Amikor az automatikus beszédfelismerés (ASR) számára kíván hangadatokat gyűjteni, először meg kell határoznia a projekt konkrét igényeit, beleértve a kívánt nyelvet, akcentust és beszédtípust. A paraméterek beállítása után győződjön meg arról, hogy megszerezte az összes szükséges engedélyt a felhasználói adatok védelméhez. Ezután használjon megfelelő rögzítőeszközt vagy szoftvert a tiszta hangminták rögzítéséhez. Minden felvételt gondosan meg kell jelölni az átiratával vagy más vonatkozó metaadatokkal, és szisztematikusan tárolni kell a könnyű hozzáférés érdekében.

A beszédadatkészlet a gépi tanulásban kulcsfontosságú a beszélt nyelv felismerésére, átírására vagy értelmezésére szabott modellek betanításában, tesztelésében és érvényesítésében. Az ilyen adatkészletek számtalan alkalmazás előtt nyitják meg az utat, a hangasszisztensektől és az átírási szolgáltatásoktól a hangbiometrikus adatokig.

A különböző nyelvekről és akcentusokról származó pontos adatok gyűjtéséhez elengedhetetlen a kívánt nyelvi háttérrel rendelkező anyanyelvi beszélőkkel való együttműködés. Törekedjen változatos és reprezentatív mintára, amely a demográfiai árnyalatok széles spektrumát fedi le. Használjon szabványos felvevőberendezést egységes környezetben, hogy biztosítsa a hang egységességét. És ami nagyon fontos, minden adatrészletet jelöljön meg részletes átírással és metaadatokkal, jelezve az adott nyelvet és akcentust.