Most kap 50% KEDVEZMÉNY* a társalgási AI készenléti adatkészleteken
Beszéd- és hangadatkészlet chatbotokhoz, hangasszisztensekhez, beszéd-kompatibilis eszközökhöz.
*Korlátozott időtartamú ajánlat
Iparági vezetők bíznak benne
Részletek | Kulcsszó | Készen álló nyelvi adatkészlet | Call Center beszélgetések 8 khz* | Általános beszélgetések 8 khz* | Média és podcastok 16 khz* | Megszólalás/ szkriptelt monológ 16 khz* | Teljes mennyiség órában | Dialektusok lefedve | Audió Formátum | Szöveg átírási formátuma | Használja az ügyet | forrás | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Afrikaans | Afrikaans Audio Dataset | 600 | 900 | 1500 | Afrikában beszélt afrikaans | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
arab | Arab audio adatkészlet | 800 | 1500 | 2300 | Arab az Öböl menti országokból | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
kínai | Kínai audio adatkészlet | 2000 | 2000 | Kínai Kínából | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
dán | Dán audio adatkészlet | 400 | 600 | 2000 | 3000 | Dán Dániából | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
Holland | Holland audio adatkészlet | 2000 | 2000 | holland Hollandiából | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
Angol - AAVE Accent | Angol - AAVE (afro-amerikai népnyelvi angol) hangadatkészlet | 500 | 500 | 1000 | A népi változat (néha AAVE néven ismert, jellemzően a munkás- és középosztálybeli afroamerikaiak túlnyomó többsége beszéli) és a standardabb változat (jellemzően a középosztálybeli afroamerikaiak beszélik formális és nyilvános helyzetekben), de erősebb hangsúllyal. a népnyelven. | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
Angol - Boston/New York Accent | Angol - Boston/New York Audio Dataset | 225 | 225 | 350 | 800 | Ez a Boston, New York és Philadelphia városaiban és környékén elhangzó regionális akcentusok gyűjteménye. Ezek az ékezetek hasonlíthatnak a nem helyi ékezetekhez, de különböznek a többi amerikai akcentustól. Annak ellenére, hogy a helyi szókincs eltér az angol nyelvterület más részeitől, ezek az akcentusok kölcsönösen érthetőek a másutt beszélt angollal. | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
Angol - kínai akcentussal | Angol - kínai ékezetes hangadatkészlet | 150 | 300 | 450 | Beszélők, akik első nyelvként beszélik a kínait, és akik tinédzserként/felnőttként az Egyesült Államokba költöztek/kivándoroltak, és második nyelvükként angolul tanultak. | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
Angol - Deep South Accent | Angol - Deep South Audio Dataset | 275 | 275 | 450 | 1000 | Előadók (i) Texasból; ii. Észak-Karolina, Dél-Karolina, Georgia; iii. New Orleans; (iv) floridai panhandle; v. Tennessee, Arkansas, Michigan. | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
Angol - spanyol akcentussal | Angol - spanyol ékezetes hangadatkészlet | 400 | 400 | 800 | A spanyol angol az amerikai angol nyelv azon változataira utal, amelyeket a változatos nemzeti örökséggel rendelkező spanyol amerikaiak beszélnek. A fő hangsúly a mexikói amerikaiakon volt, akik különböző nemzetiségű (pl. Mexikó, Puerto Rico, Dominikai Köztársaság, Ecuador, Kuba stb.) és különböző régiókból (pl. Kalifornia, New York, Florida) származnak. A felszólalók között olyanok is szerepeltek, akik a spanyolt beszélik első nyelvként, valamint a spanyol származású beszélők, akik spanyolul beszélnek, és örökségi nyelvük van. | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
Angol - új-zélandi akcentussal | Angol - Új-Zéland Audio Dataset | 250 | 750 | 1000 | Hangszórók mindkét szigeten, beleértve a fiatalabb (<40 éves) és idősebb (>40 éves) hangszórókat egyenlő arányban. | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
Angol - Szingapúri akcentussal | Angol - Singapore Audio Dataset | 400 | 600 | 1000 | Mind a standard szingapúri angol, mind a köznyelvi szingapúri angol. Különböző etnikai hátterű (pl. kínai, maláj, indiai stb.) és különböző iskolai végzettségű szingapúriak. | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
Angol - Dél-Afrika akcentussal | Angol - Dél-Afrika Audio Dataset | 400 | 600 | 1000 | Különféle társadalmi-gazdasági osztályok és etnológiai hátterű képviselők (pl. európai, afrikai, indiai vagy vegyes hátterű dél-afrikaiak). | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
Angol - ír akcentussal | Angol - ír audio adatkészlet | 500 | 500 | Írországban beszélnek angolul | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
Angol - skót akcentussal | Angol - Skót audio adatkészlet | 800 | 800 | Angolul beszél skót | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
Angol - walesi akcentussal | Angol - Welsh Audio Dataset | 800 | 800 | walesi angol | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
francia kanadai | Francia kanadai audio adatkészlet | 1000 | 1000 | Kanadai francia | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
héber | Héber hangadatkészlet | 750 | 750 | 1500 | héber Izraelben | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
indonéz | Indonéz audio adatkészlet | 1000 | 1000 | 2000 | indonéz nyelv | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
japán | Japán audio adatkészlet | 2000 | 2000 | Japán Japánból | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
koreai | Koreai audio adatkészlet | 100 | 200 | 1500 | 1800 | A beszélők elterjedtek Dél-Koreában. | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
maláj | Maláj audio adatkészlet | 500 | 500 | 1000 | maláj Malajziában | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
Mexikói spanyol | Mexikói spanyol audio adatkészlet | 1250 | 1250 | Mexikói Mexikóból | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
lengyel | Lengyel audio adatkészlet | 250 | 2000 | 2250 | Lengyel Lengyelországból | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
orosz | Orosz audio adatkészlet | 2000 | 2000 | Orosz Oroszországból | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
szuahéli | Szuahéli hangadatkészlet | 350 | 650 | 1000 | dél-afrikai és kenyai szuahéli | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
svéd | Svéd audio adatkészlet | 350 | 650 | 1000 | svéd Svédországban | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
tajvani kínai | Tajvan kínai audio adatkészlet | 1000 | 1000 | Kínai Tajvanról | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
thai | Thai audio adatkészlet | 350 | 450 | 800 | Egy barátok között használt informális nyilvántartás, | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
török | Török audio adatkészlet | 2000 | 2000 | Török Törökországból | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||||
vietnami | Vietnami audio adatkészlet | 600 | 400 | 1000 | Északi (pl. Hanoi), középső és déli (pl. Ho Si Minh-város). | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
hindi | Hindi audio adatkészlet | 800 | 2000 | 2800 | Hindi Indiában, különösen az északi, keleti és nyugati régiókban | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
Hinglish | Indiai angol audio adatkészlet | 300 | 500 | 800 | Olyan városi indiai városokból gyűjtötték össze, amelyek a növekvő gazdasági lehetőségek miatt az ország pénzügyi központjai. Ilyen helyek lehetnek Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad stb. | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||
Angol | Angol audio adatkészlet | 700 | 700 | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | |||||
kannada | kannada audio adatkészlet | 60 | 100 | 40 | 200 | Kannada az indiai Karnatakából | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
Malayalam | Malayalam audio adatkészlet | 60 | 100 | 40 | 200 | Malayalam Keralából, Lakshadweepből és Puducherryből | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
oriya | Oriya Audio Dataset | 60 | 100 | 40 | 200 | Oriya Odisha, Nyugat-Bengál, Jharkhand és Chhattisgarh egyes részeiből | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
pandzsábi | Pandzsábi hangadatkészlet | 60 | 100 | 40 | 200 | Pandzsábi Pandzsábból, Indiából | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
tamil | Tamil audio adatkészlet | 60 | 100 | 240 | 400 | Tamil az indiai Tamil Naduból | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
telugu | Telugu audio adatkészlet | 100 | 950 | 950 | 2000 | Telugu Andhra Pradesh-ből, Indiából | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
bengáli | Bengáli audio adatkészlet | 60 | 100 | 40 | 200 | Bengáli Nyugat-Bengálból, Indiából | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
gudzsaráti | Gudzsaráti audio adatkészlet | 60 | 100 | 40 | 200 | Gudzsaráti Gujaratból, Indiából | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
marathi | Marathi audio adatkészlet | 60 | 100 | 40 | 200 | Marathi Maharashtrából, Indiából | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat | ||
Asszámi | asszámi hangadatkészlet | 60 | 100 | 40 | 200 | Assamese Asssamból, Indiából | . Wav | .json | ASR, virtuális asszisztens, chatbot, társalgási mesterséges intelligencia, beszédelemzés, TTS, nyelvi modellezés | Shaip | Kapcsolat Kapcsolat |
Mély szakértelem a társalgási AI terén
A társalgási mesterséges intelligencia, a chatbotok vagy a virtuális/digitális asszisztensek csak annyira okosak, amennyire a mögöttük lévő technológia és adatok állnak rendelkezésre. A Shaip a Natural Language Processing (NLP) sokrétű hangadatkészletét kínálja Önnek, amely valódi emberekkel folytatott beszélgetéseket utánoz, így életre keltheti mesterséges intelligenciáját. Mély megértésünkkel segítünk AI-kompatibilis beszédmodellek felépítésében és lokalizálásában, a legnagyobb pontossággal gazdag és strukturált adatkészletekkel, több nyelven a világ minden tájáról. Többnyelvű hanggyűjtési, hangátírási és hangjegyzetelési szolgáltatásokat kínálunk az Ön igényei alapján, miközben teljes mértékben személyre szabjuk a kívánt szándékot, megnyilatkozásokat és demográfiai eloszlást.
Szkriptelt beszédgyűjtemény
Spontán beszéd gyűjtemény
Hangadatok átírása
Adatcímkézés és kommentár
A Shaip lehetővé teszi a Conversational AI Platform pontos képzését, így az:
- Zökkenőmentesen beszélhet, írhat és cseveghet több csatornán keresztül.
- Tanuljon a csevegés, hangátiratok, tranzakciók stb. formájában meglévő interakciókból, és ezek alapján javasoljon és beszéljen.
- Értse meg az emberi beszéd mögött rejlő szándékot, és szüntesse meg a kétértelműséget az emberi nyelv megértésében.
- Egyéni interakciót folytathat Önnel, és meg lehet tanítani a felhasználók azonosítására és a múltbeli beszélgetésekre.
Világvezető a társalgási mesterséges intelligencia képzési adatok terén
Órákig tartó hangadatok több mint 100 nyelven - forrás, átírás és kommentár
Beszédadatok engedélyezése
20 40 + óra beszédadat 55+ nyelven és dialektusban, több mint XNUMX témát felölelve, különböző területekről, például Call-center, Viták, Általános beszélgetések, Beszédek, podcastok stb.
Beszédadatok gyűjtése
Gyűjtse össze a hang- és beszédadatokat (monológ, kétszemélyes beszélgetés, ember-bot csevegés) világszerte több mint 2 nyelven, az Ön AI követelményeinek megfelelően.
Beszédadatok átírása
Költséghatékony hangátírás vagy hangjegyzetek a 30,000 XNUMX munkatársból álló erős munkaerő révén, garantált TAT-val, pontossággal és megtakarításokkal
Gyorsítsa fel a beszélgetési AI alkalmazás fejlesztését az Audio Collection és Audio Annotation Services segítségével
A Shaip előny
Skála
Az Ön igényeinek megfelelően hangadatokat szerezhetünk, méretezhetünk és szállíthatunk a világ minden tájáról, több nyelven és nyelvjárásban.
Szakvélemény
Megfelelő szakértelemmel rendelkezünk a pontos és elfogulatlan adatgyűjtés, átírás és arany-szabványos jegyzetek terén.
Hálózat
Több mint 30,000 képzett közreműködőből álló hálózat, akikhez gyorsan hozzárendelhetik az adatgyűjtési feladatokat az AI képzési modell és bővítési szolgáltatások felépítéséhez.
Technológia
Teljesen AI-alapú platformunk van, saját fejlesztésű eszközökkel és folyamatokkal, hogy éjjel-nappal kihasználhassuk a munkafolyamat-kezelést.
Agilitás
Nagyon gyorsan alkalmazkodunk a vásárlói igények változásaihoz, és a versenytársnál 5-10-szer gyorsabb minőségi beszédadatokkal segítjük az AI-fejlesztés felgyorsítását.
Biztonság
Kiemelt jelentőséget tulajdonítunk az adatbiztonságnak és a magánéletnek, és tanúsítvánnyal rendelkezünk a szigorúan szabályozott érzékeny adatok kezelésére is.
Amit mi csinálunk a legjobban
Képzési adatok
A legjobb minőségű címkézett adatokhoz juthat az idő töredéke alatt. Aranystandard, megbízható és készen áll az AI és ML modellek betanítására a legmagasabb szintű teljesítmény elérése érdekében.
Adatgyűjtés, címkézés és megjegyzések
A Shaip segítségével több mint 15 éves bizonyított szakértelmet kap a minőségi adatok gyűjtésében, átírásában és megjegyzéseiben. Globális munkaerőnkkel adatokat gyűjthetünk a világ minden tájáról, majd címkézési és annotációs szolgáltatásokat nyújtunk az adatokhoz szükséges tökéletes képzettségi szinttel és szakértelemmel.
Adatkatalógusok és licencelés
Több millió adatkészletből álló hatalmas készletünkkel igény szerint összegyűjtheti és rendszerezheti. Ezt követően engedélyezhetjük ezeket a minőségi adatokat az Ön speciális AI és ML használati követelményei szerint. Ráadásul ezek az adatok a költségek töredékéért állnak rendelkezésre, ha saját maga készítené őket.
Szeretné felépíteni saját adatkészletét?
Lépjen kapcsolatba velünk most, hogy megtudja, hogyan gyűjthetünk egyedi adatkészletet az Ön egyedi AI-megoldásához.