Kulcskifejezések/Kifejezések Hanggyűjtemény
Esettanulmány: Kulcskifejezések gyűjteménye autóba épített hangvezérlésű rendszerekhez
Az autóiparban egyre nagyobb az igény az autóba épített hangvezérlésű rendszerekre, ami újra meghatározza a mobilitási járműveinkkel való kapcsolatunkat.
Az autóipar gyorsan átvette a hangvezérelt rendszereket, és a főbb szereplők, mint például a Ford, a Tesla és a BMW fejlett hangfelismerést integráltak járműveikbe. A becslések szerint 2022-re az új autók több mint 50%-a rendelkezett hangfelismerő képességgel. Ezek az integrációk a biztonság fokozását célozzák, lehetővé téve a járművezetők számára, hogy a navigációs, szórakoztató és kommunikációs funkciókat zavartalanul kezeljék.
Az autók hangfelismerésének piaci értéke az előrejelzések szerint 1-ra meghaladja az 2023 milliárd dollárt, ami azt jelzi, hogy a kihangosított, intelligens autós interakciók iránti kereslet nő.
Autóipari
A kutatások azt sugallják, hogy 2022-re a járművezetők 73%-a használ majd beépített hangasszisztenst.
Az autóipari hangfelismerő rendszerek piacának értéke 2.01-ben 2021 milliárd USD volt, és 3.51-re várhatóan eléri a 2027 milliárd USD-t, ami körülbelül 8.07 százalékos CAGR-t jelent.
Való világmegoldás
Hangvezérelt rendszereket működtető adatok
Az autók hangvezérelt rendszerei fokozzák a biztonságot és a kényelmet. Lehetővé teszik a járművezetők számára a navigációhoz való hozzáférést, a hívások kezdeményezését, az SMS-küldést és a zene vezérlését anélkül, hogy levennék a kezüket a kormányról, vagy tekintetüket az útról. A szóbeli parancsokra reagálva ezek a rendszerek csökkentik a figyelemelvonást, elősegítik a többfeladatos munkavégzést, és biztosítják a folyamatos összpontosítást a vezetésre.
Az ügyfél a társalgási intelligencia világszinten vezető szereplője, aki olyan hangalapú mesterséges intelligencia megoldásokat kínál, amelyek segítségével a vállalkozások hihetetlen beszélgetési élményeket kínálhatnak ügyfeleiknek. Vezető autóipari cégekkel dolgoztak azon, hogy hangvezérelt rendszereiket márkás kulcsmondatokkal képezzék ki, és szükségük volt Shaip audioadatgyűjtési szakértelmére.
Kihívások
- Crowd Sourcing: Nyelvenként több mint 2800 anyanyelvi beszélőt toborozzon világszerte.
- Adatgyűjtés: Biztonságos több mint 200 ezer prompt 12 nyelven a megadott időkereten belül.
- Kontextus és szándék felismerése: A felhasználói kérések helyes megértéséhez a rendszereket ki kell képezni ugyanazon kulcskifejezés különböző változataira.
- Háttérzaj kezelése: Az ML modell pontossága érdekében kezelje a valós háttérzajt.
- Elfogultság csökkentése: Szerezzen hangmintákat különböző demográfiai csoportokból az inkluzivitás biztosítása érdekében.
- Audio specifikációk: 16 khz 16 bites PCM, monó, egycsatornás, WAV; nincs feldolgozás.
- Felvételi környezet: A felvételek hangjának tisztanak kell lennie, háttérzaj és zavarás nélkül. Normál beszéddel rögzítendő kulcsmondatok.
- Minőség ellenőrzés: Minden beszédfelvétel minőségértékelésen és érvényesítésen esik át, csak az érvényesített beszédfelvételeket szállítjuk ki. Ha a Shaip nem felel meg az elfogadott minőségi szabványoknak, a Shaip további költségek nélkül újraküldi az adatokat
Megoldás
A Shaip a Conversational AI térben szerzett szakértelmével lehetővé tette az ügyfél számára:
- Adatgyűjtés: 208 12 kulcskifejezés/márkajelzés 2800 globális nyelven gyűjtve XNUMX beszélőtől az előírt időkereten belül
- Különféle akcentusok és nyelvjárások: A világ minden tájáról toborzott szakemberek, akik jártasak a kívánt akcentusokban és dialektusokban.
- Kontextus és szándék felismerése: Minden felszólaló feladata volt, hogy rögzítse a kulcsmondatokat 20 különböző variációban, lehetővé téve az ML-modellek számára, hogy pontosan megragadják a felhasználói kéréseket a kontextus és a szándék tekintetében.
- Háttérzajkezelés: A kifogástalan hangminőség biztosítása érdekében megbizonyosodtunk arról, hogy a kulcsmondatokat nyugodt környezetben, 40 dB alatti zajszinttel rögzítettük, mentes a háttérben zavaró, például TV-, rádió-, zene-, beszéd- vagy utcai hangoktól.
- Elfogultság csökkentése: Az elfogultság minimalizálása érdekében különböző régiókból származó egyéneket vontunk be, és kiegyensúlyozott demográfiai reprezentációt tartottunk fenn, 50%-ban férfiak és 50%-ban nők, 18 és 60 év közötti korcsoportok között.
- Rögzítési irányelvek: A kulcsmondatokat konzisztens, normál beszédmintázatban rögzítették, olyan eltérések nélkül, mint a gyors vagy lassú ingerlés. 2 másodperces csend az elején és a végén is, hogy biztosítsa, hogy a beszéd egyetlen részét sem vágták le véletlenül.
- Felvételi formátum: A hangot 16 kHz-en, 16 bites PCM-en, monóban, egyetlen csatornát használva rögzítették, és WAV fájlformátumban mentették. A hang feldolgozatlan marad, ami azt jelenti, hogy nem alkalmaztak tömörítést, reverb-et vagy EQ-t.
- Minőség: Minden beszédfelvételt szigorú minőségi ellenőrzésnek és érvényesítésnek vetettünk alá. Csak azokat a felvételeket szállították le, amelyek megfeleltek ezen az értékelésen. Minden olyan fájlt, amely nem felelt meg a megállapodott minőségi szabványoknak, újra rögzítettük, és további költségek nélkül biztosítottuk.
Eredmény
A kiváló minőségű márka kulcskifejezésének hangadatai vagy hangutasításai lehetővé teszik az autóipari vállalatok és ügyfeleik számára:
- Márkaépítés és identitás: A konkrét márkamondatokat tartalmazó hangutasítások segítségével a vállalatok közvetlen és emlékezetes kapcsolatot hoznak létre a felhasználó és a márka között, ami javítja a márka felidézését.
- Egyszerű használat: A hangutasítások megkönnyítik a sofőrök számára a járművel való interakciót anélkül, hogy levennék a kezüket a kormányról vagy a tekintetüket az útról, ezáltal fokozva a közúti biztonságot.
- funkcionalitás: A hangutasítások intuitívabbá teszik az autó funkcióinak elérését és vezérlését. Legyen szó navigációról, médialejátszásról vagy klímaszabályozásról.
- Integráció más rendszerekkel: Számos hangvezérelt rendszer integrálva van okostelefonokkal, intelligens otthoni eszközökkel és más IoT-eszközökkel. Például előfordulhat, hogy a felhasználó megkérheti autóját, hogy kapcsolja fel a lámpákat otthon, amikor hazafelé közeledik.
- Versenyelőny: A fejlett hangvezérlésű rendszerek kínálása értékesítési pont és megkülönböztető tényező lehet. A vásárlók a legújabb technológiát keresik, amikor új autó vásárlását fontolgatják.
- Jövőbiztos: Ahogy a technológia fejlődik, és az IoT egyre jobban integrálódik a mindennapi életbe, a robusztus hangvezérelt rendszer lehetővé teszi az autóipari vállalatok számára, hogy jobban alkalmazkodjanak a jövő technológiájához.
- Bevételi lehetőségek: További bevételszerzési lehetőségek, azaz a hangrendszerek olyan ajánlásokat vagy integrált e-kereskedelmi élményeket kínálnak (például ételrendelést vagy közeli szolgáltatások keresését), amelyek bevételt biztosíthatnak a társult vállalkozások számára.
Amikor elkezdtük a hangutasítások beszerzését az autóipar számára, számos kihívást jelentett. A beszéd, az akcentusok és a hangok sokféleségének megragadása létfontosságú volt ügyfeleink globális ügyfélkörének képviseletében. Shaip nemcsak eladóként tűnt ki, hanem igazi partnerként is. Dicséretes volt az elkötelezettségük, hogy a különböző régiókból sokféle hangot biztosítsanak. Túlléptek a hangok összegyűjtésén; felfogták projektigényeink árnyalatait, garantálva a csúcsminőségű felvételeket. A hanggyűjtési szabványokhoz való hibátlan betartásuk megmutatta professzionalizmusukat és a projekt iránti elkötelezettségüket.