Kulcskifejezések/Kifejezések Hanggyűjtemény

Esettanulmány: Kulcskifejezések gyűjteménye autóba épített hangvezérlésű rendszerekhez

Kulcskifejezés-gyűjtemény

Az autóiparban egyre nagyobb az igény az autóba épített hangvezérlésű rendszerekre, ami újra meghatározza a mobilitási járműveinkkel való kapcsolatunkat.

Az autóipar gyorsan átvette a hangvezérelt rendszereket, és a főbb szereplők, mint például a Ford, a Tesla és a BMW fejlett hangfelismerést integráltak járműveikbe. A becslések szerint 2022-re az új autók több mint 50%-a rendelkezett hangfelismerő képességgel. Ezek az integrációk a biztonság fokozását célozzák, lehetővé téve a járművezetők számára, hogy a navigációs, szórakoztató és kommunikációs funkciókat zavartalanul kezeljék.

Az autók hangfelismerésének piaci értéke az előrejelzések szerint 1-ra meghaladja az 2023 milliárd dollárt, ami azt jelzi, hogy a kihangosított, intelligens autós interakciók iránti kereslet nő.

Autóipari

A kutatások azt sugallják, hogy 2022-re a járművezetők 73%-a használ majd beépített hangasszisztenst.

Az autóipari hangfelismerő rendszerek piacának értéke 2.01-ben 2021 milliárd USD volt, és 3.51-re várhatóan eléri a 2027 milliárd USD-t, ami körülbelül 8.07 százalékos CAGR-t jelent.

Való világmegoldás

Hangvezérelt rendszereket működtető adatok

Az autók hangvezérelt rendszerei fokozzák a biztonságot és a kényelmet. Lehetővé teszik a járművezetők számára a navigációhoz való hozzáférést, a hívások kezdeményezését, az SMS-küldést és a zene vezérlését anélkül, hogy levennék a kezüket a kormányról, vagy tekintetüket az útról. A szóbeli parancsokra reagálva ezek a rendszerek csökkentik a figyelemelvonást, elősegítik a többfeladatos munkavégzést, és biztosítják a folyamatos összpontosítást a vezetésre. 

Az ügyfél a társalgási intelligencia világszinten vezető szereplője, aki olyan hangalapú mesterséges intelligencia megoldásokat kínál, amelyek segítségével a vállalkozások hihetetlen beszélgetési élményeket kínálhatnak ügyfeleiknek. Vezető autóipari cégekkel dolgoztak azon, hogy hangvezérelt rendszereiket márkás kulcsmondatokkal képezzék ki, és szükségük volt Shaip audioadatgyűjtési szakértelmére.

Valós megoldás
Kihívások

Kihívások

  • Crowd Sourcing: Nyelvenként több mint 2800 anyanyelvi beszélőt toborozzon világszerte.
  • Adatgyűjtés: Biztonságos több mint 200 ezer prompt 12 nyelven a megadott időkereten belül.
  • Kontextus és szándék felismerése: A felhasználói kérések helyes megértéséhez a rendszereket ki kell képezni ugyanazon kulcskifejezés különböző változataira.
  • Háttérzaj kezelése: Az ML modell pontossága érdekében kezelje a valós háttérzajt.
  • Elfogultság csökkentése: Szerezzen hangmintákat különböző demográfiai csoportokból az inkluzivitás biztosítása érdekében.
  • Audio specifikációk: 16 khz 16 bites PCM, monó, egycsatornás, WAV; nincs feldolgozás.
  • Felvételi környezet: A felvételek hangjának tisztanak kell lennie, háttérzaj és zavarás nélkül. Normál beszéddel rögzítendő kulcsmondatok.
  • Minőség ellenőrzés:  Minden beszédfelvétel minőségértékelésen és érvényesítésen esik át, csak az érvényesített beszédfelvételeket szállítjuk ki. Ha a Shaip nem felel meg az elfogadott minőségi szabványoknak, a Shaip további költségek nélkül újraküldi az adatokat

Megoldás

A Shaip a Conversational AI térben szerzett szakértelmével lehetővé tette az ügyfél számára:

  • Adatgyűjtés: 208 12 kulcskifejezés/márkajelzés 2800 globális nyelven gyűjtve XNUMX beszélőtől az előírt időkereten belül
  • Különféle akcentusok és nyelvjárások: A világ minden tájáról toborzott szakemberek, akik jártasak a kívánt akcentusokban és dialektusokban.
  • Kontextus és szándék felismerése: Minden felszólaló feladata volt, hogy rögzítse a kulcsmondatokat 20 különböző variációban, lehetővé téve az ML-modellek számára, hogy pontosan megragadják a felhasználói kéréseket a kontextus és a szándék tekintetében.
  • Háttérzajkezelés: A kifogástalan hangminőség biztosítása érdekében megbizonyosodtunk arról, hogy a kulcsmondatokat nyugodt környezetben, 40 dB alatti zajszinttel rögzítettük, mentes a háttérben zavaró, például TV-, rádió-, zene-, beszéd- vagy utcai hangoktól.
  • Elfogultság csökkentése: Az elfogultság minimalizálása érdekében különböző régiókból származó egyéneket vontunk be, és kiegyensúlyozott demográfiai reprezentációt tartottunk fenn, 50%-ban férfiak és 50%-ban nők, 18 és 60 év közötti korcsoportok között.
  • Rögzítési irányelvek: A kulcsmondatokat konzisztens, normál beszédmintázatban rögzítették, olyan eltérések nélkül, mint a gyors vagy lassú ingerlés. 2 másodperces csend az elején és a végén is, hogy biztosítsa, hogy a beszéd egyetlen részét sem vágták le véletlenül.
  • Felvételi formátum: A hangot 16 kHz-en, 16 bites PCM-en, monóban, egyetlen csatornát használva rögzítették, és WAV fájlformátumban mentették. A hang feldolgozatlan marad, ami azt jelenti, hogy nem alkalmaztak tömörítést, reverb-et vagy EQ-t.
  • Minőség: Minden beszédfelvételt szigorú minőségi ellenőrzésnek és érvényesítésnek vetettünk alá. Csak azokat a felvételeket szállították le, amelyek megfeleltek ezen az értékelésen. Minden olyan fájlt, amely nem felelt meg a megállapodott minőségi szabványoknak, újra rögzítettük, és további költségek nélkül biztosítottuk.
Megoldás
Eredmény

Eredmény

A kiváló minőségű márka kulcskifejezésének hangadatai vagy hangutasításai lehetővé teszik az autóipari vállalatok és ügyfeleik számára:

  1. Márkaépítés és identitás: A konkrét márkamondatokat tartalmazó hangutasítások segítségével a vállalatok közvetlen és emlékezetes kapcsolatot hoznak létre a felhasználó és a márka között, ami javítja a márka felidézését.
  2. Egyszerű használat: A hangutasítások megkönnyítik a sofőrök számára a járművel való interakciót anélkül, hogy levennék a kezüket a kormányról vagy a tekintetüket az útról, ezáltal fokozva a közúti biztonságot.
  3. funkcionalitás: A hangutasítások intuitívabbá teszik az autó funkcióinak elérését és vezérlését. Legyen szó navigációról, médialejátszásról vagy klímaszabályozásról.
  4. Integráció más rendszerekkel: Számos hangvezérelt rendszer integrálva van okostelefonokkal, intelligens otthoni eszközökkel és más IoT-eszközökkel. Például előfordulhat, hogy a felhasználó megkérheti autóját, hogy kapcsolja fel a lámpákat otthon, amikor hazafelé közeledik.
  5. Versenyelőny: A fejlett hangvezérlésű rendszerek kínálása értékesítési pont és megkülönböztető tényező lehet. A vásárlók a legújabb technológiát keresik, amikor új autó vásárlását fontolgatják.
  6. Jövőbiztos: Ahogy a technológia fejlődik, és az IoT egyre jobban integrálódik a mindennapi életbe, a robusztus hangvezérelt rendszer lehetővé teszi az autóipari vállalatok számára, hogy jobban alkalmazkodjanak a jövő technológiájához.
  7. Bevételi lehetőségek: További bevételszerzési lehetőségek, azaz a hangrendszerek olyan ajánlásokat vagy integrált e-kereskedelmi élményeket kínálnak (például ételrendelést vagy közeli szolgáltatások keresését), amelyek bevételt biztosíthatnak a társult vállalkozások számára.
Arany-5 csillagos

Amikor elkezdtük a hangutasítások beszerzését az autóipar számára, számos kihívást jelentett. A beszéd, az akcentusok és a hangok sokféleségének megragadása létfontosságú volt ügyfeleink globális ügyfélkörének képviseletében. Shaip nemcsak eladóként tűnt ki, hanem igazi partnerként is. Dicséretes volt az elkötelezettségük, hogy a különböző régiókból sokféle hangot biztosítsanak. Túlléptek a hangok összegyűjtésén; felfogták projektigényeink árnyalatait, garantálva a csúcsminőségű felvételeket. A hanggyűjtési szabványokhoz való hibátlan betartásuk megmutatta professzionalizmusukat és a projekt iránti elkötelezettségüket.

Gyorsítsa fel a társalgási AI -t
alkalmazásfejlesztés 100% -ban