Az AI fejlesztési akadályainak leküzdésének kulcsa

Megbízhatóbb adatok

Intro
Kulcs az AI akadályok leküzdéséhez?
A következetlen adatminőség kihívása
Navigálás a komplex megfelelőségi követelmények között
Az AI fejlesztési akadályainak leküzdése
Beszéljünk

Bevezetés

A mesterséges intelligencia akkor kezdte elragadni a képzeletet, amikor az „Óz varázslója” bádogembere 1939-ben eljutott az ezüstvászonra, és azóta csak szilárdabb helyet kapott a zeitgeistben. Alkalmazásukban azonban az AI termékek rendszeres boom-bust ciklusokon mentek keresztül, amelyek eddig eltorlaszolták a legbefolyásosabb örökbefogadásokat.

A fellendülés idején a mérnökök és kutatók óriási lépéseket tettek meg, de amikor törekvéseik elkerülhetetlenül meghaladják az akkor rendelkezésre álló számítási képességeket, nyugalmi időszak következett. Szerencsére a Moore-törvény által 1965-ben megjövendölt számítási teljesítmény exponenciális növekedése többnyire pontosnak bizonyult, és ennek a növekedésnek a jelentőségét nehéz túlbecsülni.

Olvassa el az e -könyvet: A kulcs az AI fejlesztési akadályainak leküzdéséhez, vagy töltse le az e -könyv PDF verzióját.

Tartalomjegyzék

Bevezetés

Kulcs az AI akadályok leküzdéséhez?

A következetlen adatminőség kihívása

Navigálás a komplex megfelelőségi követelmények között

Az AI fejlesztési akadályainak leküzdése

Beszéljünk

Az AI fejlesztési akadályainak leküzdésének kulcsa: megbízhatóbb adatok

Manapság az átlagember millióinak többszörös számítási teljesítménye van a zsebében, mint amennyit a NASA-nak 1969-ben le kellett húznia a holdraszállásról. Ugyanez a mindenütt jelen lévő eszköz, amely kényelmesen bemutatja a számítási teljesítmény rengetegét, az AI aranykorának egy másik előfeltételét is teljesíti: rengeteg adat. Az Információs Túlterhelés Kutatócsoport felismerése szerint a világ adatainak 90% -át az elmúlt két évben hozták létre. Most, hogy a számítási teljesítmény exponenciális növekedése végül konvergált az adatok generálásának ugyanolyan meteorikus növekedésével, az AI adatinnovációi annyira felrobbannak, hogy egyes szakértők szerint a negyedik ipari forradalmat meg lehet indítani.

Az Országos Kockázati Tőke Szövetség adatai azt mutatják, hogy a mesterséges intelligencia szektor rekordos 6.9 milliárd dolláros beruházást hajtott végre 2020 első negyedévében. Nem nehéz felismerni a mesterséges intelligencia eszközökben rejlő lehetőségeket, mert azokat már körülöttünk használják. Az AI termékek láthatóbb felhasználási esetei közé tartoznak a kedvenc alkalmazások, például a Spotify és a Netflix mögött álló ajánlásmotorok. Bár szórakoztató felfedezni egy új előadót, akit hallgatni lehet, vagy egy új tévéműsort, amelyet nézni lehet, ezek a megvalósítások meglehetősen alacsony tét. Más algoritmusok teszteredményei - részben meghatározzák a hallgatók felvételi helyét a főiskolára -, mások pedig szitálják a jelentkezők önéletrajzát, eldöntve, hogy melyik jelentkező kap egy adott állást. Egyes mesterséges intelligencia-eszközöknek akár életre-halálra is lehetnek következményei, például az AI-modell, amely az emlőrák szűrését végzi (amely felülmúlja az orvosokat).

Annak ellenére, hogy az AI fejlesztés valós példái és a transzformációs eszközök következő generációjának megteremtéséért versengő startupok száma folyamatosan növekszik, továbbra is kihívások maradnak a hatékony fejlesztés és megvalósítás terén. Különösen az AI kimenet csak annyira pontos, amennyire a bemenet lehetővé teszi, ami azt jelenti, hogy a minőség a legfontosabb.

Az inkonzisztens adatminőség kihívása az AI megoldásokban

Valójában hihetetlen mennyiségű adat generálódik nap mint nap: 2.5 ezer milliárd bájt a Social Media Today szerint. De ez nem azt jelenti, hogy mindez méltó az algoritmus kiképzéséhez. Egyes adatok hiányosak, mások gyenge minőségűek, mások pedig egyszerűen pontatlanok, ezért ezen hibás információk bármelyikének felhasználása ugyanazokat a tulajdonságokat eredményezi a (drága) AI-innovációban. A Gartner kutatásai szerint a 85-ig létrehozott mesterséges intelligencia-projektek mintegy 2022% -a pontatlan eredményeket fog eredményezni az elfogult vagy pontatlan adatok miatt. Bár könnyen kihagyhatja az ízlésének nem megfelelő dalajánlást, más pontatlan algoritmusok jelentős anyagi és jó hírnévvel járnak.

2018-ban az Amazon elkezdte használni a mesterséges intelligenciával működő bérbeadó eszközt, amelyet 2014 óta gyártanak, és amelynek erős és összetéveszthetetlen elfogultsága volt a nőkkel szemben. Kiderült, hogy az eszköz alapját képező számítógépes modelleket egy évtizeden keresztül a vállalatnak benyújtott összefoglalók felhasználásával képezték ki. Mivel a legtöbb tech-jelentkező férfi volt (és még mindig az, talán ennek a technológiának köszönhető), az algoritmus úgy döntött, hogy az önéletrajzokat bárhol szereplő „nőkkel” - például női focikapitánnyal vagy női üzleti csoportokkal - bünteti. Még két nőiskola jelentkezőinek megbüntetését is elhatározta. Az Amazon állítása szerint az eszközt soha nem használták egyedüli kritériumként a potenciális jelöltek értékelésénél, a toborzók mégis az ajánlási motort nézték meg, amikor új alkalmazottakat kerestek.

Az Amazon bérbeadó eszköze sok éves munka után végül selejtbe került, de a lecke elhúzódik, kiemelve az adatminőség fontosságát az algoritmusok és az AI-eszközök képzésénél. Hogyan néznek ki a „kiváló minőségű” adatok? Röviden, bejelöli ezt az öt négyzetet:

1. releváns

Ahhoz, hogy az adatok jó minőségűnek minősüljenek, valami értékeset kell hozniuk a döntéshozatali folyamatban. Van-e összefüggés az álláspályázó állami bajnok rúdugró státusza és a munkahelyi teljesítménye között? Lehetséges, de nagyon valószínűtlennek tűnik. A nem releváns adatok kiszűrésével egy algoritmus arra összpontosíthat, hogy az eredményeket ténylegesen befolyásoló információk között válogasson.

2. Pontos

Ezeknek az adatoknak pontosan fel kell tüntetniük a tesztelt ötleteket. Ha nem, akkor nem éri meg. Például az Amazon betanította bérbeadási algoritmusát 10 év pályázói önéletrajz felhasználásával, de nem világos, hogy a vállalat először megerősítette-e az ezekre az összefoglalókra vonatkozó információkat. A Checkster referencia-ellenőrző cég kutatásai azt mutatják, hogy a pályázók 78% -a hazudik, vagy fontolóra venné az álláspályázaton való hazudást. Ha egy algoritmus ajánlási döntéseket hoz például egy jelölt GPA-jának felhasználásával, érdemes először megerősíteni a számok hitelességét. Ez a folyamat időt és pénzt igényel, de kétségtelenül javítaná az eredmények pontosságát is.

3. Megfelelően szervezett és kommentált

Az önéletrajzon alapuló felvételi modell esetében az annotálás viszonylag egyszerű. Bizonyos értelemben az összefoglaló előre megjegyzéssel szerepel, bár kétségtelen, hogy lennének kivételek. A legtöbb pályázó munkatapasztalatát „Tapasztalat” címszó alatt, a releváns készségeket pedig a „Képességek” alatt sorolja fel. Azonban más helyzetekben, például a rákszűrés során, az adatok sokkal változatosabbak lesznek. Az információk lehetnek orvosi képalkotás, fizikai szűrés eredményei, vagy akár az orvos és a beteg közötti beszélgetés a család egészségi állapotáról és a rákos megbetegedésekről, többek között az adatok között. Ahhoz, hogy ez az információ hozzájáruljon a pontos detektálási algoritmushoz, gondosan meg kell szervezni és meg kell jegyezni, hogy az AI-modell megtanuljon pontos előrejelzéseket tenni a helyes következtetések alapján.

4. Naprakész

Az Amazon olyan eszközt próbált létrehozni, amely időt és pénzt takarít meg azáltal, hogy ugyanazokat az alkalmazási döntéseket reprodukálja, amelyeket az emberek sokkal kevesebb idő alatt hoznak meg. Az ajánlások minél pontosabbá tétele érdekében az adatokat naprakészen kell tartani. Ha egy vállalat egyszer bebizonyította, hogy előnyben részesíti például az írógépek javításával képes jelentkezőket, akkor ezek a történelmi bérbeadások valószínűleg nem lennének nagy hatással a mai álláspályázók alkalmasságára bármilyen szerepre. Ennek eredményeként bölcs lenne eltávolítani őket.

5. Megfelelően sokszínű

Az Amazon mérnökei úgy döntöttek, hogy egy algoritmust képeznek a jelentkezők csoportjával, amely elsöprően férfi. Ez a döntés kritikus hiba volt, és nem kevésbé égetővé tette az a tény, hogy ezek voltak azok az összefoglalók, amelyekkel a vállalat akkor rendelkezett. Az Amazon mérnökei társulhattak volna hasonló tiszteletben álló szervezetekkel rendelkezésre álló állások, akik több női álláspályázót fogadtak be a hiány pótlására, vagy megtehette mesterségesen csökkentette a férfiak önéletrajzának számát, hogy megfeleljen a nők számának, és képzett és a populáció pontosabb ábrázolásával vezette az algoritmust. A lényeg az az adat a sokféleség kulcsfontosságú, és hacsak nem történik összehangolt erőfeszítés a bemenetek torzításának kiküszöbölésére, az elfogult kimenetek érvényesül.

Nyilvánvaló, hogy a jó minőségű adatok nem csak a semmiből jelennek meg. Ehelyett gondosan meg kell kurálni, a tervezett eredményeket szem előtt tartva. A mesterséges intelligencia területén gyakran mondják, hogy „a szemét ki jelenti a szemetet”. Ez az állítás igaz, de némileg alábecsüli a minőség fontosságát. Az AI hihetetlen mennyiségű információt képes feldolgozni, és bármi mássá alakíthatja, a részvényválasztástól kezdve az ajánlások felvételén át az orvosi diagnózisokig. Ez a képesség messze felülmúlja az emberek képességeit, ami azt is jelenti, hogy felnagyítja az eredményeket. Az egyik elfogult emberi toborzó csak annyi nőt tudott figyelmen kívül hagyni, de az elfogult AI toborzó mindannyiukat. Ebben az értelemben a szemét nem csak szemetet jelent - ez azt jelenti, hogy kis mennyiségű „szemét” adat egy teljes hulladéklerakóvá válhat.

Navigálás a komplex megfelelőségi követelmények között

Mintha a minőségi adatok megtalálása nem lenne elég nehéz, néhány olyan iparágat is a legszigorúbban szabályoznak, amelyek a legtöbbet profitálják az AI adatinnovációkból. Az egészségügy talán a legjobb példa, és bár a HIT Infrastructure felméréséből kiderült, hogy az iparági bennfentesek 91% -a úgy gondolja, hogy a technológia javíthatja az ellátáshoz való hozzáférést, ezt az optimizmust enyhíti az a tény, hogy 75% -uk veszélyt jelent a betegek biztonságára és magánéletére - és nem csak a betegek vannak veszélyben.

Az egészségbiztosítási hordozhatóságról és az elszámoltathatóságról szóló törvény által elfogadott átfogó előírások most keresztezik a különféle helyi adatvédelmi akadályokat, mint például az Európai Általános Adatvédelmi Rendelet, az amerikai kaliforniai fogyasztói adatvédelmi törvény és a szingapúri személyes adatok védelméről szóló törvény. Ezekhez a helyi szabályozásokhoz még sokan csatlakoznak, és mivel a távegészségügy az egészségügyi adatok jelentősebb forrásaként jelenik meg, valószínű, hogy a szabályozás még szigorúbb fogást kap a szállítás közbeni betegadatokról. Ennek eredményeként a Shaip biztonságos és kompatibilis felhőplatformja még értékesebb eszköznek bizonyul az egészségügyi adatok összegyűjtésére és az AI-termékek betanításához.

A személyazonosításra alkalmas információk jelentős veszélyt jelenthetnek a mesterséges intelligencia fejlesztésére, de még egy teljesen megfelelő megvalósítás is veszélyben van, ha nem képes olyan pontos eredményeket nyújtani, amelyek csak sokféle képzési adattal járnak. A Journal of the American Medical Association egy 2020-as tanulmánya kimutatta, hogy a gépi tanulási algoritmusokat az orvosi területen a kaliforniai, New York-i és Massachusetts-i betegek adataival képezik leggyakrabban. Tekintettel arra, hogy ezek a betegek az USA lakosságának kevesebb, mint egyötödét képviselik, hogy a világ többi részéről semmit ne mondjak, nehéz elképzelni, hogy ezek a modellek miként hozhatnának elő semmit, csak elfogult eredményeket.

A Shaip felismerve a megfelelő, földrajzilag sokféle információ biztosításának nehézségeit, a pontos algoritmusok elkészítése céljából a Shaip számos különféle régióból kínál licencelt egészségügyi adatokat. Ezek az adatok szöveg formájában érkeznek, például orvosi feljegyzések vagy állítások, orvosi diagnosztikai képalkotás, például CT-vizsgálatok, hang, például orvosok elhangzott jegyzetei, vagy az orvosok és a betegek közötti beszélgetések, és még videók is az MRI eredményekből. Ez szintén teljesen azonosítatlan és névtelen, megvédi szervezetét mind az etikai, mind a pénzügyi következményektől, amelyek mind a hazai, mind a nemzetközi eredetű adatokat szabályozó szabályozások bármelyikének megsértését követik.

Az AI fejlesztési akadályainak leküzdése

A mesterséges intelligencia fejlesztési erőfeszítései jelentős akadályokat tartalmaznak, függetlenül attól, hogy melyik iparágban végzik tevékenységüket, és a megvalósítható ötlettől a sikeres termékig való eljutás nehézségekkel jár. A megfelelő adatok megszerzésének kihívásai és anonimizálásának szükségessége között, hogy megfeleljen az összes vonatkozó szabályozásnak, úgy érezheti, hogy az algoritmus elkészítése és oktatása a könnyű.

Annak érdekében, hogy szervezete minden szükséges előnyt megadhasson egy úttörő új mesterséges intelligencia-fejlesztés megtervezéséhez, érdemes fontolóra vennie a Shaiphoz hasonló társasággal való partnerséget. Chetan Parikh és Vatsal Ghiya megalapították a Shaip-ot, hogy segítsenek a vállalatoknak olyan megoldásokat kidolgozni, amelyek átalakíthatják az egészségügyet az Egyesült Államokban. Több mint 16 üzleti év után cégünk több mint 600 csapattaggal bővült, és több száz munkatárssal dolgoztunk együtt. ügyfelek számára, hogy a kényszerítő ötleteket AI megoldásokká alakítsák.

Az Ön szervezete számára dolgozó embereinkkel, folyamatainkkal és platformunkkal azonnal kiaknázhatja a következő négy előnyt, és a sikeres befejezés felé katapultálja a projektet:

1. Az adattudósok felszabadításának képessége

Nem lehet elkerülni, hogy az AI fejlesztési folyamata jelentős időbefektetést igényel, de mindig optimalizálhatja azokat a funkciókat, amelyek elvégzésére a legtöbb időt fordítja a csapata. Ön azért bérelte fel az adatokkal foglalkozó tudósait, mert szakértők a fejlett algoritmusok és gépi tanulási modellek fejlesztésében, de a kutatás következetesen azt bizonyítja, hogy ezek a dolgozók valójában idejük 80% -át töltik a projekt működéséhez szükséges adatok beszerzésével, tisztításával és rendszerezésével. Az adattudósok több mint háromnegyede (76%) azt állítja, hogy ezek a hétköznapi adatgyűjtési folyamatok a legkevésbé kedvelt részei a munkának, de a minőségi adatok iránti igényüknek mindössze 20% -a marad a tényleges fejlesztésre, ami sok adatkutató számára a legérdekesebb és intellektuálisan stimuláló munka. Ha egy harmadik féltől származó szállítón keresztül, például a Shaipen keresztül szerzi be az adatokat, egy vállalat hagyhatja, hogy drága és tehetséges adatmérnökei kiszervezzék munkájukat, mint adatőrzők, és inkább az AI megoldások azon részeivel töltsék idejüket, ahol a legtöbb értéket tudják előállítani.

2. A jobb eredmények elérésének képessége

Számos mesterséges intelligencia-fejlesztési vezető úgy dönt, hogy nyílt forráskódú vagy tömegesen beszerzett adatokat használ a költségek csökkentésére, de ez a döntés hosszú távon szinte mindig többe kerül. Az ilyen típusú adatok könnyen hozzáférhetők, de nem felelnek meg a gondosan gondozott adatkészletek minőségének. Különösen a tömeges adatokban vannak hibák, kihagyások és pontatlanságok, és bár ezeket a problémákat a fejlesztői folyamat során néha rendezni tudják mérnökei figyelemmel, további ismétlésekre van szükség, amelyekre nem lenne szükség, ha magasabb szintűekkel kezdene -minőségi adatok a kezdetektől fogva.

A nyílt forráskódú adatokra való támaszkodás egy másik gyakori parancsikon, amely saját buktatóival rendelkezik. A differenciálás hiánya az egyik legnagyobb kérdés, mert a nyílt forráskódú adatok felhasználásával kiképzett algoritmus könnyebben replikálható, mint a licencelt adathalmazokra épülő algoritmus. Ezen az úton haladva meghívja a versenyt a piac többi belépőjével, akik bármikor alá tudják vetni az áraikat és piaci részesedést szerezhetnek. Amikor a Shaip-ra támaszkodik, az ügyesen kezelt munkaerő által összegyűjtött legjobb minőségű adatokhoz fér hozzá, és kizárólagos licencet adhatunk Önnek egy egyedi adatkészlethez, amely megakadályozza, hogy a versenytársak könnyedén újrateremtsék a nehezen megszerzett szellemi tulajdont.

3. Hozzáférés tapasztalt szakemberekhez

Még akkor is, ha házonkénti listáján szakképzett mérnökök és tehetséges adatkutatók szerepelnek, a mesterséges intelligencia-eszközei profitálhatnak a csak tapasztalatokon alapuló bölcsességből. Tantárgyszakértőink számos AI-megvalósítást vezetnek a szakterületükön, és értékes tanulságokat szereztek útközben, és egyetlen céljuk az, hogy segítsenek Önnek elérni.

Ha a tartomány szakértői azonosítják, rendszerezik, kategorizálják és címkézik az Ön számára az adatokat, akkor tudja, hogy az algoritmus tanításához használt információk a lehető legjobb eredményeket hozhatják. Rendszeres minőségbiztosítást is végzünk annak biztosítása érdekében, hogy az adatok megfeleljenek a legmagasabb követelményeknek, és a rendeltetésüknek megfelelően működjenek nemcsak laboratóriumban, hanem valós körülmények között is.

4. Gyorsított fejlesztési ütemterv

A mesterséges intelligencia fejlesztése nem egyik napról a másikra, hanem gyorsabban történhet meg, ha partnerül állsz a Shaipszal. A házon belüli adatgyűjtés és annotáció jelentős működési szűk keresztmetszetet eredményez, amely visszatartja a fejlesztési folyamat többi részét. A Shaip-tal való együttműködés azonnali hozzáférést biztosít a használatra kész adatok hatalmas könyvtárához, és szakértőink bármilyen mélységű ipari ismeretünkkel és globális hálózatunkkal képesek lesznek bármilyen további inputot beszerezni, amire szüksége van. A beszerzés és az annotálás terhe nélkül csapata azonnal munkába állhat a tényleges fejlesztéssel, és képzési modellünk segíthet a korai pontatlanságok azonosításában, hogy csökkentse a pontossági célok eléréséhez szükséges iterációkat.

Ha még nem áll készen az adatkezelés minden aspektusának kiszervezésére, a Shaip egy felhőalapú platformot is kínál, amely segít a csapatoknak hatékonyabban előállítani, módosítani és feljegyezni a különféle típusú adatokat, beleértve a képek, videók, szövegek és hangok támogatását. . A ShaipCloud számos intuitív ellenőrzési és munkafolyamat-eszközt tartalmaz, például egy szabadalmaztatott megoldást a munkaterhelések nyomon követésére és nyomon követésére, egy átírási eszközt az összetett és nehéz hangfelvételek átírására, valamint egy minőségellenőrző komponenst a kompromisszumok nélküli minőség biztosítására. A legjobb az egészben, hogy méretezhető, így növekedhet, ha a projekt különböző igényei megnőnek.

A mesterséges intelligencia kora még csak most kezdődik, és hihetetlen előrelépéseket és újításokat fogunk látni az elkövetkező években, amelyek képesek átformálni az egész iparágakat, vagy akár megváltoztatni a társadalom egészét. A Shaip-nál szaktudásunkat arra akarjuk felhasználni, hogy átalakító erőként szolgáljon, segítve a világ legforradalmibb vállalatait, hogy a mesterséges intelligencia-megoldások erejét kihasználják az ambiciózus célok elérése érdekében.

Mély tapasztalattal rendelkezünk az egészségügyi alkalmazások és a beszélgetéses mesterséges intelligencia terén, de rendelkezünk a szükséges képességekkel a modellek betanításához szinte bármilyen alkalmazáshoz. Ha többet szeretne megtudni arról, hogy a Shaip miként segítheti a projekt ötlettől a megvalósításig, tekintse meg a weboldalunkon elérhető számos forrást, vagy forduljon hozzánk ma.

Beszéljünk

Az Ön neve*
Vezetéknév*
E-mail*
WhatsApp/Viber*
Cégünkről*
Ország*
Ország
Hozzászólások*
A regisztrációval egyetértek Shaippal Adatkezelési tájékoztató és a Általános Szerződési Feltételek és hozzájárulok a Shaip B2B marketingkommunikációjának fogadásához.
CAPTCHA