Számítógépes látás

22+ legkeresettebb nyílt forráskódú adatkészlet a számítógépes látáshoz

Egy AI-algoritmus csak annyira jó, amennyire az általad betáplált adatok.

Ez sem nem merész, sem nem szokatlan kijelentés. Néhány évtizeddel ezelőtt a mesterséges intelligencia meglehetősen távolinak tűnhetett, de azóta a mesterséges intelligencia és a gépi tanulás nagyon hosszú utat tett meg.

Számítógépes látás segíti a számítógépeket a címkék és képek megértésében és értelmezésében. Ha számítógépét a megfelelő képek használatára oktatja, képessé válik az arc különböző jellemzőinek felismerésére, megértésére és azonosítására, betegségek kimutatására, autonóm járművek vezetésére, valamint életek megmentésére a többdimenziós szervszkennelés segítségével.

Az előrejelzések szerint a Computer Vision piac eléri $ 144.46 milliárd 2028-ra a 7.04-as szerény 2020 milliárd dollárról, ami 45.64 és 2021 között 2028%-os CAGR-rel nő.

A számítógépes látás néhány felhasználási esete a következő:

  • Orvosi képalkotás
  • Autonóm jármű
  • Arc- és tárgyfelismerés
  • Hiba azonosítás
  • Jelenetfelismerés

A képadatkészlet Ön táplálja és oktatja a gépi tanulási és számítógépes látási feladatokat, amelyek kulcsfontosságúak AI-projektje sikeréhez. Nagyon nehéz minőségi adatkészletet szerezni. A projekt összetettségétől függően néhány naptól néhány hétig tarthat, amíg megbízható és releváns adatkészleteket kapunk számítógépes látási célokra.

Itt egy sor (az egyszerűség kedvéért kategorizált) nyílt forráskódú adatkészletet kínálunk Önnek, amelyet azonnal használhat.

A Computer Vision adatkészletek átfogó listája

Általános:

  1. ImageNet (Link)

    Az ImageNet egy széles körben használt adatkészlet, és elképesztő, 1.2 millió képpel rendelkezik 1000 kategóriába sorolva. Ez az adatkészlet a WorldNet hierarchiája szerint van felszerelve, és három részre van osztva – a képzési adatokra, a képcímkékre és az érvényesítési adatokra.

  2. Kinetics 700 (Link)

    A Kinetics 700 egy hatalmas, kiváló minőségű adatkészlet, amely több mint 650,000 700 klipet tartalmaz 700 különböző emberi cselekvési osztályból. Mindegyik csoportos akcióhoz körülbelül XNUMX videoklip tartozik. Az adatkészletben található klipek ember-objektum és ember-ember interakciókat tartalmaznak, amelyek nagyon hasznosnak bizonyulnak az emberi cselekvések felismerésében a videókban.

  3. CIFAR-10 (Link)

    A CIFAR 10 az egyik legnagyobb számítógépes képi adatkészlet, amely 60000 32 32 x 6000 színes képpel büszkélkedhet, amelyek tíz különböző osztályt képviselnek. Minden osztály körülbelül XNUMX képpel rendelkezik, amelyeket számítógépes látási algoritmusok és gépi tanulás betanításához használnak.

Arcfelismerő:

arcfelismerő

  1. Felcímkézett arcok a vadonban (Link)

    A Labeled Faced in the Wild egy hatalmas adatkészlet, amely közel 13,230 ember több mint 5,750 XNUMX képét tartalmazza az internetről. Ezt az arcadatkészletet úgy tervezték, hogy megkönnyítse a korlátlan arcfelismerés tanulmányozását.

  2. CASIA WebFace (Link)

    A CASIA Web face egy jól megtervezett adatkészlet, amely segíti a gépi tanulást és a korlátlan arcfelismerés tudományos kutatását. Több mint 494,000 10,000 képével közel XNUMX XNUMX valódi személyazonosságról, ideális arcazonosítási és -ellenőrzési feladatokhoz.

  3. UMD arcok adatkészlet (Link)

    Az UMD egy jól jegyzett adatkészlettel néz szembe, amely két részből áll – állóképekből és videókockákból. Az adatkészlet több mint 367,800 3.7 arcjegyzetet és XNUMX millió kommentárral ellátott videókockát tartalmaz az alanyokról.

Kézírás felismerés:

  1. MNIST adatbázis (Link)

    Az MNIST egy olyan adatbázis, amely 0 és 9 közötti kézzel írt számjegyeket tartalmaz, és 60,000 10,000 és 1999 XNUMX képzési és tesztelési képpel rendelkezik. Az XNUMX-ben kiadott MNIST megkönnyíti a képfeldolgozó rendszerek tesztelését a Deep Learningben.

  2. Mesterséges karakterek adatkészlete (Link)

    Az Artificial Characters Dataset, ahogy a neve is sugallja, mesterségesen előállított adat, amely tíz nagybetűvel írja le az angol nyelv szerkezetét. Több mint 6000 képpel érkezik.

Beszélgessünk ma az AI képzési adatokkal kapcsolatos követelményeiről.

Objektum észlelése:

  1. MS COCO (Link)

    Az MS COCO vagy a Common Objects in Context egy objektumészlelési és feliratozási adatkészlet.

    Több mint 328,000 80 kép található benne kulcspontérzékeléssel, több objektum észleléssel, feliratozással és szegmentációs maszk megjegyzésekkel. XNUMX tárgykategóriát és képenként öt feliratot tartalmaz.

  2. LSUN(Link)

    Az LSUN, a Large-scale Scene Understanding rövidítése, több mint egymillió címkézett képpel rendelkezik 20 tárgy- és 10 jelenet kategóriában. Egyes kategóriákban közel 300,000 300 kép található, amelyek közül 1000 kifejezetten az érvényesítéshez és XNUMX kép a tesztadatokhoz tartozik.

  3. Otthoni tárgyak(Link)

    A Home Objects adatkészlet a ház körül – konyhából, nappaliból és fürdőszobából – véletlenszerű objektumokról tartalmaz megjegyzésekkel ellátott képeket. Ez az adatkészlet néhány megjegyzésekkel ellátott videót és 398, tesztelésre tervezett, kommentár nélküli fotót is tartalmaz.

Autóipari:

  1. Városkép adatkészlet (Link)

    A városkép az az adathalmaz, amelyhez hozzá kell fordulni, amikor különböző városok utcai jeleneteiből felvett videofelvételeket keresünk. Ezek a képek hosszú időn keresztül, különböző időjárási és fényviszonyok között készültek. A megjegyzések 30 képosztályra vonatkoznak, nyolc különböző kategóriába sorolva.

  2. Barkley Deep Drive (Link)

    A Barkley DeepDrive kifejezetten az autonóm járművek oktatásához készült, és több mint 100 ezer kommentárral ellátott videószekvenciát tartalmaz. Ez az egyik leghasznosabb képzési adat az autonóm járművek számára a változó út- és vezetési viszonyok mellett.

  3. mapillaris (Link)

    A Mapillary több mint 750 millió utcai jelenettel és közlekedési táblával rendelkezik világszerte, ami nagyon hasznos a vizuális észlelési modellek képzésében a gépi tanulásban és az AI algoritmusokban. Lehetővé teszi olyan autonóm járművek fejlesztését, amelyek megfelelnek a különféle világítási és időjárási körülményeknek és nézőpontoknak.

Orvosi képalkotás:

  1. Covid-19 nyílt kutatási adatkészlet (Link)

    Ez az eredeti adatkészlet körülbelül 6500 pixel-sokszögű tüdőszegmentációt tartalmaz az AP/PA mellkasröntgenről. Ezenkívül 517 kép áll rendelkezésre a Covid-19-betegek röntgenfelvételeiről, amelyek címkéi tartalmazzák a nevet, a helyet, a felvételi adatokat, az eredményt és egyebeket.

  2. NIH adatbázis 100,000 XNUMX mellkasröntgenből (Link)

    Az NIH adatbázisa az egyik legkiterjedtebb nyilvánosan elérhető adatkészlet, amely 100,000 XNUMX mellkasröntgen képet és kapcsolódó adatokat tartalmaz, amelyek hasznosak a tudományos és kutatói közösség számára. Még képeket is tartalmaz előrehaladott tüdőbetegségben szenvedő betegekről.

  3. A digitális patológia atlasza (Link)

    Az Atlas of Digital Pathology számos kórszövettani foltképet kínál, összesen több mint 17,000 100-et, a különböző szervek közel XNUMX annotált tárgylemezéről. Ez az adatkészlet hasznos a számítógépes látás és mintafelismerő szoftver fejlesztésében.

Jelenet felismerés:

Jelenet felismerés

  1. Beltéri jelenetfelismerés (Link)

    Az Indoor Scene Recognition egy erősen kategorizált adatkészlet, amely közel 15620 65 objektum- és beltéri tájképből áll, amelyeket gépi tanulásban és adatképzésben használnak fel. Több mint 100 kategóriát tartalmaz, és minden kategóriában legalább XNUMX kép található.

  2. xView (Link)

    Az egyik legismertebb nyilvánosan elérhető adatkészletként az xView rengeteg megjegyzéssel ellátott felső képet tartalmaz különféle összetett és nagy jelenetekről. A mintegy 60 osztályt és több mint egymillió objektumpéldányt tartalmazó adatkészlet célja, hogy jobb katasztrófaelhárítást nyújtson műholdképek segítségével.

  3. Helyek (Link)

    A Places, az MIT által biztosított adatkészlet több mint 1.8 millió képet tartalmaz 365 különböző jelenetkategóriából. Ezekben a kategóriákban körülbelül 50 kép található ellenőrzésre, és 900 kép tesztelésre. Lehetőség van a mély jelenet jellemzőinek elsajátítására a jelenetfelismerési vagy vizuális felismerési feladatok létrehozásához.

Szórakozás:

  1. IMDB WIKI adatkészlet (Link)

    IMDB – A Wiki az egyik legnépszerűbb nyilvános adatbázis a kor, nem és név megfelelően megjelölt arcokról. Körülbelül 20 ezer híresség arca és 62 ezer a Wikipédiáról is szerepel benne.

  2. Celeb arcok (Link)

    A Celeb Faces egy nagyszabású adatbázis, amely 200,000 XNUMX megjegyzésekkel ellátott híresség képét tartalmazza. A képek háttérzajt és pózváltozatokat tartalmaznak, így értékesek a számítógépes látási feladatok edzési tesztkészleteihez. Rendkívül előnyös az arcfelismerés, a szerkesztés, az arcrészek lokalizálása és egyebek nagyobb pontosságának eléréséhez.

Most, hogy hatalmas listája van a nyílt forráskódú képadatkészleteknek, amelyek táplálják mesterséges intelligencia-gépezetét. A mesterséges intelligencia és a gépi tanulási modellek eredménye elsősorban a betáplált és betanított adatkészletek minőségétől függ. Ha azt szeretné, hogy mesterséges intelligencia-modellje pontos előrejelzéseket adjon, akkor minőségi adatkészletekre van szüksége, amelyek aggregált, címkézett és tökéletesre címkézett. A számítógépes látásrendszer sikerének felerősítése érdekében minőségi képadatbázisokat kell használnia, amelyek relevánsak a projekt jövőképéhez. Ha több ilyen adatkészletet keres Kattints ide

Közösségi megosztás

Még szintén kedvelheted