Rekenaarvisie

31 Gratis Beelddatastelle vir Rekenaarvisie om Jou Projek te Versterk [2025 Opgedateer]

’n KI-algoritme is net so goed soos die data wat jy dit voer.

Dit is nie 'n gewaagde of 'n onkonvensionele stelling nie. KI kon 'n paar dekades gelede nogal vergesog gelyk het, maar kunsmatige intelligensie en masjienleer het sedertdien 'n baie lang pad gevorder.

Rekenaarvisie help rekenaars om etikette en beelde te verstaan ​​en te interpreteer. Wanneer jy jou rekenaar oplei deur die regte soort beelddatastelle te gebruik, kan dit die vermoë verkry om verskeie gesigstrekke op te spoor, te verstaan ​​en te identifiseer, siektes op te spoor, outonome voertuie te bestuur, en ook lewens te red deur middel van multidimensionele orgaanskandering.

Daar word voorspel dat die rekenaarvisiemark sal bereik Teen 144.46 $ 2028 miljard van 'n beskeie $7.04 miljard in 2020, groei by 'n CAGR van 45.64% tussen 2021 en 2028.

Die beelddatastel wat jy aan jou masjienleer- en rekenaarvisietake voed en oplei, is van kardinale belang vir die sukses van jou KI-projek. 'n Gehaltedatastel is nogal moeilik om te bekom. Die gebruik van 'n diverse versameling beelde is noodsaaklik om robuuste modelopleiding te verseker en om werklike kompleksiteit beter te weerspieël.

Afhangende van die kompleksiteit van jou projek, kan dit enige plek tussen 'n paar dae en 'n paar weke neem om betroubare en relevante datastelle vir rekenaarvisiedoeleindes te kry. 'n Diverse reeks datastelle is nodig om verskeie rekenaarvisietake en werklike scenario's te dek. Navorsers soek dikwels 'n aansienlike datastel vir navorsingsdoeleindes om omvattende model-evaluering te verseker en 'n wye reeks toepassings te ondersteun.

Hier bied ons jou 'n reeks (gekategoriseer vir jou gemak) van oopbron-beelddatastelle wat jy dadelik kan gebruik.

Beelddatasteltake: Klassifikasie, Segmentering, Deteksie en Meer

Beelddatastelle is die ruggraat van moderne rekenaarvisie, wat 'n wye reeks take aandryf wat masjiene in staat stel om visuele inligting te interpreteer en te verstaan. Of jy nou 'n model vir outonome voertuie bou, gesigsherkenningstegnologie ontwikkel of aan mediese beeldontleding werk, die regte beelddatastel is 'n noodsaaklike hulpmiddel vir sukses.

Beeld klassifikasie is een van die mees fundamentele rekenaarvisietake. In hierdie proses leer 'n model om 'n etiket aan 'n hele beeld toe te ken gebaseer op die inhoud daarvan. Byvoorbeeld, 'n beeldklassifikasiedatastel kan 'n model help om te onderskei tussen beelde van katte en honde, of om verskillende soorte plante te identifiseer. Hierdie taak is van kritieke belang vir toepassings soos outomatiese foto-etikettering, siektediagnose vanaf mediese beelde en toneelkategoriseringsmaatstawwe.

Voorwerpopsporing neem dinge 'n stap verder deur nie net die teenwoordigheid van voorwerpe binne 'n beeld te identifiseer nie, maar ook hul liggings met behulp van omgrensblokkies te bepaal. Datastelle vir voorwerpopsporing, soos dié wat geannoteerde beelde met omgrensblokkies bevat, is noodsaaklik vir toepassings soos voetgangeropsporing in outonome voertuie, sekuriteitsbewaking en kleinhandelanalise. Voorwerpopsporing is ook 'n sleutelkomponent in die ontwikkeling van robuuste rekenaarvisie-algoritmes vir werklike scenario's.

Semantiese segmentering behels die klassifikasie van elke pixel in 'n beeld in 'n spesifieke kategorie, wat 'n gedetailleerde begrip van die toneel bied. Hierdie pixelvlak-trimmapsegmentering is veral belangrik in take soos mediese beeldvorming, waar presiese afbakening van organe of gewasse vereis word, en in stedelike omgewings vir outonome bestuur, waar die onderskeid tussen paaie, sypaadjies en voertuie van kritieke belang is.

Benewens hierdie kerntake, ondersteun beelddatastelle ook instansiesegmentering (onderskeid tussen individuele voorwerpe van dieselfde klas), beeldonderskrifte (generering van beskrywende teks vir beelde) en gesigsherkenning (identifikasie of verifikasie van menslike gesigte in beelde). Elk van hierdie rekenaarvisietake maak staat op hoëgehalte, geannoteerde beelde om masjienleermodelle op te lei en te valideer.

Deur gebruik te maak van diverse en goed geannoteerde beelddatastelle, kan datawetenskaplikes en masjienleerpraktisyns 'n verskeidenheid rekenaarvisie-uitdagings aanpak, van beeldherkenning- en klassifikasietake tot komplekse segmenterings- en opsporingsprobleme. Die regte datastel versnel nie net navorsing en ontwikkeling nie, maar verseker ook dat rekenaarvisiestelsels akkuraat in werklike toepassings presteer.

Omvattende lys van beelddatastelle om u rekenaarvisiemodel op te lei

Algemeen:

  1. IMAGEnet

    ImageNet is 'n wyd gebruikte datastel, en dit kom met 'n verstommende 1.2 miljoen beelde wat in 1000 kategorieë gekategoriseer is. Hierdie datastel word volgens die WorldNet-hiërargie georganiseer en in drie dele gekategoriseer – die opleidingsdata, beeldetikette en valideringsdata.

  2. Kinetika 700

    Kinetics 700 is 'n groot datastel van hoë gehalte met meer as 650,000 700 snitte van 700 verskillende menslike aksieklasse. Elk van die klasaksies het ongeveer XNUMX videogrepe. Die snitte in die datastel het mens-objek en mens-mens-interaksies, wat baie nuttig blyk te wees wanneer menslike handelinge in video's herken word.

  3. CIFAR-10

    CIFAR 10 is een van die grootste rekenaarvisie-datastelle wat spog met 60000 32 32 x 6000 kleurbeelde wat tien verskillende klasse verteenwoordig. Elke klas het ongeveer XNUMX beelde wat gebruik word om rekenaarvisie-algoritmes en masjienleer op te lei.

  4. Oxford-IIIT Troeteldierbeelde-datastel

    Die troeteldierbeelddatastel bestaan ​​uit 37 kategorieë met 200 beelde per klas. Hierdie beelde verskil in skaal, houding en beligting, en word vergesel van aantekeninge vir ras, kop ROI en pixelvlak trimap segmentering.

  5. Google se oop beelde

    Met 'n indrukwekkende 9 miljoen URL's, is dit een van die grootste beelddatastelle op die lys, wat miljoene beelde bevat wat oor 6,000 XNUMX kategorieë gemerk is.

  6. Plant Beelde

    Hierdie samestelling sluit veelvuldige beelddatastelle in wat 'n indrukwekkende 1 miljoen plantbeelde bevat, wat ongeveer 11 spesies dek.

  7. LSUN

    LSUN is 'n grootskaalse beelddatastel met miljoene geëtiketteerde beelde in verskeie toneel- en voorwerpkategorieë. Die datastel sluit 'n toegewyde toetsstel vir model-evaluering in.

Gesigsherkenning:

Gesigherkenning

  1. Gemerkte gesigte in die natuur

    Gemerk Faced in the Wild is 'n groot datastel wat meer as 13,230 5,750 beelde bevat van byna XNUMX XNUMX mense wat op die internet opgespoor is. Hierdie datastel van gesigte is ontwerp om dit makliker te maak om onbeperkte gesigbespeuring te bestudeer.

  2. CASIA WebFace

    CASIA Web face is 'n goed ontwerpte datastel wat masjienleer en wetenskaplike navorsing oor onbeperkte gesigsherkenning help. Met meer as 494,000 10,000 beelde van byna XNUMX XNUMX regte identiteite, is dit ideaal vir gesigidentifikasie en verifikasietake.

  3. UMD Faces Dataset

    UMD staar 'n goed geannoteerde datastel in die gesig wat twee dele bevat - stilbeelde en videorame. Die datastel het meer as 367,800 3.7 gesigaantekeninge en XNUMX miljoen geannoteerde videorame van onderwerpe.

  4. Gesigmasker-opsporing

    Hierdie datastel bevat 853 beelde wat in drie klasse gekategoriseer is: "met masker," "sonder masker," en "masker wat verkeerd gedra is," saam met hul grenskassies in PASCAL VOC-formaat.

  5. FERET

    Die FERET (Gesigsherkenningstegnologie-databasis) is 'n omvattende beelddatastel wat meer as 14,000 XNUMX geannoteerde beelde van menslike gesigte bevat.

Handskrifherkenning:

  1. MNIST-databasis

    MNIST is 'n databasis wat voorbeelde van handgeskrewe syfers van 0 tot 9 bevat, en dit het 60,000 10,000 en 1999 XNUMX opleidings- en toetsbeelde. MNIST, wat in XNUMX vrygestel is, maak dit makliker om beeldverwerkingstelsels in Deep Learning te toets.

  2. Kunsmatige karakters-datastel

    Kunsmatige Karakters Datastel is, soos die naam aandui, kunsmatig gegenereerde data wat die Engelse taalstruktuur in tien hoofletters beskryf. Dit kom met meer as 6000 beelde.

Voorwerpopsporing:

  1. MS COCO

    MS COCO of Common Objects in Context is 'n objekbespeurings- en onderskrifte-datastel.

    Dit het meer as 328,000 80 beelde met sleutelpuntbespeuring, multi-voorwerpbespeuring, onderskrifte en segmenteringsmaskeraantekeninge. Dit kom met XNUMX voorwerpkategorieë en vyf byskrifte per prent.

  2. LSUN

    LSUN, kort vir Large-scale Scene Understanding, het meer as 'n miljoen benoemde beelde in 20 voorwerp- en 10 toneelkategorieë. Sommige kategorieë het byna 300,000 300 beelde, met 1000 beelde spesifiek vir validering en XNUMX beelde vir toetsdata.

  3. Tuisvoorwerpe

    Home Objects-datastel bevat geannoteerde beelde van ewekansige voorwerpe van regoor die huis – kombuis, sitkamer en badkamer. Hierdie datastel het ook 'n paar geannoteerde video's en 398 ongeannoteerde foto's wat ontwerp is vir toetsing.

  4. Visuele genoom

    Visual Genome is 'n omvattende visuele kennisbasis met meer as 108,000 XNUMX beelde met onderskrifte. Dit bied uitgebreide aantekeninge vir voorwerpe, eienskappe en verwantskappe, wat dit waardevol maak vir voorwerpherkenning, beeldonderskrifte en multimodale leertake.

Automotive:

  1. Stadsbeeld-datastel

    Cityscape is die datastel om na te gaan wanneer jy soek na verskeie video-reekse wat opgeneem is van verskeie aanhalings se straattonele. Hierdie beelde is oor 'n lang tyd en in verskillende weer- en ligtoestande geneem. Die aantekeninge is vir 30 klasse beelde wat in agt verskillende kategorieë verdeel is.

  2. Barkley Deep Drive

    Barkley DeepDrive is spesifiek ontwerp vir outonome voertuigopleiding, en dit het meer as 100 duisend geannoteerde videoreekse. Dit is een van die nuttigste opleidingsdata vir outonome voertuie deur die veranderende pad- en rytoestande.

  3. Mapillêre

    Mapillary het meer as 750 miljoen straattonele en verkeerstekens wêreldwyd, wat baie nuttig is om visuele persepsiemodelle in masjienleer en KI-algoritmes op te lei. Dit laat jou toe om outonome voertuie te ontwikkel wat voorsiening maak vir verskeie beligting en weerstoestande en uitsig.

Mediese beeldvorming:

  1. Covid-19 oop navorsingsdatastel

    Hierdie oorspronklike datastel het ongeveer 6500 pixel-veelhoekige longsegmentasies oor AP/PA borskas x-strale. Boonop is 517 beelde van Covid-19 pasiënt x-strale met etikette wat die naam, ligging, toelatingsbesonderhede, uitkoms en meer bevat, beskikbaar.

  2. NIH-databasis van 100,000 XNUMX borskas X-strale

    Die NIH-databasis is een van die mees uitgebreide publiek beskikbare datastelle wat 100,000 XNUMX borskas x-stralebeelde en verwante data bevat wat nuttig is vir die wetenskaplike en navorsingsgemeenskap. Dit het selfs beelde van pasiënte met gevorderde longtoestande.

  3. Atlas van digitale patologie

    Atlas of Digital Pathology bied verskeie histopatologiese pleisterbeelde, meer as 17,000 100 in totaal, van byna XNUMX geannoteerde skyfies van verskillende organe. Hierdie datastel is nuttig in die ontwikkeling van rekenaarvisie en patroonherkenningsagteware.

Toneelherkenning:

Toneelherkenning

  1. Binnenshuise toneelherkenning

    Binne-toneelherkenning is 'n hoogs gekategoriseerde datastel met byna 15620 beelde van voorwerpe en binnenshuise natuurskoon wat gebruik kan word in masjienleer en data-opleiding. Dit kom met meer as 65 kategorieë, en elke kategorie het 'n minimum van 100 beelde.

  2. x Kyk

    As een van die bekendste publiek beskikbare datastelle, bevat xView tonne geannoteerde oorhoofse beelde van verskeie komplekse en groot tonele. Met ongeveer 60 klasse en meer as 'n miljoen voorwerpgevalle, is die doel van hierdie datastel om beter rampverligting te verskaf deur satellietbeelde te gebruik.

  3. Plekke

    Places, 'n datastel wat deur MIT bygedra is, het meer as 1.8 miljoen beelde van 365 verskillende toneelkategorieë. Daar is ongeveer 50 beelde in elk van hierdie kategorieë vir validering en 900 beelde vir toetsing. Dit is moontlik om diep toneelkenmerke te leer om toneelherkenning of visuele herkenningstake te vestig.

  4. SUN-databasis

    Die SUN-databasis is 'n omvattende toneelkategoriseringsmaatstaf wat wyd gebruik word in rekenaarvisie. Dit bevat duisende beelde wat 'n wye reeks binne- en buite-omgewings dek, met gedetailleerde aantekeninge vir elke toneel. Die SUN-databasis word erken vir sy dekking van verskillende tonele en dien as 'n standaardverwysing vir die evaluering van toneelbegripalgoritmes.

Vermaak en Kuns:

  1. IMDB WIKI-datastel

    IMDB – Wiki is een van die gewildste publieke databasisse van gesigte wat voldoende geëtiketteer is met ouderdom, geslag en name. Dit het ook ongeveer 20 duisend gesigte van bekendes en 62 duisend van Wikipedia.

  2. Bekende gesigte

    Celeb Faces is 'n grootskaalse databasis met 200,000 XNUMX geannoteerde beelde van bekendes. Die beelde kom met agtergrondgeraas en posevariasies, wat hulle waardevol maak vir opleidingstoetsstelle in rekenaarvisietake. Dit is baie voordelig vir die bereiking van hoër akkuraatheid in gesigsherkenning, redigering, lokalisering van gesigsdele, en meer.

  3. YouTube-8M-datastel

    YouTube-8M is 'n grootskaalse geëtiketteerde videodatastel wat miljoene YouTube-video-ID's bevat met hoëgehalte-masjiengegenereerde aantekeninge van visuele entiteite. Hierdie datastel word wyd gebruik vir grootskaalse video-begrip en opleiding van visie-algoritmes, aangesien dit video-inhoud aan metadata koppel deur YouTube-video-ID's, wat skaalbare versameling en aantekening van videodata moontlik maak.

Noudat jy 'n massiewe lys oopbron-beelddatastelle het om jou kunsmatige intelligensie-masjinerie aan te dryf, hang die uitkoms van jou KI- en masjienleermodelle hoofsaaklik af van die kwaliteit van die datastelle waarop jy hulle voed en oplei. As jy wil hê jou KI-model moet akkurate voorspellings lewer, benodig dit kwaliteitdatastelle wat perfek saamgevoeg, gemerk en geëtiketteer is. Om met hierdie datastelle te werk, is 'n uitstekende manier om jou masjienleervaardighede te ontwikkel en te verbeter deur middel van praktiese, werklike projekte. Om die sukses van jou rekenaarvisiestelsel te versterk, moet jy kwaliteitbeelddatabasisse gebruik wat relevant is vir jou projekvisie.

Sosiale Deel