’n KI-algoritme is net so goed soos die data wat jy dit voer.
Dit is nie 'n gewaagde of 'n onkonvensionele stelling nie. KI kon 'n paar dekades gelede nogal vergesog gelyk het, maar kunsmatige intelligensie en masjienleer het sedertdien 'n baie lang pad gevorder.
Rekenaarvisie help rekenaars om etikette en beelde te verstaan en te interpreteer. Wanneer jy jou rekenaar oplei deur die regte soort beelddatastelle te gebruik, kan dit die vermoë kry om verskeie gelaatstrekke op te spoor, te verstaan en te identifiseer, siektes op te spoor, outonome voertuie te bestuur en ook lewens te red deur multidimensionele orgaanskandering te gebruik.
Daar word voorspel dat die rekenaarvisiemark sal bereik $ 144.46 Miljard teen 2028 van 'n beskeie $7.04 miljard in 2020, wat teen 'n CAGR van 45.64% tussen 2021 en 2028 groei.
Die beelddatastel jy voed en oefen jou Masjienleer- en rekenaarvisietake op is deurslaggewend vir jou KI-projek se sukses. 'n Kwaliteit datastel is nogal moeilik om te kry. Afhangende van die kompleksiteit van jou projek, kan dit enige plek tussen 'n paar dae tot 'n paar weke neem om betroubare en relevante datastelle vir rekenaarvisiedoeleindes te kry.
Hier bied ons jou 'n reeks (gekategoriseer vir jou gemak) van oopbron-beelddatastelle wat jy dadelik kan gebruik.
Omvattende lys van beelddatastelle om u rekenaarvisiemodel op te lei
Algemeen:
IMAGEnet
ImageNet is 'n wyd gebruikte datastel, en dit kom met 'n verstommende 1.2 miljoen beelde wat in 1000 kategorieë gekategoriseer is. Hierdie datastel word volgens die WorldNet-hiërargie georganiseer en in drie dele gekategoriseer – die opleidingsdata, beeldetikette en valideringsdata.
Kinetika 700
Kinetics 700 is 'n groot datastel van hoë gehalte met meer as 650,000 700 snitte van 700 verskillende menslike aksieklasse. Elk van die klasaksies het ongeveer XNUMX videogrepe. Die snitte in die datastel het mens-objek en mens-mens-interaksies, wat baie nuttig blyk te wees wanneer menslike handelinge in video's herken word.
CIFAR-10
CIFAR 10 is een van die grootste rekenaarvisie-datastelle wat spog met 60000 32 32 x 6000 kleurbeelde wat tien verskillende klasse verteenwoordig. Elke klas het ongeveer XNUMX beelde wat gebruik word om rekenaarvisie-algoritmes en masjienleer op te lei.
Oxford-IIIT Troeteldierbeelde-datastel
Die troeteldierbeelddatastel bestaan uit 37 kategorieë met 200 beelde per klas. Hierdie beelde verskil in skaal, houding en beligting, en word vergesel van aantekeninge vir ras, kop ROI en pixelvlak trimap segmentering.
Google se oop beelde
Met 'n indrukwekkende 9 miljoen URL's, is dit een van die grootste beelddatastelle op die lys, wat miljoene beelde bevat wat oor 6,000 XNUMX kategorieë gemerk is.
Plant Beelde
Hierdie samestelling sluit veelvuldige beelddatastelle in wat 'n indrukwekkende 1 miljoen plantbeelde bevat, wat ongeveer 11 spesies dek.
Gesigsherkenning:
Gemerkte gesigte in die natuur
Gemerk Faced in the Wild is 'n groot datastel wat meer as 13,230 5,750 beelde bevat van byna XNUMX XNUMX mense wat op die internet opgespoor is. Hierdie datastel van gesigte is ontwerp om dit makliker te maak om onbeperkte gesigbespeuring te bestudeer.
CASIA WebFace
CASIA Web face is 'n goed ontwerpte datastel wat masjienleer en wetenskaplike navorsing oor onbeperkte gesigsherkenning help. Met meer as 494,000 10,000 beelde van byna XNUMX XNUMX regte identiteite, is dit ideaal vir gesigidentifikasie en verifikasietake.
UMD Faces Dataset
UMD staar 'n goed geannoteerde datastel in die gesig wat twee dele bevat - stilbeelde en videorame. Die datastel het meer as 367,800 3.7 gesigaantekeninge en XNUMX miljoen geannoteerde videorame van onderwerpe.
Gesigmasker-opsporing
Hierdie datastel bevat 853 beelde wat in drie klasse gekategoriseer is: "met masker," "sonder masker," en "masker wat verkeerd gedra is," saam met hul grenskassies in PASCAL VOC-formaat.
FERET
Die FERET (Gesigsherkenningstegnologie-databasis) is 'n omvattende beelddatastel wat meer as 14,000 XNUMX geannoteerde beelde van menslike gesigte bevat.
Handskrifherkenning:
MNIST-databasis
MNIST is 'n databasis wat voorbeelde van handgeskrewe syfers van 0 tot 9 bevat, en dit het 60,000 10,000 en 1999 XNUMX opleidings- en toetsbeelde. MNIST, wat in XNUMX vrygestel is, maak dit makliker om beeldverwerkingstelsels in Deep Learning te toets.
Kunsmatige karakters-datastel
Kunsmatige Karakters Datastel is, soos die naam aandui, kunsmatig gegenereerde data wat die Engelse taalstruktuur in tien hoofletters beskryf. Dit kom met meer as 6000 beelde.
Voorwerpopsporing:
MS COCO
MS COCO of Common Objects in Context is 'n objekbespeurings- en onderskrifte-datastel.
Dit het meer as 328,000 80 beelde met sleutelpuntbespeuring, multi-voorwerpbespeuring, onderskrifte en segmenteringsmaskeraantekeninge. Dit kom met XNUMX voorwerpkategorieë en vyf byskrifte per prent.
LSUN
LSUN, kort vir Large-scale Scene Understanding, het meer as 'n miljoen benoemde beelde in 20 voorwerp- en 10 toneelkategorieë. Sommige kategorieë het byna 300,000 300 beelde, met 1000 beelde spesifiek vir validering en XNUMX beelde vir toetsdata.
Tuisvoorwerpe
Home Objects-datastel bevat geannoteerde beelde van ewekansige voorwerpe van regoor die huis – kombuis, sitkamer en badkamer. Hierdie datastel het ook 'n paar geannoteerde video's en 398 ongeannoteerde foto's wat ontwerp is vir toetsing.
Automotive:
Stadsbeeld-datastel
Cityscape is die datastel om na te gaan wanneer jy soek na verskeie video-reekse wat opgeneem is van verskeie aanhalings se straattonele. Hierdie beelde is oor 'n lang tyd en in verskillende weer- en ligtoestande geneem. Die aantekeninge is vir 30 klasse beelde wat in agt verskillende kategorieë verdeel is.
Barkley Deep Drive
Barkley DeepDrive is spesifiek ontwerp vir outonome voertuigopleiding, en dit het meer as 100 duisend geannoteerde videoreekse. Dit is een van die nuttigste opleidingsdata vir outonome voertuie deur die veranderende pad- en rytoestande.
Mapillêre
Mapillary het meer as 750 miljoen straattonele en verkeerstekens wêreldwyd, wat baie nuttig is om visuele persepsiemodelle in masjienleer en KI-algoritmes op te lei. Dit laat jou toe om outonome voertuie te ontwikkel wat voorsiening maak vir verskeie beligting en weerstoestande en uitsig.
Mediese beeldvorming:
Covid-19 oop navorsingsdatastel
Hierdie oorspronklike datastel het ongeveer 6500 pixel-veelhoekige longsegmentasies oor AP/PA borskas x-strale. Boonop is 517 beelde van Covid-19 pasiënt x-strale met etikette wat die naam, ligging, toelatingsbesonderhede, uitkoms en meer bevat, beskikbaar.
NIH-databasis van 100,000 XNUMX borskas X-strale
Die NIH-databasis is een van die mees uitgebreide publiek beskikbare datastelle wat 100,000 XNUMX borskas x-stralebeelde en verwante data bevat wat nuttig is vir die wetenskaplike en navorsingsgemeenskap. Dit het selfs beelde van pasiënte met gevorderde longtoestande.
Atlas van digitale patologie
Atlas of Digital Pathology bied verskeie histopatologiese pleisterbeelde, meer as 17,000 100 in totaal, van byna XNUMX geannoteerde skyfies van verskillende organe. Hierdie datastel is nuttig in die ontwikkeling van rekenaarvisie en patroonherkenningsagteware.
Toneelherkenning:
Binnenshuise toneelherkenning
Binne-toneelherkenning is 'n hoogs gekategoriseerde datastel met byna 15620 beelde van voorwerpe en binnenshuise natuurskoon wat gebruik kan word in masjienleer en data-opleiding. Dit kom met meer as 65 kategorieë, en elke kategorie het 'n minimum van 100 beelde.
x Kyk
As een van die bekendste publiek beskikbare datastelle, bevat xView tonne geannoteerde oorhoofse beelde van verskeie komplekse en groot tonele. Met ongeveer 60 klasse en meer as 'n miljoen voorwerpgevalle, is die doel van hierdie datastel om beter rampverligting te verskaf deur satellietbeelde te gebruik.
Plekke
Places, 'n datastel wat deur MIT bygedra is, het meer as 1.8 miljoen beelde van 365 verskillende toneelkategorieë. Daar is ongeveer 50 beelde in elk van hierdie kategorieë vir validering en 900 beelde vir toetsing. Dit is moontlik om diep toneelkenmerke te leer om toneelherkenning of visuele herkenningstake te vestig.
Vermaak en Kuns:
IMDB WIKI-datastel
IMDB – Wiki is een van die gewildste publieke databasisse van gesigte wat voldoende geëtiketteer is met ouderdom, geslag en name. Dit het ook ongeveer 20 duisend gesigte van bekendes en 62 duisend van Wikipedia.
Bekende gesigte
Celeb Faces is 'n grootskaalse databasis met 200,000 XNUMX geannoteerde beelde van bekendes. Die beelde kom met agtergrondgeraas en posevariasies, wat hulle waardevol maak vir opleidingstoetsstelle in rekenaarvisietake. Dit is baie voordelig vir die bereiking van hoër akkuraatheid in gesigsherkenning, redigering, lokalisering van gesigsdele, en meer.
Noudat jy 'n massiewe lys oopbron-beelddatastelle het om jou kunsmatige intelligensie-masjinerie aan te wakker. Die uitkoms van jou KI- en masjienleermodelle hang hoofsaaklik af van die kwaliteit van datastelle waarmee jy hulle voed en oplei. As jy wil hê dat jou KI-model akkurate voorspellings moet oplewer, benodig dit kwaliteit datastelle wat saamgevoeg, gemerk en tot perfeksie geëtiketteer is. Om jou rekenaarvisiestelsel se sukses te versterk, moet jy kwaliteit beelddatabasisse gebruik wat relevant is vir jou projekvisie. As jy meer sulke datastelle soek Klik Hier