As ons met kunsmatige intelligensie (KI) te make het, erken ons soms net die doeltreffendheid en akkuraatheid van die besluitnemingstelsel. Ons kan nie die ongekende stryd van AI-implementasies aan die ander kant van die spektrum identifiseer nie. As gevolg hiervan belê maatskappye te veel in hul ambisies en eindig hulle met 'n oorweldigende ROI. Ongelukkig is dit 'n scenario wat baie ondernemings ervaar wanneer hulle die proses van implementering van KI ondergaan.
Nadat u die oorsake van 'n swak ROI, insluitend ondoeltreffende AI-stelsels, vertraagde bekendstellings van die produk, of enige ander tekortkominge rakende AI-implementering, nagegaan het, is die algemene faktor wat blootgestel word gewoonlik slegte data.
Datawetenskaplikes kan net soveel doen. As hulle met onvoldoende datastelle aangebied word, sal hulle geen nuttige inligting herwin nie. Dikwels moet hulle werk met data wat onbruikbaar, onakkuraat, irrelevant of al die bogenoemde is. Die koste van slegte data word vinnig finansieel en tegnies duidelik nadat die inligting in 'n projek geïmplementeer moet word.
Volgens 'n opname deur TechRepublic wat gefokus het op die bestuur van AI en ML, het slegte data 59% van die ondernemings wat deelgeneem het, die vraag verkeerd bereken. Daarbenewens het 26% van die respondente uiteindelik die verkeerde vooruitsigte geteiken.
Hierdie pos sal die gevolge van slegte data ondersoek en hoe u vermy om hulpbronne te vermy en 'n beduidende ROI uit u KI-opleidingsfase te genereer.
Laat ons begin.
Wat is slegte data?
Garbage in Garbage Out is die protokol wat gevolg word deur masjienleerstelsels. As u slegte data vir opleidingsdoeleindes in u ML-module invoer, sal dit slegte resultate lewer. As u data van lae gehalte in u stelsel invoer, kan u produk of diens gebrek ly. Om die begrip slegte data verder te begryp, is hieronder drie algemene voorbeelde:
- Enige data wat verkeerd is - byvoorbeeld telefoonnommers in die plek van e-posadresse
- Onvolledige of ontbrekende data - as belangrike waardes nie bestaan nie, is die data nie nuttig nie
- Bevooroordeelde data - die integriteit van die data en die resultate daarvan word in gevaar gestel as gevolg van vrywillige of onwillekeurige benadeling
Die gegewens waarmee analiste aangebied word om AI-modules op te lei, is meestal nutteloos. Gewoonlik bestaan daar ten minste een van die voorbeelde hierbo. Om met onakkurate inligting te werk, dwing die wetenskaplikes om hul kosbare tyd te spandeer aan die skoonmaak van data in plaas daarvan om dit te ontleed of hul stelsels op te lei.
'N Toestand van datawetenskap en -analise verslag blyk dat byna 24% van die wetenskaplikes tot 20 uur van hul tyd spandeer om data te soek en voor te berei. Die studie het ook bevind dat 'n ekstra 22% 10-19 uur bestee het aan slegte data in plaas van hul kundigheid te gebruik om doeltreffender stelsels te bou.
Noudat ons slegte data kan herken, kan ons bespreek hoe dit u ambisies met AI kan bereik.
Die gevolge van slegte data oor u besigheid
Kom ons neem 'n stap terug om te verduidelik in watter mate daar slegte data oor u doelwitte is. As 'n datawetenskaplike tot 80% van hul tyd spandeer om data te skoonmaak, daal produktiwiteit dramaties (individueel en gesamentlik). U finansiële middele word toegewys aan 'n hoogs gekwalifiseerde span wat die meeste van sy tyd aan oortollige werk spandeer.
Laat dit wasbak .
U mors nie net geld deur 'n hoogs gekwalifiseerde professionele persoon te betaal om data in te voer nie, maar die tydsduur wat nodig is om u AI -stelsels op te lei, word ook uitgestel weens die gebrek aan kwaliteit data (u projekte neem 40% meer tyd om te voltooi). Die vinnige bekendstelling van die produk is heeltemal van die tafel af, wat u mededingers 'n mededingende voordeel gee as hulle hul data -wetenskaplikes doeltreffend benut.
Slegte data is nie net tydrowend om te hanteer nie. Dit kan ook bronne uit 'n tegniese perspektief tap. Hieronder is 'n paar belangrike gevolge:
- Die instandhouding en berging van slegte data is duur met betrekking tot tyd en koste.
- Slegte data kan finansiële hulpbronne tap. Studies toon dat besighede wat slegte data hanteer, byna 9.7 miljoen vermors.
- As u eindproduk onakkuraat, stadig of irrelevant is, sal u die geloofwaardigheid vinnig verloor.
- Slegte data kan u AI-projekte belemmer, omdat die meeste maatskappye nie die vertragings met die skoonmaak van onvoldoende datastelle herken nie.
Hoe kan sake-eienaars slegte data vermy?
Die mees logiese oplossing is om voorbereid te wees. As u 'n goeie visie en stel doelwitte het vir u ambisies om AI te implementeer, kan dit sake-eienaars help om baie probleme wat verband hou met slegte data te vermy. Die volgende is om 'n sinvolle strategie te hê om alle waarskynlike gebruiksgevalle met AI-stelsels af te breek.
Sodra die onderneming korrek voorberei is vir AI -implementering, is die volgende stap om met 'n ervare te werk versamelaar van data soos kundiges van Shaip, om relevante inligting op maat vir u projek op te spoor, aan te teken en aan te bied. By Shaip het ons 'n ongelooflike werkswyse rakende die insameling en aantekening van data. Nadat ons in die verlede met honderde kliënte gewerk het, verseker ons dat u die kwaliteit van die data -kwaliteit in elke stap van die AI -implementeringsproses nagekom word.
Ons volg streng maatstawwe vir kwaliteitsbeoordeling om die data wat ons versamel te kwalifiseer en implementeer 'n lugdigte prosedure vir die bestuur van slegte data. Met ons metodes kan u u AI-stelsels oplei met die akkuraatste en akkuraatste data wat in u nis beskikbaar is.
Bespreek vandag nog 'n een-tot-een-konsultasie om u AI-opleidingsdatastrategie te versnel.