Vandag het ons 'n paar pratende robotte soos kletsbotte, virtuele assistente, en meer in ons huise, motorstelsels, draagbare toestelle, tuisoutomatiseringsoplossings, ens. Hierdie toestelle luister presies na wat ons sê en hoe ons sê en kry resultate of voer spesifieke take uit .
En as jy 'n assistent gebruik het soos Siri of Alexa, sou jy ook besef dat hulle by die dag eienaardiger word. Hulle antwoorde is geestig, hulle praat terug, hulle snik, gee komplimente terug en tree meer menslik op as sommige van die kollegas wat jy dalk ken. Ons maak nie 'n grap nie. Volgens PwC, 27% van die gebruikers wat interaksie gehad het met hul onlangse kliëntediens-medewerker, het nie geweet of hulle met 'n mens of 'n chatbot praat nie.
Die ontwikkeling van sulke ingewikkelde gesprekstelsels en toestelle is hoogs kompleks en skrikwekkend. Dit is heeltemal 'n ander balspel met duidelike ontwikkelingsbenaderings. Daarom het ons gedink ons moet dit vir jou afbreek vir makliker begrip. Dus, as jy op soek is na 'n gesprek-KI-enjin of 'n virtuele assistent, sal hierdie gids jou help om duidelikheid te kry.
Belangrikheid van Gespreks-KI
Soos tegnologie 'n meer integrale aspek van ons lewens word in die vorm van nuwer toestelle en stelsels, ontstaan daar 'n behoefte om hindernisse uit te stoot, konvensies te breek en met nuwe maniere vorendag te kom om daarmee te kommunikeer. Van eenvoudig die gebruik van gekoppelde randapparatuur soos muis en sleutelbord, het ons oorgeskakel na muisblokkies wat meer gerief bied. Ons het toe na raakskerms gemigreer wat verdere gerief in die voerinsette en die uitvoering van take bied.
Met toestelle wat uitbreidings van onsself word, ontsluit ons nou 'n nuwe medium van opdrag deur stem. Ons hoef nie eers naby 'n toestel te wees om dit te gebruik nie. Al wat ons hoef te doen is om ons stem te gebruik om dit te ontsluit en ons insette te beveel. Vanuit 'n nabygeleë kamer, wanneer jy bestuur, terwyl jy 'n ander toestel gelyktydig gebruik, voer gesprek-KI ons beoogde take naatloos uit. So waar begin ons – dit begin alles met hoë kwaliteit spraakdata om ML-modelle op te lei.
Die basiese beginsels van die insameling van spraakopleidingsdata
Die versameling en annotering van KI-opleidingsdata vir gesprekke-KI is baie anders. Daar is tonne ingewikkeldhede betrokke by menslike opdragte en diverse maatreëls moet geïmplementeer word om te verseker dat elke aspek geakkommodeer word vir impakvolle resultate. Kom ons kyk wat sommige van die grondbeginsels van spraakdata is.
Natuurlike taalbegrip (NLU)
Vir kletsbotte en virtuele assistente om te verstaan en te reageer op wat ons teks of beveel, 'n proses genoem NLU geïmplementeer word. Dit staan vir Natuurlike taalbegrip en behels drie tegnologiekonsepte om diverse insettipes te interpreteer en te verwerk.
Voorneme
Dit begin alles met opset. Wat probeer 'n spesifieke gebruiker om deur middel van 'n opdrag oor te dra, te kommunikeer of te bereik? Is die gebruiker op soek na inligting? Wag hulle vir opdaterings vir 'n aksie? Gee hulle 'n opdrag vir die stelsel om uit te voer? Hoe beveel hulle dit? Is dit deur 'n vraag of 'n versoek? Al hierdie aspekte help masjiene om bedoelings en doeleindes te verstaan en te klassifiseer om onderskeidelik met lugdigte reaksies vorendag te kom.
Uitingversameling
Daar is 'n verskil tussen die opdrag," Waar is die naaste OTM?" en die opdrag," Soek vir my 'n nabygeleë OTM." Nou sal mense erken dat albei dieselfde beteken, maar masjiene moet met hierdie verskil verduidelik word. Hulle is dieselfde in terme van bedoeling, maar hoe die bedoeling gevorm is, is heeltemal anders.
Uitingversameling gaan alles oor die definisie en kartering van verskillende uitings en frases na spesifieke doelwitte vir die presiese uitvoering van take en antwoorde. Tegnies werk data-aantekeningspesialiste aan spraakdata of teksdata om masjiene te help om dit te onderskei.
Entiteit onttrekking
Elke sin het spesifieke woorde of frases wat gewig dra beklemtoon en dit is hierdie klem wat lei tot 'n interpretasie van konteks en doel. Masjiene, soos die rigiede stelsels wat hulle is, moet sulke entiteite met 'n lepel gevoer word. Byvoorbeeld, "Waar kan ek snare van my kitaar naby 6de Laan kry?"
As jy die sin verfyn, is vind entiteit een, snare is twee, die kitaar is drie en die 6de laan is 4. Hierdie entiteite word deur masjiene saamgevoeg om toepaslike resultate te verkry en om dit te laat gebeur, werk kundiges aan die agterkant.
Stem- / spraak- / oudiodatastelle van die rak af om u gesprekke-KI-model vinniger op te lei
Die ontwerp van dialoë vir gesprekke KI
Die doel van KI was hoofsaaklik die replisering van menslike gedrag deur gebare, aksies en reaksies. Die bewuste menslike verstand het die aangebore vermoë om konteks, bedoeling, toon, emosies en ander faktore te verstaan en daarvolgens te reageer. Maar hoe kan masjiene hierdie aspekte onderskei?
Die ontwerp van dialoë vir gespreksgenootskap AI is baie kompleks en meer belangrik, redelik onmoontlik om 'n universele model uit te rol. Elke individu het 'n ander manier van dink, praat en reageer. Selfs in antwoorde verwoord ons almal ons gedagtes uniek. So, masjiene moet luister en dienooreenkomstig reageer.
Dit is egter nie so glad nie. Wanneer mense praat, kom faktore soos aksente, uitspraak, etnisiteit, taal en meer in en dit is nie maklik vir masjiene om woorde verkeerd te verstaan en te misinterpreteer en terug te reageer nie. 'n Bepaalde woord kan op 'n magdom maniere deur masjiene verstaan word wanneer dit deur 'n Indiër, 'n Brit, 'n Amerikaner en 'n Mexikaan gedikteer word. Daar is tonne taalhindernisse wat ter sprake kom en die mees praktiese manier om met 'n reaksiestelsel vorendag te kom, is deur visuele programmering wat vloeidiagramgebaseer is.
Deur toegewyde blokke vir gebare, reaksies en snellers, skrywers en kenners kan masjiene help om 'n karakter te ontwikkel. Dit is meer soos 'n algoritme-masjien kan gebruik om met die regte antwoorde vorendag te kom. Wanneer 'n inset gevoer word, vloei die inligting deur ooreenstemmende faktore, wat lei tot die regte reaksie vir masjiene om te lewer.
Skakel D vir diversiteit
Soos ons genoem het, is menslike interaksies baie uniek. Mense regoor die wêreld kom uit verskillende vlakke van die lewe, agtergronde, nasionaliteite, demografie, etnisiteite, aksente, diksie, uitspraak en meer.
Vir 'n gespreksbot of 'n stelsel om universeel werkbaar te wees, moet dit opgelei word met so uiteenlopende opleidingsdata as moontlik. As 'n model byvoorbeeld net met die spraakdata van een spesifieke taal of etnisiteit opgelei is, sal 'n nuwe aksent die stelsel verwar en dit dwing om verkeerde resultate te lewer. Dit is nie net 'n verleentheid vir sake-eienaars nie, maar ook beledigend vir gebruikers.
Daarom moet die ontwikkelingsfase KI-opleidingsdata uit 'n ryk poel van diverse datastelle wat saamgestel is uit mense van alle moontlike agtergronde behels. Hoe meer aksente en etnisiteite jou stelsel verstaan, hoe meer universeel sal dit wees. Boonop, wat gebruikers meer sal irriteer, is nie verkeerde herwinning van inligting nie, maar die versuim om hul insette in die eerste plek te verstaan.
Die uitskakeling van vooroordeel behoort 'n sleutelprioriteit te wees en een manier waarop maatskappye dit kan doen, is deur te kies vir skaredata. Wanneer jy jou spraakdata of teksdata crowdsource, laat jy mense van regoor die wêreld toe om by te dra tot jou vereistes, wat jou datapoel net heilsaam maak (Lees ons blog om die voordele en die slaggate van die uitkontraktering van data aan crowdsource-werkers te verstaan). Nou sal jou model verskillende aksente en uitsprake verstaan en dienooreenkomstig reageer.
Die pad vorentoe
Die ontwikkeling van gesprekke-KI is so moeilik soos om 'n baba groot te maak. Die enigste verskil is dat die baba uiteindelik sal groei om dinge te verstaan en beter te word om outonoom te kommunikeer. Dit is die masjiene wat konsekwent gestoot moet word. Daar is tans verskeie uitdagings in hierdie ruimte en ons moet die feit erken dat ons van die mees revolusionêre gespreks-KI-stelsels het wat voortspruit ten spyte van hierdie uitdagings. Kom ons wag en kyk wat die toekoms vir ons vriendelike buurtkletsbotte en virtuele assistente inhou. Intussen, as jy van plan is om gesprekke-KI soos Google Home vir jou besigheid ontwikkel te kry, kontak ons vir jou KI-opleidingsdata en annotasiebehoeftes.