Gevallestudie: Uitingversameling
Het 7 miljoen+ uitsprake gelewer om veeltalige digitale assistente in 13 tale te bou
Regte wêreld oplossing
Gegewens wat wêreldwye gesprekke dryf
Die behoefte aan Uiting-opleiding ontstaan omdat nie alle kliënte die presiese woorde of frases gebruik terwyl hulle interaksie het met of vrae aan hul stemassistente in 'n skrifformaat stel nie. Daarom moet spesifieke stemtoepassings opgelei word op spontane spraakdata. Bv., "Waar is die naaste hospitaal geleë?" "Kry 'n hospitaal naby my" of "Is daar 'n hospitaal naby?" almal dui dieselfde soekbedoeling aan, maar word anders geformuleer.
Probleem
Om kliënte se Digital Assistant se spraakpadkaart vir wêreldwye tale uit te voer, moes die span groot volumes opleidingsdata vir die spraakherkenning KI-model bekom. Die kritieke vereistes van die kliënt was:
- Verkry groot volumes opleidingsdata (enkelspreker-uitingaanwysings van nie meer as 3-30 sekondes lank nie) vir spraakherkenningsdienste in 13 wêreldtale
- Vir elke taal sal die verskaffer teksaanwysings genereer vir sprekers om op te neem (tensy die
kliëntvoorrade) en transkribeer die resulterende oudio. - Verskaf oudiodata en transkripsie van opgeneemde uitsprake met ooreenstemmende JSON-lêers
wat die metadata vir alle opnames bevat. - Verseker 'n diverse mengsel van sprekers volgens ouderdom, geslag, opvoeding en dialek
- Verseker 'n diverse mengsel van opname-omgewings volgens spesifikasies.
- Elke oudio-opname moet minstens 16kHz maar verkieslik 44kHz wees
“Nadat hy baie verskaffers geëvalueer het, het die kliënt Shaip gekies vanweë hul kundigheid in gespreks-KI-projekte. Ons was beïndruk met Shaip se projekuitvoeringsbevoegdheid, hul kundigheid om die vereiste uitsprake van kundige taalkundiges in 13 tale te verkry, te transkribeer en te lewer binne streng tydlyne en met die vereiste kwaliteit.”
Oplossing
Met ons diepgaande begrip van gesprekke-KI, het ons die kliënt gehelp om die data in te samel, te transkribeer en aan te teken met 'n span kundige linguiste en annoteerders om hul KI-aangedrewe spraakverwerking meertalige Voice Suite op te lei.
Die omvang van die werk vir Shaip het ingesluit, maar was nie beperk nie tot die verkryging van groot volumes oudio-opleidingsdata vir spraakherkenning, die transkripsie van oudio-opnames in veelvuldige tale vir alle tale op ons Vlak 1- en Vlak 2-taalpadkaart, en die lewering van ooreenstemmende Into lêers wat die metadata bevat. Shaip het uitsprake van 3-30 sekondes op skaal ingesamel terwyl die gewenste vlakke van kwaliteit gehandhaaf word wat nodig is om ML-modelle vir komplekse projekte op te lei.
- Oudio versamel, getranskribeer en geannoteer: 22,250 uur
- Ondersteunde tale: 13 (Deens, Koreaans, Saoedi-Arabies Arabies, Nederlands, Vasteland en Taiwan Chinees, Frans Kanadese, Mexikaanse Spaans, Turks, Hindi, Pools, Japannees, Russies)
- Aantal uitsprake: 7M +
- Tydlyn: 7-8 maande
Terwyl ons oudio-uitinge by 16 kHz versamel het, het ons 'n gesonde mengsel van sprekers volgens ouderdom, geslag, opvoeding en dialekte in uiteenlopende opname-omgewings verseker.
Gevolg
Die hoëgehalte-uiting-oudiodata van kundige taalkundiges het die kliënt bemagtig om hul veeltalige spraakherkenningsmodel akkuraat op te lei in 13 Global Tier 1 & 2-tale. Met goudstandaard opleidingsdatastelle kan die kliënt intelligente en robuuste digitale bystand bied om toekomstige werklike wêreldprobleme op te los.
Ons kundigheid
Aanbevole bronne
Kopergids
Kopersgids: Gespreks-KI
Die kletsbot waarmee jy gesels het, loop op 'n gevorderde gespreks-KI-stelsel wat opgelei, getoets en gebou is met behulp van tonne spraakherkenningdatastelle.
Nuus
Die stand van gesprek AI 2021
Die Conversational AI 2021-infografika praat oor wat Conversational AI is, sy evolusie, soorte, Conversational AI Market volgens streek, gebruiksgevalle, uitdagings, ens.
Nuus
3 Struikelblokke vir die ontwikkeling van gespreksgenote
Shaip begin die ontwikkeling van gespreks-AI as 'n hulpmiddel vir kliëntebetrokkenheid deur die nodige geannoteerde klankdata in meer as 50 tale aan te bied.
Vertel ons hoe ons kan help met u volgende KI-inisiatief.