Gevallestudie: Uitingversameling

Het 7 miljoen+ uitsprake gelewer om veeltalige digitale assistente in 13 tale te bou

Uitingversameling

Regte wêreld oplossing

Gegewens wat wêreldwye gesprekke dryf

Die behoefte aan Uiting-opleiding ontstaan ​​omdat nie alle kliënte die presiese woorde of frases gebruik terwyl hulle interaksie het met of vrae aan hul stemassistente in 'n skrifformaat stel nie. Daarom moet spesifieke stemtoepassings opgelei word op spontane spraakdata. Bv., "Waar is die naaste hospitaal geleë?" "Kry 'n hospitaal naby my" of "Is daar 'n hospitaal naby?" almal dui dieselfde soekbedoeling aan, maar word anders geformuleer.

Uitingversameling 1

Probleem

Om kliënte se Digital Assistant se spraakpadkaart vir wêreldwye tale uit te voer, moes die span groot volumes opleidingsdata vir die spraakherkenning KI-model bekom. Die kritieke vereistes van die kliënt was:

  • Verkry groot volumes opleidingsdata (enkelspreker-uitingaanwysings van nie meer as 3-30 sekondes lank nie) vir spraakherkenningsdienste in 13 wêreldtale
  • Vir elke taal sal die verskaffer teksaanwysings genereer vir sprekers om op te neem (tensy die
    kliëntvoorrade) en transkribeer die resulterende oudio.
  • Verskaf oudiodata en transkripsie van opgeneemde uitsprake met ooreenstemmende JSON-lêers
    wat die metadata vir alle opnames bevat.
  • Verseker 'n diverse mengsel van sprekers volgens ouderdom, geslag, opvoeding en dialek
  • Verseker 'n diverse mengsel van opname-omgewings volgens spesifikasies.
  • Elke oudio-opname moet minstens 16kHz maar verkieslik 44kHz wees

Versnel u gespreks-AI
toepassingsontwikkeling met 100%

“Nadat hy baie verskaffers geëvalueer het, het die kliënt Shaip gekies vanweë hul kundigheid in gespreks-KI-projekte. Ons was beïndruk met Shaip se projekuitvoeringsbevoegdheid, hul kundigheid om die vereiste uitsprake van kundige taalkundiges in 13 tale te verkry, te transkribeer en te lewer binne streng tydlyne en met die vereiste kwaliteit.”

Oplossing

Met ons diepgaande begrip van gesprekke-KI, het ons die kliënt gehelp om die data in te samel, te transkribeer en aan te teken met 'n span kundige linguiste en annoteerders om hul KI-aangedrewe spraakverwerking meertalige Voice Suite op te lei.

Die omvang van die werk vir Shaip het ingesluit, maar was nie beperk nie tot die verkryging van groot volumes oudio-opleidingsdata vir spraakherkenning, die transkripsie van oudio-opnames in veelvuldige tale vir alle tale op ons Vlak 1- en Vlak 2-taalpadkaart, en die lewering van ooreenstemmende Into lêers wat die metadata bevat. Shaip het uitsprake van 3-30 sekondes op skaal ingesamel terwyl die gewenste vlakke van kwaliteit gehandhaaf word wat nodig is om ML-modelle vir komplekse projekte op te lei.

  • Oudio versamel, getranskribeer en geannoteer: 22,250 uur
  • Ondersteunde tale: 13 (Deens, Koreaans, Saoedi-Arabies Arabies, Nederlands, Vasteland en Taiwan Chinees, Frans Kanadese, Mexikaanse Spaans, Turks, Hindi, Pools, Japannees, Russies)
  • Aantal uitsprake: 7M +
  • Tydlyn: 7-8 maande

Terwyl ons oudio-uitinge by 16 kHz versamel het, het ons 'n gesonde mengsel van sprekers volgens ouderdom, geslag, opvoeding en dialekte in uiteenlopende opname-omgewings verseker.

Gevolg

Die klankdata van hoë gehalte van kundige taalkundiges het die kliënt bemagtig om akkuraat op te lei
hul veeltalige spraakherkenningsmodel in 13 globale vlak 1- en 2-tale. Met goudstandaard opleidingsdatastelle kan die kliënt intelligente en robuuste digitale bystand bied om toekomstige werklike wêreldprobleme op te los.

Ons kundigheid

0 +
Ure van spraak ingesamel
0
Span stemdataversamelaars
0 %
PII voldoen
0 +
Cool nommer
> 0
Data-aanvaarding en akkuraatheid
0 +
Fortune 500-kliënte

Vertel ons hoe ons kan help met u volgende KI-inisiatief.