Gevallestudie: Uitingversameling

Het 7 miljoen+ uitsprake gelewer om veeltalige digitale assistente in 13 tale te bou

Regte wêreld oplossing

Gegewens wat wêreldwye gesprekke dryf

Die behoefte aan Uiting-opleiding ontstaan omdat nie alle kliënte die presiese woorde of frases gebruik terwyl hulle interaksie het met of vrae aan hul stemassistente in 'n skrifformaat stel nie. Daarom moet spesifieke stemtoepassings opgelei word op spontane spraakdata. Bv., "Waar is die naaste hospitaal geleë?" "Kry 'n hospitaal naby my" of "Is daar 'n hospitaal naby?" almal dui dieselfde soekbedoeling aan, maar word anders geformuleer.

Probleem

Om kliënte se Digital Assistant se spraakpadkaart vir wêreldwye tale uit te voer, moes die span groot volumes opleidingsdata vir die spraakherkenning KI-model bekom. Die kritieke vereistes van die kliënt was:

Verkry groot volumes opleidingsdata (enkelspreker-uitingaanwysings van nie meer as 3-30 sekondes lank nie) vir spraakherkenningsdienste in 13 wêreldtale
Vir elke taal sal die verskaffer teksaanwysings genereer vir sprekers om op te neem (tensy die
kliëntvoorrade) en transkribeer die resulterende oudio.
Verskaf oudiodata en transkripsie van opgeneemde uitsprake met ooreenstemmende JSON-lêers
wat die metadata vir alle opnames bevat.
Verseker 'n diverse mengsel van sprekers volgens ouderdom, geslag, opvoeding en dialek
Verseker 'n diverse mengsel van opname-omgewings volgens spesifikasies.
Elke oudio-opname moet minstens 16kHz maar verkieslik 44kHz wees

Versnel u gespreks-AI
toepassingsontwikkeling met 100%

“Nadat hy baie verskaffers geëvalueer het, het die kliënt Shaip gekies vanweë hul kundigheid in gespreks-KI-projekte. Ons was beïndruk met Shaip se projekuitvoeringsbevoegdheid, hul kundigheid om die vereiste uitsprake van kundige taalkundiges in 13 tale te verkry, te transkribeer en te lewer binne streng tydlyne en met die vereiste kwaliteit.”

Oplossing

Met ons diepgaande begrip van gesprekke-KI, het ons die kliënt gehelp om die data in te samel, te transkribeer en aan te teken met 'n span kundige linguiste en annoteerders om hul KI-aangedrewe spraakverwerking meertalige Voice Suite op te lei.

Die omvang van die werk vir Shaip het ingesluit, maar was nie beperk nie tot die verkryging van groot volumes oudio-opleidingsdata vir spraakherkenning, die transkripsie van oudio-opnames in veelvuldige tale vir alle tale op ons Vlak 1- en Vlak 2-taalpadkaart, en die lewering van ooreenstemmende Into lêers wat die metadata bevat. Shaip het uitsprake van 3-30 sekondes op skaal ingesamel terwyl die gewenste vlakke van kwaliteit gehandhaaf word wat nodig is om ML-modelle vir komplekse projekte op te lei.

Oudio versamel, getranskribeer en geannoteer: 22,250 uur
Ondersteunde tale: 13 (Deens, Koreaans, Saoedi-Arabies Arabies, Nederlands, Vasteland en Taiwan Chinees, Frans Kanadese, Mexikaanse Spaans, Turks, Hindi, Pools, Japannees, Russies)
Aantal uitsprake: 7M +
Tydlyn: 7-8 maande

Terwyl ons oudio-uitinge by 16 kHz versamel het, het ons 'n gesonde mengsel van sprekers volgens ouderdom, geslag, opvoeding en dialekte in uiteenlopende opname-omgewings verseker.

Gevolg

Die hoëgehalte-uiting-oudiodata van kundige taalkundiges het die kliënt bemagtig om hul veeltalige spraakherkenningsmodel akkuraat op te lei in 13 Global Tier 1 & 2-tale. Met goudstandaard opleidingsdatastelle kan die kliënt intelligente en robuuste digitale bystand bied om toekomstige werklike wêreldprobleme op te los.

Ons kundigheid

Ure van spraak ingesamel

0 +

Span stemdataversamelaars

PII voldoen

0 %

Cool nommer

0 +

Data-aanvaarding en akkuraatheid

> 0

Fortune 500-kliënte

0 +

Aanbevole bronne

Kopergids

Kopersgids: Gespreks-KI

Die kletsbot waarmee jy gesels het, loop op 'n gevorderde gespreks-KI-stelsel wat opgelei, getoets en gebou is met behulp van tonne spraakherkenningdatastelle.

Nuus

Die stand van gesprek AI 2021

Die Conversational AI 2021-infografika praat oor wat Conversational AI is, sy evolusie, soorte, Conversational AI Market volgens streek, gebruiksgevalle, uitdagings, ens.

Nuus

3 Struikelblokke vir die ontwikkeling van gespreksgenote

Shaip begin die ontwikkeling van gespreks-AI as 'n hulpmiddel vir kliëntebetrokkenheid deur die nodige geannoteerde klankdata in meer as 50 tale aan te bied.

Die skep van kliniese NLP is 'n kritieke taak wat geweldige domeinkundigheid benodig om op te los. Ek kan duidelik sien dat u Google op hierdie gebied 'n paar jaar vooruit is. Ek wil met u werk en u vergroot.

Google, Inc. Direkteur

My ingenieurspan het 2+ jaar saam met Shaip se span gewerk tydens die ontwikkeling van API's vir gesondheidsorg. Ons is beïndruk met hul werk in gesondheidsorgspesifieke NLP en wat hulle met komplekse datastelle kan bereik.

Google, Inc. Hoof van Ingenieurswese

Vertel ons hoe ons kan help met u volgende KI-inisiatief.

Gevallestudie: Uitingversameling

Het 7 miljoen+ uitsprake gelewer om veeltalige digitale assistente in 13 tale te bou

Regte wêreld oplossing

Probleem

Oplossing

Gevolg

Ons kundigheid

Aanbevole bronne

Kopergids

Kopersgids: Gespreks-KI

Nuus

Die stand van gesprek AI 2021

Nuus

3 Struikelblokke vir die ontwikkeling van gespreksgenote

AI Datadienste

Speciality

Nywerheid

produkte

maatskappy

hulpbronne

Kontak Ons

Laat weet ons meer oor u!

Laat weet ons meer oor u!

Laat weet ons meer oor u!

Laat weet ons meer oor u!

Laat weet ons meer oor u!

Laat weet ons meer oor u!