Sleutelfrase/aanwysings Oudioversameling

Gevallestudie: Sleutelfrase-versameling vir in-motor stem-geaktiveerde stelsels

Sleutelfrase versameling

Daar is 'n toenemende vraag na in-motor stem-geaktiveerde stelsels in die motor-industrie, herdefinieer hoe ons omgaan met ons mobiliteit voertuie.

Die motorbedryf het vinnig stemgeaktiveerde stelsels aangeneem, met groot rolspelers soos Ford, Tesla en BMW wat gevorderde stemherkenning in hul voertuie integreer. Teen 2022 is beraam dat meer as 50% van nuwe motors stemherkenningsvermoëns gehad het. Hierdie integrasies het ten doel om veiligheid te verbeter, sodat bestuurders navigasie-, vermaak- en kommunikasiefunksies sonder afleiding kan bestuur.

Die markwaarde vir stemherkenning in motors sal na verwagting $1 miljard teen 2023 oorskry, wat 'n groeiende vraag na handvrye, intelligente interaksies in die motor aandui.

Automotive

Navorsing dui daarop dat 2022% van bestuurders teen 73 'n stemassistent in die motor sal gebruik.

Die mark vir stemherkenningstelsel vir motorvoertuie is in 2.01 op USD 2021 miljard gewaardeer, en sal na verwagting teen 3.51 USD 2027 miljard bereik, wat 'n CAGR van ongeveer 8.07% registreer.

Regte wêreld oplossing

Data wat stemgeaktiveerde stelsels aandryf

Stemgeaktiveerde stelsels in motors verhoog veiligheid en gerief. Hulle laat bestuurders toe om toegang tot navigasie te kry, oproepe te maak, SMS'e te stuur en musiek te beheer sonder om hande van die wiel of oë van die pad af te haal. Deur op verbale opdragte te reageer, verminder hierdie stelsels afleiding, bevorder multitasking en verseker deurlopende fokus op bestuur. 

Die kliënt is 'n wêreldleier in gespreksintelligensie wat stem-KI-oplossings bied wat besighede in staat stel om ongelooflike gesprekservarings aan hul kliënte te bied. Hulle het saam met vooraanstaande motormaatskappye gewerk om hul stemgeaktiveerde stelsels met handelsmerk-sleutelfrases op te lei en het Shaip se kundigheid in oudiodata-insameling nodig gehad.

Werklike wêreld oplossing
Uitdagings

Uitdagings

  • Menigte verkryging: Werf 2800+ moedertaalsprekers per taal wêreldwyd.
  • Data-insameling: Beveilig 200 12+ opdragte in XNUMX tale binne vasgestelde tydraamwerk.
  • Konteks- en bedoelingsherkenning: Om gebruikersversoeke korrek te verstaan, moes stelsels opgelei word in verskillende variasies vir dieselfde sleutelfrase.
  • Agtergrondgeraashantering: Spreek werklike agtergrondgeraas aan vir ML-modelakkuraatheid.
  • Vermindering van vooroordeel: Kry stemmonsters van diverse demografieë om inklusiwiteit te verseker.
  • Oudiospesifikasies: 16khz 16bits PCM, mono, enkelkanaal, WAV; geen verwerking nie.
  • Opname omgewing: Opnames moet skoon oudio hê sonder agtergrondgeraas of steurings. Sleutelfrases wat met normale spraak opgeneem moet word.
  • Kwaliteitkontrole:  Alle spraakopnames sal kwaliteit assessering en validering ondergaan, slegs gevalideerde spraakopnames sal afgelewer word. Indien Shaip nie aan die ooreengekome kwaliteitstandaarde voldoen nie, sal Shaip data teen geen bykomende koste weer aflewer nie

Oplossing

Shaip met sy kundigheid in die Conversational KI-ruimte het die kliënt in staat gestel om:

  • Data-insameling: 208 12 sleutelfrases/handelsmerkaanwysings wat in 2800 wêreldtale van XNUMX sprekers in die vasgestelde tydsraamwerk ingesamel is
  • Diverse aksente en dialekte: Gewerfde spesialiste van regoor die wêreld, vaardig in die verlangde aksente en dialekte.
  • Konteks- en bedoelingsherkenning: Elke spreker is getaak om die sleutelfrases in 20 verskillende variasies op te teken, wat die ML-modelle in staat stel om gebruikersversoeke akkuraat te begryp in terme van konteks en bedoeling.
  • Agtergrondgeraashantering: Om ongerepte klankgehalte te verseker, het ons seker gemaak dat die sleutelfrases vasgevang is in 'n rustige omgewing met geraasvlakke onder 40dB, sonder agtergrondversteurings soos TV, radio, musiek, spraak of straatklanke.
  • Vermindering van vooroordeel: Om vooroordeel tot die minimum te beperk, het ons individue van uiteenlopende streke betrek en 'n gebalanseerde demografiese verteenwoordiging gehandhaaf met 50% mans en 50% vroue, wat oor ouderdomsgroepe van 18 tot 60 jaar strek.
  • Opnameriglyne: Die sleutelfrases is in 'n konsekwente, normale spraakpatroon vasgelê, sonder enige variasies soos vinnige of stadige pas. 2-sekonde stilte aan beide die begin en einde om te verseker dat geen deel van die toespraak per ongeluk geknip is nie.
  • Opname-formaat: Die klank is opgeneem teen 16kHz, 16-bis PCM in mono, met gebruik van 'n enkele kanaal, en gestoor in die WAV-lêerformaat. Die klank bly onverwerk, wat beteken dat daar geen toepassing van kompressie, galm of EQ was nie.
  • Kwaliteit: Elke spraakopname is aan streng kwaliteitskontroles en validering onderwerp. Slegs opnames wat hierdie assessering geslaag het, is afgelewer. Enige lêers wat nie voldoen aan die ooreengekome kwaliteitstandaarde nie, is heropgeneem en verskaf sonder enige ekstra koste
Oplossing
Uitkoms

Uitkoms

Die hoë kwaliteit handelsmerk sleutelfrase klankdata of stemaanwysings sal die motormaatskappye en hul kliënte in staat stel om:

  1. Handelsmerk en identiteit: Stemaanwysings met spesifieke handelsmerkfrase help maatskappye om 'n direkte en onvergeetlike verbinding tussen gebruiker en die handelsmerk te skep wat handelsmerkherroeping verbeter.
  2. Gemak van gebruik: Stembevele maak dit makliker vir bestuurders om met voertuie te kommunikeer sonder om hul hande van die wiel af te haal of hul oë van die pad af te haal en sodoende padveiligheid te verbeter.
  3. Funksionaliteit: Stemopdragte maak toegang tot en beheer van motorkenmerke meer intuïtief. Of dit nou navigasie, mediaweergawe of klimaatbeheer is.
  4. Integrasie met ander stelsels: Baie stemgeaktiveerde stelsels is geïntegreer met slimfone, slimhuistoestelle en ander IoT-toestelle. Byvoorbeeld, 'n gebruiker kan dalk hul motor vra om die ligte by die huis aan te skakel wanneer hulle huis toe nader.
  5. Mededingende voordeel: Die aanbied van gevorderde stem-geaktiveerde stelsels kan 'n verkoopspunt en 'n differensieerder wees. Kopers soek die nuutste tegnologie wanneer hulle 'n nuwe motor koop.
  6. Toekomsbestendiging: Namate tegnologie ontwikkel en IoT meer in die alledaagse lewe geïntegreer word, stel 'n robuuste stemgeaktiveerde stelsel motorondernemings in posisie om meer aan te pas by toekomstige tegnologie.
  7. Inkomste geleenthede: Bykomende monetiseringsgeleenthede, dws stemstelsels bied aanbevelings of geïntegreerde e-handelervarings (soos om kos te bestel of om nabygeleë dienste te vind) wat aan geaffilieerde inkomste kan verskaf.
Goue-5-ster

Toe ons stemaanwysings vir die motorsektor begin kry het, was die uitdagings talle. Om die diversiteit in spraak, aksent en toon vas te vang was noodsaaklik om ons kliënt se globale kliënte te verteenwoordig. Shaip het uitgestaan ​​nie net as 'n verkoper nie, maar as 'n ware vennoot. Hulle toewyding om 'n diverse reeks stemme uit verskillende streke te verseker, was prysenswaardig. Hulle het verder gegaan as om net stemme te versamel; hulle het die nuanses van ons projekbehoeftes begryp, wat uitstekende opnames waarborg. Hulle foutlose nakoming van klankversamelingstandaarde het hul professionaliteit en toewyding aan die projek ten toon gestel.

Versnel u gespreks-AI
toepassingsontwikkeling met 100%