Spraak Emosie & Sentiment Analise

Aktiveer slimmer oproepsentrums met KI-gedrewe insigte

Gebruik Shaip se kundigheid in oudiodata-insameling en -aantekeninge om intydse emosie- en sentimentopsporing te verbeter vir verbeterde kliëntediens.

Spraak emosie en sentiment analise

Outomatiese spraak emosie en
Sentimentanalise

Die kliënt het 'n vennootskap met Shaip aangegaan om 'n outomatiese spraak-emosie- en sentimentontledingsmodel vir oproepsentrums te ontwikkel. Die projek het behels die versameling en annotering van 250 uur se oproepsentrum-oudiodata oor vier Engelse dialekte – VSA, VK, Australies en Indiër. Dit het die kliënt in staat gestel om hul KI-modelle te verbeter vir die opsporing van emosies soos Gelukkig, Neutraal en Kwaad, en sentiment soos Ontevrede en Tevrede in intydse kliëntinteraksies.

Die projek het uitdagings oorkom soos sarkasme-opsporing, wisselende klanklengtes en subtiele verbale leidrade van ontevredenheid, wat presiese en skaalbare resultate gelewer het.

Outomatiese spraakemosie- en sentimentanalise

Sleutelstatistieke

Inbelsentrum-oudiodata versamel en geannoteer oor 4 Engelse dialekte

250 Ure

Aantal tale

Amerikaanse Engels, VK Engels, Australiese Engels en Indiese Engels

Gebruiksgevalle

Outomatiese spraak-emosie- en sentimentanalise

Projek Omvang

Versamel en annoteer 250 uur se oproepsentrum-oudiodata in vier dialekte van Engels:

  • Amerikaanse Engels (30%)
  • VK Engels (30%)
  • Australiese Engels (20%)
  • Indiese Engels (20%)

In Omvang

Die projek bestaan ​​uit drie dele:

  • Oudiodata met spesifieke entiteite, insluitend metadata.
  • Ooreenstemmende getranskribeerde lêers met segmentering en tydstempelbesonderhede.
  • Emosie- en sentimentaantekeninge:
    • Oudio-emosie: Gelukkig, neutraal, kwaad
    • Transkripsie sentiment: Uiters ontevrede, ontevrede, neutraal, tevrede, uiters tevrede

Uitdagings

Diversiteit van dialekte

Om te verseker dat die oudiodata die gespesifiseerde dialekte akkuraat verteenwoordig (VSA, VK, Australies en Indiër) kan uitdagend wees. Verskillende streke binne hierdie kategorieë kan verskillende woordeskat, aksente en uitspraak gebruik.

Kundigheidsvereiste

Die annotering van oudio en transkripsies vir emosie en sentiment vereis opgeleide annoteerders wat vertroud is met die kulturele nuanses en linguistiese subtiliteite van elke dialek.

Kompleksiteit van emosies en sentimente

Oudio-emosie en transkripsie-sentiment stem nie altyd ooreen nie. Byvoorbeeld, 'n persoon kan kwaad klink, maar eintlik bevrediging uitspreek. Bv., die hantering van sarkasme gesprekke in sarkastiese frases soos "Ag, wonderlik, 'n ander persoon wat nie my probleem kan oplos nie" moet korrek geannoteer word vir emosie en sentiment.

Klank kwaliteit

Die kwaliteit van die oudio-opnames kan verskil, wat die akkuraatheid van transkripsie en emosiebespeuring beïnvloed. Agtergrondgeraas, oorvleuelende gesprekke en verskillende opnametoerusting kan aansienlike uitdagings inhou.

Akkuraat vasvang

Ontevredenheid deur verbale leidrade soos swaar uitasemings of ander tekens van frustrasie.

Oplossing

Met behulp van gevorderde natuurlike taalverwerking (NLP) tegnieke, is die volgende oplossings geïmplementeer:

Data-insameling

  • 250 uur se oudiodata verdeel in dialek-spesifieke kwotas.
    • Amerikaanse Engels (30% of 75 uur)
    • Britse Engels (30% of 75 uur)
    • Australiese Engels (20% of 50 uur)
    • Indiese Engels (20% of 50 uur)
  • Inheemse aksentgebruikers van die VSA, die Verenigde Koninkryk, Australië en Indië.
  • Spraakmonsters wat verskillende toonsoorte bevat, met spesiale fokus op gevalle waar stememosie Kwaad is en tekssentiment Ontevrede of Uiters Ontevrede is.

Teksklassifikasie/Annotasie

Teksklassifikasie

  • Annotasie van emosies en sentimente gebaseer op spesifieke kategorieë:
    • Oudio-emosie: Gelukkig, neutraal, kwaad.
    • Transkripsie sentiment: Uiters ontevrede, ontevrede, neutraal, tevrede, uiters tevrede.
  • Elke klanksegment het slegs een primêre emosie bevat.
  • Verskillende vertragingsegmente (van 2 tot 30 sekondes) is binne gesprekke toegepas.
  • Die transkripsieformaat het JSON-uitset gevolg, insluitend linker- en regterluidsprekerinligting, sentimentmerkers en finale segmentsentiment.

 

gehalteversekering

Gehalteversekering
Transkripsie akkuraatheid:

  • Verseker dat 250 uur se oudio gelewer is met 'n minimum van:
    • 90% transkripsiefoutkoers (TOV) akkuraatheid.
    • 95% Woordherkenningskoers (WER) akkuraatheid.

QA-proses:

  • Gereelde oudits van ewekansige geselekteerde steekproewe uit die datastel is uitgevoer.
    • Het outomatiese gereedskap gebruik om TER en WER oor die datastel te meet.
    • Handmatige hersiening van gemerkte afdelings het verseker dat akkuraatheidsdrempels bereik is.

Die uitkoms

Die opleidingsdata sal die ontwikkeling van 'n geoutomatiseerde emosie- en sentimentopsporingsmodel ondersteun, wat:

  • Intydse emosiebespeuring in oproepsentruminteraksies.
  • Meer effektiewe hantering van komplekse sake, soos sarkasme of ontevredenheid.
  • Skaalbaarheid vir toekomstige projekte, maklik aan te pas by verhoogde datavolumes en meer tale.

Aflewerbares

  • 250 uur se oudiolêers (in 8 kHz PCM WAV-formaat, mono)
  • Transkripsielêers (met segmentering, sentimentmerkers en sprekeridentifiseerders)
  • Metadata (oudioduur, sprekerbesonderhede, ens.)

Samewerking met Shaip vir ons oproepsentrumdataprojek was 'n deurslaggewende oomblik in die bevordering van ons KI-oplossings. Hul span het kundig 250 uur se oudiodata oor vier sleutel Engelse dialekte ingesamel en geannoteer – VS, VK, Australies en Indies – wat die hoogste gehalte en akkuraatheid verseker het. Die aandag aan linguistiese nuanses oor hierdie streke het die akkuraatheid van ons spraakherkenningsmodelle aansienlik verbeter. Boonop was Shaip se kundigheid in die hantering van komplekse data-aantekeningprojekte instrumenteel om ons te help om betroubare, voldoenende modelle op skaal te bou.

Goue-5-ster