Spraak Emosie & Sentiment Analise
Aktiveer slimmer oproepsentrums met KI-gedrewe insigte
Gebruik Shaip se kundigheid in oudiodata-insameling en -aantekeninge om intydse emosie- en sentimentopsporing te verbeter vir verbeterde kliëntediens.
Outomatiese spraak emosie en
Sentimentanalise
Die kliënt het 'n vennootskap met Shaip aangegaan om 'n outomatiese spraak-emosie- en sentimentontledingsmodel vir oproepsentrums te ontwikkel. Die projek het behels die versameling en annotering van 250 uur se oproepsentrum-oudiodata oor vier Engelse dialekte – VSA, VK, Australies en Indiër. Dit het die kliënt in staat gestel om hul KI-modelle te verbeter vir die opsporing van emosies soos Gelukkig, Neutraal en Kwaad, en sentiment soos Ontevrede en Tevrede in intydse kliëntinteraksies.
Die projek het uitdagings oorkom soos sarkasme-opsporing, wisselende klanklengtes en subtiele verbale leidrade van ontevredenheid, wat presiese en skaalbare resultate gelewer het.

Sleutelstatistieke
Inbelsentrum-oudiodata versamel en geannoteer oor 4 Engelse dialekte
250 Ure
Aantal tale
Amerikaanse Engels, VK Engels, Australiese Engels en Indiese Engels
Gebruiksgevalle
Outomatiese spraak-emosie- en sentimentanalise
Projek Omvang
Versamel en annoteer 250 uur se oproepsentrum-oudiodata in vier dialekte van Engels:
- Amerikaanse Engels (30%)
- VK Engels (30%)
- Australiese Engels (20%)
- Indiese Engels (20%)
In Omvang
Die projek bestaan uit drie dele:
- Oudiodata met spesifieke entiteite, insluitend metadata.
- Ooreenstemmende getranskribeerde lêers met segmentering en tydstempelbesonderhede.
- Emosie- en sentimentaantekeninge:
- Oudio-emosie: Gelukkig, neutraal, kwaad
- Transkripsie sentiment: Uiters ontevrede, ontevrede, neutraal, tevrede, uiters tevrede
Uitdagings
Om te verseker dat die oudiodata die gespesifiseerde dialekte akkuraat verteenwoordig (VSA, VK, Australies en Indiër) kan uitdagend wees. Verskillende streke binne hierdie kategorieë kan verskillende woordeskat, aksente en uitspraak gebruik.
Die annotering van oudio en transkripsies vir emosie en sentiment vereis opgeleide annoteerders wat vertroud is met die kulturele nuanses en linguistiese subtiliteite van elke dialek.
Oudio-emosie en transkripsie-sentiment stem nie altyd ooreen nie. Byvoorbeeld, 'n persoon kan kwaad klink, maar eintlik bevrediging uitspreek. Bv., die hantering van sarkasme gesprekke in sarkastiese frases soos "Ag, wonderlik, 'n ander persoon wat nie my probleem kan oplos nie" moet korrek geannoteer word vir emosie en sentiment.
Die kwaliteit van die oudio-opnames kan verskil, wat die akkuraatheid van transkripsie en emosiebespeuring beïnvloed. Agtergrondgeraas, oorvleuelende gesprekke en verskillende opnametoerusting kan aansienlike uitdagings inhou.
Ontevredenheid deur verbale leidrade soos swaar uitasemings of ander tekens van frustrasie.
Oplossing
Met behulp van gevorderde natuurlike taalverwerking (NLP) tegnieke, is die volgende oplossings geïmplementeer:
Data-insameling
- 250 uur se oudiodata verdeel in dialek-spesifieke kwotas.
- Amerikaanse Engels (30% of 75 uur)
- Britse Engels (30% of 75 uur)
- Australiese Engels (20% of 50 uur)
- Indiese Engels (20% of 50 uur)
- Inheemse aksentgebruikers van die VSA, die Verenigde Koninkryk, Australië en Indië.
- Spraakmonsters wat verskillende toonsoorte bevat, met spesiale fokus op gevalle waar stememosie Kwaad is en tekssentiment Ontevrede of Uiters Ontevrede is.
Teksklassifikasie/Annotasie
- Annotasie van emosies en sentimente gebaseer op spesifieke kategorieë:
- Oudio-emosie: Gelukkig, neutraal, kwaad.
- Transkripsie sentiment: Uiters ontevrede, ontevrede, neutraal, tevrede, uiters tevrede.
- Elke klanksegment het slegs een primêre emosie bevat.
- Verskillende vertragingsegmente (van 2 tot 30 sekondes) is binne gesprekke toegepas.
- Die transkripsieformaat het JSON-uitset gevolg, insluitend linker- en regterluidsprekerinligting, sentimentmerkers en finale segmentsentiment.
gehalteversekering
Transkripsie akkuraatheid:
- Verseker dat 250 uur se oudio gelewer is met 'n minimum van:
- 90% transkripsiefoutkoers (TOV) akkuraatheid.
- 95% Woordherkenningskoers (WER) akkuraatheid.
QA-proses:
- Gereelde oudits van ewekansige geselekteerde steekproewe uit die datastel is uitgevoer.
- Het outomatiese gereedskap gebruik om TER en WER oor die datastel te meet.
- Handmatige hersiening van gemerkte afdelings het verseker dat akkuraatheidsdrempels bereik is.
Die uitkoms
Die opleidingsdata sal die ontwikkeling van 'n geoutomatiseerde emosie- en sentimentopsporingsmodel ondersteun, wat:
- Intydse emosiebespeuring in oproepsentruminteraksies.
- Meer effektiewe hantering van komplekse sake, soos sarkasme of ontevredenheid.
- Skaalbaarheid vir toekomstige projekte, maklik aan te pas by verhoogde datavolumes en meer tale.
Aflewerbares
- 250 uur se oudiolêers (in 8 kHz PCM WAV-formaat, mono)
- Transkripsielêers (met segmentering, sentimentmerkers en sprekeridentifiseerders)
- Metadata (oudioduur, sprekerbesonderhede, ens.)
Samewerking met Shaip vir ons oproepsentrumdataprojek was 'n deurslaggewende oomblik in die bevordering van ons KI-oplossings. Hul span het kundig 250 uur se oudiodata oor vier sleutel Engelse dialekte ingesamel en geannoteer – VS, VK, Australies en Indies – wat die hoogste gehalte en akkuraatheid verseker het. Die aandag aan linguistiese nuanses oor hierdie streke het die akkuraatheid van ons spraakherkenningsmodelle aansienlik verbeter. Boonop was Shaip se kundigheid in die hantering van komplekse data-aantekeningprojekte instrumenteel om ons te help om betroubare, voldoenende modelle op skaal te bou.