Engelse Deep South Dataset
oorsig
Titel
Engels Diep Suid Taaldatastel
Datastel tipe
Inbelsentrum
Linker kanaal
Regter kanaal
Beskrywing
Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute.
Gebruiksgeval
ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
Datastel Besonderhede
Totale ure
151
Voorbeeldkoers
8 kHz
Audio Channel
Dual
Opname platform
lessenaar
Klank-formaat
Wav
Transkripsie-formaat
.json
WER (%)
5
Datastel Demografie
Land
Engels Diep Suid
Taalvoorkeur
Engels Diep Suid
geslag
Vrou 221, Man 1004, Onbekend 7
Aantal sprekers
1,232
ouderdom
18-50
oorsig
Titel
Engels Diep Suid Taaldatastel
Datastel tipe
Algemene gesprek
Linker kanaal
Regter kanaal
Beskrywing
Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) – 15-60 minute.
Gebruiksgeval
ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
Datastel Besonderhede
Totale ure
56
Voorbeeldkoers
8 kHz
Audio Channel
Dual
Opname platform
lessenaar
Klank-formaat
Wav
Transkripsie-formaat
.json
WER (%)
5
Datastel Demografie
Land
Engels Diep Suid
Taalvoorkeur
Engels Diep Suid
geslag
Vrou 99, Man 31, Onbekend 0
Aantal sprekers
130
ouderdom
18-50
oorsig
Beskrywing
Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings ens – 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute.
Gebruiksgeval
ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
Datastel Besonderhede
Totale ure
266
Voorbeeldkoers
16 kHz
Audio Channel
Mono
Opname platform
Webverkryging
Klank-formaat
Wav
Transkripsie-formaat
.json
WER (%)
5
Datastel Demografie
Land
Engels Diep Suid
Taalvoorkeur
Engels Diep Suid
geslag
Vrou 204, Man 356, Onbekend 21
Aantal sprekers
581
ouderdom
18-50
Voorgestelde kliënte
Bemagtig spanne om wêreldleidende KI-produkte te bou.
Kan jy nie kry waarna jy soek nie?
Nuwe datastelle van die rak af word oor alle datatipes ingesamel
Kontak ons nou om jou bekommernisse oor die insameling van oudio-/spraakopleidingdata te laat vaar