Mees betroubare spraakdata-insamelingsdienste vir jou KI
Leer u NLP -modelle, VA's, TTS -prototipes en meer op met gespreksdata van hoë gehalte, met ons klank- en spraakdata -insamelingsdienste
Ontdek klankdatapypleidings sonder knelpunte
Voorgestelde kliënte
Professionele oudio-/stemdata-insamelingsdienste
Enige onderwerp. Enige scenario.
By Shaip lê ons kundigheid in die skep van hoëgehalte-spraakdatastelle wat ontwerp is vir uiteenlopende KI/ML-vereistes. Ons bied 'n uitgebreide reeks tale en rekord in uiteenlopende instellings wat ons datastelle omvattend en aanpasbaar maak. Ou fokus is om modelle met die hoogste volume persoonlike spraakdata in die minste moontlike tyd te voed. Met ons aan boord kan jy verwag:
- Samegestelde veeltalige klank- / stemdata van hoë gehalte om akkuraatheid te verbeter
- Hoogste moontlike vlak van domeinspesifisiteit aan target diverse scenario setup
- Skaal jou ML-model om by diverse demografie en vertikale te pas
- Opname omgewings: Studio kwaliteit, met kristalhelder oudio met minimale agtergrondgeraas, en Natuurlike omgewings, waar opnames omgewingsklanke insluit om werklike situasies na te boots.
100 +
55K +
Ure se spraakdata
250 +
projekte
60 +
Tale (100+ dialekte)
8 / 16 / 44 / 48 kHz
Sampling rate
Ons kundigheid
Belyn oudiodata vir slimmer NLP-modelle
Shaip bied eind-tot-einde spraak-/klankdata-insamelingsdienste in meer as 100 tale aan om tegniese tegnologieë moontlik te maak vir 'n uiteenlopende groep gehore regoor die wêreld. Ons kan werk aan projekte van enige omvang en grootte; van die lisensiëring van bestaande klankdatastelle van die rak af, tot die bestuur van pasgemaakte klankdata-insameling, tot klank-transkripsie en aantekening. Maak nie saak hoe groot u spraakdata-insamelingsprojek is nie, ons kan die klankversamelingsdienste aanpas by u behoeftes om hoë kwaliteit NLP-datastelle te bou wat op dialekte, klanke en tale gerig is. Kies uit ons wye reeks spraakdatastelle en klankdata-insamelingshulpbronne vir intelligente opstellings wat stem moontlik maak.
Monoloog Geskrif & Spontane Toespraak
Dit fokus op die verwerking van spraak van 'n enkele spreker. Gebruik geskrewe aanwysings om in enkelkanaal-oudiolêers in te voer, en verseker die vaslegging van unieke spraakpatrone, tone en nuanses spesifiek vir daardie individu.
Dialoog Geskrif & Spontane Toespraak
Twee-persoon interaksie, repliseer werklike gesprekke en dialoë met veeltalige blootstelling via dubbelkanaal lêers en getranskribeerde hulpbronne.
Groep / Muti-party
gesprekke
Multipersoonbesprekings, vaslegging van groepdinamika, oorvleuelings en gevarieerde toonsoorte om spraakmodelle akkuraat op te lei.
Wekwoord / Sleutelfrase / Uitingversameling
Lei KI's op om sleutelfrases te identifiseer of wakker woorde of uitinge met soortgelyke betekenisse te gebruik deur diverse, ryk en outentieke uitinge te gebruik vir gevorderde natuurlike taalverwerking en -begrip.
Akoestiese data
versameling
Ons kan professioneel oudiodata van ateljeegehalte opneem, hetsy restaurante, kantore of huise of van verskeie omgewings en tale, terwyl ons 'n groter akoestiese reeks dek (Omvattende klankdatastelle).
Outomatiese spraakherkenning (ASR)
Verbeter akkuraatheid van jou outomatiese spraakherkenning (ASR) stelsels deur toegang te hê tot moderne gediversifiseerde spraak-/klankdatastelle, uit 'n wye verskeidenheid demografiese inligting.
Veeltalige spraak-/oudio-opleidingsdata
Ons bekwame taalkundiges, regoor die wêreld, bied veeltalige oudio-/spraakdata in verskeie tale en dialekte. Hierdie poging bevorder globale kommunikasie en oorbrug taalhindernisse, wat bydra tot meer inklusiewe en doeltreffende KI-oplossings.
Teks-na-spraak
(TTS)
Bou 'n teks-na-spraak (TTS) veeltalige model met die hulp van ons wêreldwye arbeidsmag, wat jou help om spraakdata in 150+ tale en dialekte in te samel om jou KI-modelle van in-motor-kontroles tot kletsbotte en leeroplossings met hoë- kwaliteit klankdata.
Call Center
gesprekke
Opregte uitruilings tussen agente en kliënte, wat talle tale ondersteun soos Spaans, Duits, Amerikaanse Engels, Bengaals, Japannees, Chinees en Hindi.
Sukses Stories
Gespreks-KI-datastelle met meer as 3k uur se data oor 8 tale
Op soek na die bou van 'n veeltalige platform vir Indiese tale, het die kliënt 'n vennootskap met Shaip aangegaan om groot datastelle in verskeie Indiese tale te versamel, te segmenteer en te transkribeer. Dit sal help om effektiewe spraakmodelle te ontwikkel wat die kliënt se innoverende nuwe platform kan aandryf.
Probleem: Meer as 3,000 8 uur se oudiodata wat in XNUMX Indiese tale ingesamel is, gesegmenteer en getranskribeer om outomatiese spraakherkenning te ontwikkel.
Oplossing: Ons het data-insameling, segmentering, transkripsie verskaf en JSON-lêers met metadata afgelewer. Ons het 3000 uur se oudiodata in 8 Indiese tale op skaal ingesamel vir die kliënt se spraaktegnologieprojek.
Redes om Shaip te kies as u betroubare vennoot vir die versameling van spraakdata
Mense
Toegewyde en opgeleide spanne:
- 30,000+ medewerkers vir die skep van data, etikettering en QA
- Gesertifiseerde projekbestuurspan
- Ervare produkontwikkelingspan
- Talent Pool Sourcing & Onboarding Team
proses
Die hoogste doeltreffendheid van die proses word verseker deur:
- Robuuste 6 Sigma Stage-Gate-proses
- 'N Toegewyde span van 6 Sigma swart gordels - Belangrike prosesseienaars en voldoening aan gehalte
- Deurlopende verbetering en terugvoerlus
platform
Die gepatenteerde platform bied voordele:
- Web-gebaseerde end-to-end platform
- Onberispelike kwaliteit
- Vinniger TAT
- Naadloze aflewering
Mense
Toegewyde en opgeleide spanne:
- 30,000+ medewerkers vir die skep van data, etikettering en QA
- Gesertifiseerde projekbestuurspan
- Ervare produkontwikkelingspan
- Talent Pool Sourcing & Onboarding Team
proses
Die hoogste doeltreffendheid van die proses word verseker deur:
- Robuuste 6 Sigma Stage-Gate-proses
- 'N Toegewyde span van 6 Sigma swart gordels - Belangrike prosesseienaars en voldoening aan gehalte
- Deurlopende verbetering en terugvoerlus
platform
Die gepatenteerde platform bied voordele:
- Web-gebaseerde end-to-end platform
- Onberispelike kwaliteit
- Vinniger TAT
- Naadloze aflewering
Van die rak spraak- / oudiodatastelle
besonderhede | Corpus ID (Uniek) | Sleutelwoord | Taaldatastel | Taalkode | Voorbeeldkoers | Datastel tipe | Totale oudio-ure | Kort beskrywing | Datastelbeskrywing | Audio Channel | Opname platform | WER (%) | Klank-formaat | Transkripsie-formaat | Gebruiksgeval | Aantal sprekers | GTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
New York Engels_GC_8 | New York Engels | New York Engels | nl_NL> | 8 kHz | Algemene gesprek | 107 | New York Engels Algemene Gesprek data | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 118, Man 114, Onbekend 0 | Kontak Ons | |
Russies_SM_48 | Russiese | Russiese | ru-ru | 48 kHz | Geskrewe monoloog | 2,398 | Russiese skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1689 Man 1937 Onbekend 214 | Kontak Ons | |
Punjabi_MA | Pandjabi | Punjabi (in pyplyn) | Pandjabi | Media Oudio | 40 | Punjabi (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Punjabi_GC | Pandjabi | Punjabi (in pyplyn) | Pandjabi | Algemene gesprek | 100 | Punjabi (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Punjabi_CC_8 | Pandjabi | Punjabi (in pyplyn) | Pandjabi | Inbelsentrum | 60 | Punjabi (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Pools Pole_SM_48 | Pools (Pole) | Pools (Pole) | pl-pl | 48 kHz | Geskrewe monoloog | 1,482 | Pools Pole - Skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1324 Manlik 701 Onbekend 24 | Kontak Ons | |
Pools_MA_16 | Pools | Pools | pl_PL | 16 kHz | Media Oudio | 269 | Poolse media klank | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 173 Manlik 354 Onbekend 6 | Kontak Ons | |
Oriya_MA | Oriya | Oriya (in pyplyn) | of_IN | Media Oudio | 40 | Oriya (In Pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Oriya_GC | Oriya | Oriya (in pyplyn) | of_IN | Algemene gesprek | 100 | Oriya (In Pyplyn) Algemene Gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Oriya_CC_8 | Oriya | Oriya (in pyplyn) | of_IN | Inbelsentrum | 60 | Oriya (In Pipeline) Call-Center data | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Nieu-Seeland_MA_16 | Nieu-Seeland Engels | Nieu-Seeland Engels | af_NZ | 16 kHz | Media Oudio | 400 | Nieu-Seeland Engelse media oudio | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 367, man 678, Onbekend 26 | Kontak Ons | |
Nieu-Seeland_GC_8 | Nieu-Seeland Engels | Nieu-Seeland Engels | af_NZ | 8 kHz | Algemene gesprek | 148 | Nieu-Seeland Engels Algemene Gesprek data | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 167, man 121, Onbekend 4 | Kontak Ons | |
New York Engels_MA_16 | New York Engels | New York Engels | nl_NL> | 16 kHz | Media Oudio | 140 | New York Engelse Media oudio data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 66, Man 230, Onbekend 11 | Kontak Ons | |
Skotse_GC_8 | Skots (Engelse aksent) | Skots (Engelse aksent) | en_AB | 8 kHz | Algemene gesprek | 292 | Skotse Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 285, Manlik 260, Onbekend 3 | Kontak Ons | |
New York Engels_CC_8 | New York Engels | New York Engels | nl_NL> | 8 kHz | Inbelsentrum | 103 | New York Engelse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 610, Manlik 532, Onbekend 0 | Kontak Ons | |
Nederland_SM_48 | Nederlands | Nederlands | nl-NL | 48 kHz | Geskrewe monoloog | 1,205 | Nederlandse skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1285 Manlik 531 Onbekend 3 | Kontak Ons | |
Mexikaanse_SM_48 | Spaans (Mexiko) | Spaans (Mexiko) | af-MX | 48 kHz | Geskrewe monoloog | 1,492 | Mexikaanse Spaanse skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1016 Manlik 1069 Onbekend 95 | Kontak Ons | |
Marathi_MA | Marathi | Marathi (in pyplyn) | mnr_IN | Media Oudio | 40 | Marathi (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Marathi_GC | Marathi | Marathi (in pyplyn) | mnr_IN | Algemene gesprek | 100 | Marathi (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Marathi_CC_8 | Marathi | Marathi (in pyplyn) | mnr_IN | Inbelsentrum | 60 | Marathi (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Malabaars_MA | Malabaars | Malabaars (in pyplyn) | ml_IN | Media Oudio | 40 | Malabaars (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Malabaars_GC | Malabaars | Malabaars (in pyplyn) | ml_IN | Algemene gesprek | 100 | Malabaars (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Malabaars_CC_8 | Malabaars | Malabaars (in pyplyn) | ml_IN | Inbelsentrum | 60 | Malabaars (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Maleis_MA_16 | malay | malay | ms_MY | 16 kHz | Media Oudio | 344 | Maleisiese media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 236, Man 626, Onbekend 47 | Kontak Ons | |
Maleis_GC_8 | malay | malay | ms_MY | 8 kHz | Algemene gesprek | 266 | Maleisiese algemene gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Maleis in Maleisië | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 316, Manlik 176, Onbekend 0 | Kontak Ons | |
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Algemene gesprek | 553 | Telugu Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 574, Manlik 564, Onbekend 0 | Kontak Ons | |
VK Engels_WW_16 | Britse Engels | Britse Engels | en_uk | 16 kHz | Wake Word | 200 Sprekers | Wake Word UK Engels | sleutelfrases versameling van data
| 1 kanaal | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Geslag: 50% manlik, 50% vroulik, +/- 10%. | Kontak Ons | |
Wallies_GC_8 | Wallies (Engelse aksent) | Wallies (Engelse aksent) | en_WL | 8 kHz | Algemene gesprek | 278 | Walliese Algemene Gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 270, Man 324, Onbekend 0 | Kontak Ons | |
Viëtnamees_MA_16 | Viëtnamese | Viëtnamese | vi_VN | 16 kHz | Media Oudio | 257 | Viëtnamese media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 249, man 200, Onbekendes 45 | Kontak Ons | |
Viëtnamees_GC_8 | Viëtnamese | Viëtnamese | vi_VN | 8 kHz | Algemene gesprek | 295 | Viëtnamese algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, Noordelike (bv. Hanoi), Sentraal en Suidelike (bv. Ho Chi Minh-stad). | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 400, man 380, Onbekendes 2 | Kontak Ons | |
Turkse Turkye_SM_48 | Turkse Turkye | Turkse Turkye | tr-TR | 48 kHz | Geskrewe monoloog | 2,027 | Turkse Turkye | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1561 Manlik 1241 Onbekend 31 | Kontak Ons | |
Thai_MA_8 | Thai | Thai | de_DE | 16 kHz | Media Oudio | 173 | Thai Media klank | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 143, Man 502, Onbekend 26 | Kontak Ons | |
Thai_GC_8 | Thai | Thai | de_DE | 8 kHz | Algemene gesprek | 183 | Thai Algemene Gesprek | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, 'n informele register wat tussen vriende gebruik word | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 338, Man 96, Onbekend 8 | Kontak Ons | |
Telugu_MA | telugu | Telugu (in pyplyn) | te_IN | Media Oudio | 20 | Telugu (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Telugu_GC | telugu | Telugu (in pyplyn) | te_IN | Algemene gesprek | 50 | Telugu (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Telugu_CC_8 | telugu | Telugu (in pyplyn) | te_IN | Inbelsentrum | 30 | Telugu (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Media Oudio | 648 | Telugu Media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 207, Man 963, Onbekend 2 | Kontak Ons | |
Koreaans_SM_48 | Koreaanse | Koreaanse | ko-KR | 48 kHz | Geskrewe monoloog | 1,955 | Koreaanse skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1195 Man 1134 Onbekend 122 | Kontak Ons | |
Tamil_MA | tamil | Tamil (in pyplyn) | ta_IN | Media Oudio | 40 | Tamil (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Tamil_GC | tamil | Tamil (in pyplyn) | ta_IN | Algemene gesprek | 100 | Tamil (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Tamil_CC_8 | tamil | Tamil (in pyplyn) | ta_IN | Inbelsentrum | 60 | Tamil (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Sweeds_MA_16 | Sweeds | Sweeds | sv_SE | 16 kHz | Media Oudio | 278 | Sweedse media klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 195, man 500, Onbekend 21 | Kontak Ons | |
Sweeds_CC_8 | Sweeds | Sweeds | sv_SE | 8 kHz | Inbelsentrum | 250 | Sweedse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 1581, man 727, Onbekend 2 | Kontak Ons | |
Swahili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Media Oudio | 265 | Swahili Media klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 118, Man 493, Onbekend 25 | Kontak Ons | |
Swahili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Inbelsentrum | 230 | Swahili Call-Center data | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 611, Man 833, Onbekend 0 | Kontak Ons | |
Suid-Afrikaanse Engels_MA_16 | Suid-Afrikaanse Engels | Suid-Afrikaanse Engels | en_ZA | 16 kHz | Media Oudio | 251 | Suid-Afrikaanse Engelse Media oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 235, Man 432, Onbekend 36 | Kontak Ons | |
Suid-Afrikaanse Engels_CC_8 | Suid-Afrikaanse Engels | Suid-Afrikaanse Engels | en_ZA | 8 kHz | Inbelsentrum | 261 | Suid-Afrikaanse Engelse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1274, Manlik 935, Onbekend 1 | Kontak Ons | |
Singapoer_MA_16 | Singapoer Engels | Singapoer Engels | en_SG | 16 kHz | Media Oudio | 247 | Singapore Media klank data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 160, Man 455, Onbekend 37 | Kontak Ons | |
Singapoer_CC_8 | Singapoer Engels | Singapoer Engels | en_SG | 8 kHz | Inbelsentrum | 218 | Singapoer Call-Center data | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 2139, Manlik 884, Onbekend 21 | Kontak Ons | |
Boston_CC_8 | Boston Engels | Boston Engels | nl_NL> | 8 kHz | Inbelsentrum | 177 | Boston oproepsentrum data | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 605, Manlik: 711, en Onbekend: 0 | Kontak Ons | |
Engels Deep South_CC_8 | Engels Diep Suid | Engels Diep Suid | nl_NL> | 8 kHz | Inbelsentrum | 151 | Engelse Deep South Call-center data | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 221 , Manlik 1004 , Onbekend 7 | Kontak Ons | |
Deens_SM_48 | Deense | Deense | da-DK | 48 kHz | Geskrewe monoloog | 2,579 | Deense skrifmonoloog | Enkel-uiting opnames, wat geneig is om te val in die 5 tot 30 sekonde reeks, Deens uit Denemarke | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1551 Man 1233 Onbekend 42 | Kontak Ons | |
Deens_MA_16 | Deense | Deense | da_DK | 16 kHz | Media Oudio | 664 | Deense media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou: 369, Man: 864, Onbekend: 27 | Kontak Ons | |
Deens_GC_8 | Deense | Deense | da_DK | 8 kHz | Algemene gesprek | 372 | Deense Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou: 311, Man: 417, Onbekend: 0 | Kontak Ons | |
Chinees Tradisioneel_SM_48 | Tradisionele Sjinees | Tradisionele Sjinees | zh-TW | 48 kHz | Geskrewe monoloog | 1,028 | Tradisionele Sjinees | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1069 Manlik 262 Onbekend 3 | Kontak Ons | |
Sjinees vereenvoudig_SM_48 | Chinese Simplified | Chinese Simplified | zh-CN | 48 kHz | Geskrewe monoloog | 2,762 | Chinese Simplified | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1920 Man 1535 Onbekend 270 | Kontak Ons | |
Chinees_MA_16 | Chinese Engels | Chinese Engels | nl_NL> | 16 kHz | Media Oudio | 249 | Chinese media oudio data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 126, Manlik: 346 en Onbekend: 6 | Kontak Ons | |
Chinees_CC_8 | Chinese Engels | Chinese Engels | nl_NL> | 8 kHz | Inbelsentrum | 169 | Chinese oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 1790, Manlik: 523 en Onbekend: 13 | Kontak Ons | |
Kanadese_SM_48 | Kanadese Frans | Kanadese Frans | fr-CA | 48 kHz | Geskrewe monoloog | 1,222 | Kanadese Frans | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 974 Manlik 631 Onbekend 1 | Kontak Ons | |
Boston_MA_16 | Boston Engels | Boston Engels | nl_NL> | 16 kHz | Media Oudio | 93 | Boston Media klank data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 43, Manlik: 181, en Onbekend: 2 | Kontak Ons | |
Boston_GC_8 | Boston Engels | Boston Engels | nl_NL> | 8 kHz | Algemene gesprek | 32 | Boston Algemene Gesprek data | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 53, Manlik: 83, en Onbekend: 0 | Kontak Ons | |
Engels Deep South_GC_8 | Engels Diep Suid | Engels Diep Suid | nl_NL> | 8 kHz | Algemene gesprek | 56 | Engelse Deep South Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 99, Man 31, Onbekend 0 | Kontak Ons | |
Bengali_MA | bengali | Bengaals (in pyplyn) | bn_IN | Media Oudio | 40 | Bengaals (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Bengali_GC | bengali | Bengaals (in pyplyn) | bn_IN | Algemene gesprek | 100 | Bengaalse (in pyplyn) algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Bengali_CC_8 | bengali | Bengaals (in pyplyn) | bn_IN | Inbelsentrum | 60 | Bengaalse (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Assamees_MA | Assamees | Assamees (in pyplyn) | soos in | Media Oudio | 40 | Assamees (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Assamees_GC | Assamees | Assamees (in pyplyn) | soos in | Algemene gesprek | 100 | Assamees (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Assamees_CC_8 | Assamees | Assamees (in pyplyn) | soos in | Inbelsentrum | 60 | Assamees (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Arabies_SM_48 | Arabiese | Arabiese | ar | 48 kHz | Geskrewe monoloog | 1,947 | Arabiese skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 838 Manlik 1209 Onbekend 78 | Kontak Ons | |
Arabies_GC_8 | Arabiese | Arabiese | ar_AE | 8 kHz | Algemene gesprek | 292 | Arabiese Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Arabies van Golflande | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 171, Manlik: 534, en Onbekend: 1 | Kontak Ons | |
Afrikaans_MA_16 | Afrikaans | Afrikaans | af_ZA | 16 kHz | Media Oudio | 658 | Afrikaanse medialêers | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 750, Manlik: 1278, en Onbekend: 52 | Kontak Ons | |
Afrikaans_GC_8 | Afrikaans | Afrikaans | af_ZA | 8 kHz | Algemene gesprek | 368 | Afrikaans Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Afrikaans gepraat in Afrika | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 502, Manlik: 390, en Onbekend: 2 | Kontak Ons | |
af_US_MA_16 | Afro-Amerikaanse taal | Afro-Amerikaanse taal | nl_NL> | 16 kHz | Media Oudio | 154 | Afro-Amerikaanse Vernacular Media data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 151, Manlik: 150, en Onbekend: 10 | Kontak Ons | |
HINGLISH_MA_16 | Hengelse | Hengelse | hg_IN | 16 kHz | Media Oudio | 216 | HINGLISH Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 75, Man 380, Onbekend 0 | Kontak Ons | |
Koreaans_MA_16 | Koreaanse | Koreaanse | ko_KR | 16 kHz | Media Oudio | 204 | Koreaanse media klank data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 70 Man 303, Onbekend 25 | Kontak Ons | |
Koreaans_CC_8 | Koreaanse | Koreaanse | ko_KR | 8 kHz | Inbelsentrum | 107 | Koreaanse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1086, Manlik 210, Onbekend 4 | Kontak Ons | |
Kannada_MA | kannada | Kannada (in pyplyn) | kn_IN | Media Oudio | 40 | Kannada (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Kannada_GC | kannada | Kannada (in pyplyn) | kn_IN | Algemene gesprek | 100 | Kannada (In Pyplyn) Algemene Gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Kannada_CC_8 | kannada | Kannada (in pyplyn) | kn_IN | Inbelsentrum | 60 | Kannada (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Japannees_SM_48 | Japannese | Japannese | ek-JP | 48 kHz | Geskrewe monoloog | 2,335 | Japannese skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1460 Man 1221 Onbekend 194 | Kontak Ons | |
Iers_GC_8 | Ierse | Ierse | en_IE | 8 kHz | Algemene gesprek | 192 | Ierse Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 213, Manlik 153, Onbekend 0 | Kontak Ons | |
Indonesies_MA_16 | Indonesiese | Indonesiese | ek het | 16 kHz | Media Oudio | 643 | Indonesiese media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 746, Man 1507, Onbekend 129 | Kontak Ons | |
Indonesies_GC_8 | Indonesiese | Indonesiese | ek het | 8 kHz | Algemene gesprek | 496 | Indonesiese algemene gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Indonesies | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 524, Man 454, Onbekend 2 | Kontak Ons | |
Hispanic_MA_16 | Spaans Engels | Spaans Engels | nl_NL> | 16 kHz | Media Oudio | 155 | Hispanic Call Media klank | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 140, Man 219, Onbekend 5 | Kontak Ons | |
Hispanic_CC_8 | Spaans Engels | Spaans Engels | nl_NL> | 8 kHz | Inbelsentrum | 212 | Spaanse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 822, Man 1262, Onbekend 0 | Kontak Ons | |
af_US_CC_8 | Afro-Amerikaanse taal | Afro-Amerikaanse taal | nl_NL> | 8 kHz | Inbelsentrum | 211 | Afro-Amerikaanse Inbelsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 612, Manlik: 1242, en Onbekend: 12 | Kontak Ons | |
HINGLISH_CC_8 | Hengelse | Hengelse | hg_IN | 8 kHz | Inbelsentrum | 208 | HINGLISH Inbelsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 822, Man 1262, Onbekend 0 | Kontak Ons | |
Hindi_SM_48 | hindi | hindi | hi-IN | 48 kHz | Geskrewe monoloog | 2,867 | Hindi skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1977 Man 1864 Onbekend 147 | Kontak Ons | |
Hindi_MA_16 | hindi | hindi | hi_IN | 16 kHz | Media Oudio | 219 | Hindi Media klank data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 83, Manlik 309, Onbekend 0 | Kontak Ons | |
Hebreeus_MA_16 | Hebreeus | Hebreeus | hy_IL | 16 kHz | Media Oudio | 427 | Hebreeuse Media klank data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 361, Manlik 513, Onbekend 13 | Kontak Ons | |
Hebreeus_Algemene Gesprek_8 | Hebreeus | Hebreeus | hy_IL | 8 kHz | Algemene gesprek | 399 | Hebreeuse Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Hebreeus in Israel | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 414, Manlik 399, Onbekend 1 | Kontak Ons | |
Gujarati_MA | gujarati | Gujarati (in pyplyn) | gu_IN | Media Oudio | 40 | Gujarati (in pyplyn) Media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Gujarati_GC | gujarati | Gujarati (in pyplyn) | gu_IN | Algemene gesprek | 100 | Gujarati (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Gujarati_CC_8 | gujarati | Gujarati (in pyplyn) | gu_IN | Inbelsentrum | 60 | Gujarati (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak Ons | ||||
Duits_IVR_8 | Duitse | Duitse | de-De | 8 kHz | IVR | 200 | Duitse IVR data | Mens tot masjien. 'n IVR-tipe vloei waar daar 'n TTS-prompt is (bv. "Hoe kan ek jou help") gevolg deur 'n spontane menslike reaksie | Mono | lessenaar | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 10115 Man 8750 Onbekend 0 | Kontak Ons | ||
Duits_CC_8 | Duitse | Duitse | de-De | 8 kHz | Inbelsentrum | 64 | Duitse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Mono | lessenaar | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 478 Manlik 1440 Onbekend 0 | Kontak Ons | ||
Engels diep suid_MA_16 | Engels Diep Suid | Engels Diep Suid | nl_NL> | 16 kHz | Media Oudio | 266 | Engelse Deep South Media oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 204, Man 356, Onbekend 21 | Kontak Ons |
dienste wat aangebied word
Deskundige klankdata-insameling is nie alles in die hande vir uitgebreide AI-opstellings nie. By Shaip kan u selfs die volgende dienste oorweeg om modelle meer algemeen as gewoonlik te maak:
Versameling van teksdata
Dienste
Die ware waarde van Shaip -kognitiewe data -insamelingsdienste is dat dit organisasies die sleutel gee om kritieke inligting wat in ongestruktureerde data voorkom, te ontsluit
Dienste vir die versameling van beelddata
Maak seker dat u rekenaarvisiemodel elke beeld akkuraat identifiseer om die volgende generasie AI-modelle van die toekoms naatloos op te lei
Dienste vir die versameling van video-data
Konsentreer nou op rekenaarvisie saam met NLP vir die opleiding van u modelle om voorwerpe, individue, afskrikmiddels en ander visuele elemente tot volmaaktheid te identifiseer
Aanbevole bronne
Bied
Audio -aantekening vir intelligente AI's
Oudio-aantekeningdienste is sedert die begin 'n sterk punt van Shaip. Ontwikkel, lei op en verbeter gespreks-KI, kletsbotte en spraakherkenningsenjins met ons moderne klankaantekeningdienste.
Kopergids
Kopersgids: Volledige Gids tot Gespreks-KI
Die kletsbot waarmee jy gesels het, loop op 'n gevorderde gespreks-KI-stelsel wat opgelei, getoets en gebou is met behulp van tonne spraakherkenningdatastelle.
Data Katalogus
Van die rak af spraakdatakatalogus en lisensiëring
Daar is 'n wye verskeidenheid algemene toepassings vir spraakdata in KI-projekte. Ons bied u groot hoeveelhede data van hoë gehalte gereed vir u stemherkenning.
Wil jy jou eie oudiodatastel bou?
Maak kontak met ons interne spraakdata-insamelingsdeskundige om 'n oudiobewaarplek op te stel wat die beste by jou behoefte pas
Algemene vrae (FAQ)
Spraakdata-insameling vir 'n ML-model verwys na die proses om oudio-opnames van gesproke taal te versamel. Hierdie versameling help met die opleiding en verfyning van masjienleeralgoritmes, veral dié wat gesentreer is op die verstaan en verwerking van menslike stemme.
Wanneer jy daarna streef om oudiodata vir Outomatiese Spraakherkenning (ASR) in te samel, moet jy begin deur jou projek se spesifieke behoeftes te definieer, insluitend die verlangde taal, aksent en tipe spraak. Nadat u hierdie parameters gestel het, maak seker dat u alle nodige toestemmings verkry om gebruikersprivaatheid te respekteer. Gebruik dan toepaslike opnametoestelle of sagteware om duidelike oudiomonsters vas te vang. Elke opname moet noukeurig geannoteer word met sy transkripsie of ander pertinente metadata en sistematies gestoor word vir moeitelose toegang.
'n Spraakdatastel in masjienleer is deurslaggewend vir opleiding, toetsing en validering van modelle wat aangepas is om gesproke taal te herken, transkribeer of interpreteer. Sulke datastelle baan die weg vir 'n magdom toepassings, van stemassistente en transkripsiedienste tot stembiometrie.
Om presiese data van uiteenlopende tale en aksente in te samel, is samewerking met moedertaalsprekers van die verlangde linguistiese agtergronde noodsaaklik. Streef na 'n gevarieerde en verteenwoordigende steekproef om 'n breë spektrum van demografiese nuanses te dek. Gebruik gestandaardiseerde opnametoerusting in eenvormige omgewings om klankkonsekwentheid te verseker. En belangrik, annoteer elke datastuk met gedetailleerde transkripsies en metadata, wat die spesifieke taal en aksent aandui.