Mees betroubare spraakdata-insamelingsdienste vir jou KI

Leer u NLP -modelle, VA's, TTS -prototipes en meer op met gespreksdata van hoë gehalte, met ons klank- en spraakdata -insamelingsdienste

Ontdek klankdatapypleidings sonder knelpunte

Kontak Ons

Voorgestelde kliënte

Enige onderwerp. Enige scenario.

By Shaip lê ons kundigheid in die skep van hoëgehalte-spraakdatastelle wat ontwerp is vir uiteenlopende KI/ML-vereistes. Ons bied 'n uitgebreide reeks tale en rekord in uiteenlopende instellings wat ons datastelle omvattend en aanpasbaar maak. Ou fokus is om modelle met die hoogste volume persoonlike spraakdata in die minste moontlike tyd te voed. Met ons aan boord kan jy verwag:

Samegestelde veeltalige klank- / stemdata van hoë gehalte om akkuraatheid te verbeter
Hoogste moontlike vlak van domeinspesifisiteit aan target diverse scenario setup

Skaal jou ML-model om by diverse demografie en vertikale te pas
Opname omgewings: Studio kwaliteit, met kristalhelder oudio met minimale agtergrondgeraas, en Natuurlike omgewings, waar opnames omgewingsklanke insluit om werklike situasies na te boots.

100 +

lande

55K +

Ure se spraakdata

250 +

projekte

60 +

Tale (100+ dialekte)

8 / 16 / 44 / 48 kHz

Sampling rate

Ons kundigheid

Belyn oudiodata vir slimmer NLP-modelle

Shaip bied eind-tot-einde spraak-/klankdata-insamelingsdienste in meer as 100 tale aan om tegniese tegnologieë moontlik te maak vir 'n uiteenlopende groep gehore regoor die wêreld. Ons kan werk aan projekte van enige omvang en grootte; van die lisensiëring van bestaande klankdatastelle van die rak af, tot die bestuur van pasgemaakte klankdata-insameling, tot klank-transkripsie en aantekening. Maak nie saak hoe groot u spraakdata-insamelingsprojek is nie, ons kan die klankversamelingsdienste aanpas by u behoeftes om hoë kwaliteit NLP-datastelle te bou wat op dialekte, klanke en tale gerig is. Kies uit ons wye reeks spraakdatastelle en klankdata-insamelingshulpbronne vir intelligente opstellings wat stem moontlik maak.

Sukses Stories

Gespreks-KI-datastelle met meer as 3k uur se data oor 8 tale

Op soek na die bou van 'n veeltalige platform vir Indiese tale, het die kliënt 'n vennootskap met Shaip aangegaan om groot datastelle in verskeie Indiese tale te versamel, te segmenteer en te transkribeer. Dit sal help om effektiewe spraakmodelle te ontwikkel wat die kliënt se innoverende nuwe platform kan aandryf.

Probleem: Meer as 3,000 8 uur se oudiodata wat in XNUMX Indiese tale ingesamel is, gesegmenteer en getranskribeer om outomatiese spraakherkenning te ontwikkel.

Oplossing: Ons het data-insameling, segmentering, transkripsie verskaf en JSON-lêers met metadata afgelewer. Ons het 3000 uur se oudiodata in 8 Indiese tale op skaal ingesamel vir die kliënt se spraaktegnologieprojek.

Redes om Shaip te kies as u betroubare vennoot vir die versameling van spraakdata

Mense

Toegewyde en opgeleide spanne:

30,000+ medewerkers vir die skep van data, etikettering en QA
Gesertifiseerde projekbestuurspan
Ervare produkontwikkelingspan
Talent Pool Sourcing & Onboarding Team

proses

Die hoogste doeltreffendheid van die proses word verseker deur:

Robuuste 6 Sigma Stage-Gate-proses
'N Toegewyde span van 6 Sigma swart gordels - Belangrike prosesseienaars en voldoening aan gehalte
Deurlopende verbetering en terugvoerlus

platform

Die gepatenteerde platform bied voordele:

Web-gebaseerde end-to-end platform
Onberispelike kwaliteit
Vinniger TAT
Naadloze aflewering

Mense

Toegewyde en opgeleide spanne:

30,000+ medewerkers vir die skep van data, etikettering en QA
Gesertifiseerde projekbestuurspan
Ervare produkontwikkelingspan
Talent Pool Sourcing & Onboarding Team

proses

Die hoogste doeltreffendheid van die proses word verseker deur:

Robuuste 6 Sigma Stage-Gate-proses
'N Toegewyde span van 6 Sigma swart gordels - Belangrike prosesseienaars en voldoening aan gehalte
Deurlopende verbetering en terugvoerlus

platform

Die gepatenteerde platform bied voordele:

Web-gebaseerde end-to-end platform
Onberispelike kwaliteit
Vinniger TAT
Naadloze aflewering

Van die rak spraak- / oudiodatastelle

Corpus ID (Uniek)	Sleutelwoord	Taaldatastel	Taalkode	Voorbeeldkoers	Datastel tipe	Totale oudio-ure	Kort beskrywing	Datastelbeskrywing	Audio Channel	Opname platform	WER (%)	Klank-formaat	Transkripsie-formaat	Gebruiksgeval	Aantal sprekers	GTA
af_US_CC_8	Afro-Amerikaanse taal	Afro-Amerikaanse taal	nl_NL>	8 kHz	Inbelsentrum	211	Afro-Amerikaanse Inbelsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik: 612, Manlik: 1242, en Onbekend: 12	Kontak Ons
af_US_MA_16	Afro-Amerikaanse taal	Afro-Amerikaanse taal	nl_NL>	16 kHz	Media Oudio	154	Afro-Amerikaanse Vernacular Media data	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik: 151, Manlik: 150, en Onbekend: 10	Kontak Ons
Afrikaans_GC_8	Afrikaans	Afrikaans	af_ZA	8 kHz	Algemene gesprek	368	Afrikaans Algemene Gespreksdata	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Afrikaans gepraat in Afrika	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik: 502, Manlik: 390, en Onbekend: 2	Kontak Ons
Afrikaans_MA_16	Afrikaans	Afrikaans	af_ZA	16 kHz	Media Oudio	658	Afrikaanse medialêers	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik: 750, Manlik: 1278, en Onbekend: 52	Kontak Ons
Arabies_GC_8	Arabiese	Arabiese	ar_AE	8 kHz	Algemene gesprek	292	Arabiese Algemene Gespreksdata	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Arabies van Golflande	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik: 171, Manlik: 534, en Onbekend: 1	Kontak Ons
Arabies_SM_48	Arabiese	Arabiese	ar	48 kHz	Geskrewe monoloog	1,947	Arabiese skrifmonoloog	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 838 Manlik 1209 Onbekend 78	Kontak Ons
Assamees_CC_8	Assamees	Assamees (in pyplyn)	soos in		Inbelsentrum	60	Assamees (in pyplyn) oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Assamees_GC	Assamees	Assamees (in pyplyn)	soos in		Algemene gesprek	100	Assamees (in pyplyn) Algemene gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Assamees_MA	Assamees	Assamees (in pyplyn)	soos in		Media Oudio	40	Assamees (in pyplyn) Media-oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute		Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Bengali_CC_8	bengali	Bengaals (in pyplyn)	bn_IN		Inbelsentrum	60	Bengaalse (in pyplyn) oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Bengali_GC	bengali	Bengaals (in pyplyn)	bn_IN		Algemene gesprek	100	Bengaalse (in pyplyn) algemene gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Bengali_MA	bengali	Bengaals (in pyplyn)	bn_IN		Media Oudio	40	Bengaals (in pyplyn) Media-oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute		Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Boston_CC_8	Boston Engels	Boston Engels	nl_NL>	8 kHz	Inbelsentrum	177	Boston oproepsentrum data	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik: 605, Manlik: 711, en Onbekend: 0	Kontak Ons
Boston_GC_8	Boston Engels	Boston Engels	nl_NL>	8 kHz	Algemene gesprek	32	Boston Algemene Gesprek data	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik: 53, Manlik: 83, en Onbekend: 0	Kontak Ons
Boston_MA_16	Boston Engels	Boston Engels	nl_NL>	16 kHz	Media Oudio	93	Boston Media klank data	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik: 43, Manlik: 181, en Onbekend: 2	Kontak Ons
Kanadese_SM_48	Kanadese Frans	Kanadese Frans	fr-CA	48 kHz	Geskrewe monoloog	1,222	Kanadese Frans	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 974 Manlik 631 Onbekend 1	Kontak Ons
Chinees_CC_8	Chinese Engels	Chinese Engels	nl_NL>	8 kHz	Inbelsentrum	169	Chinese oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik: 1790, Manlik: 523 en Onbekend: 13	Kontak Ons
Chinees_MA_16	Chinese Engels	Chinese Engels	nl_NL>	16 kHz	Media Oudio	249	Chinese media oudio data	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik: 126, Manlik: 346 en Onbekend: 6	Kontak Ons
Sjinees vereenvoudig_SM_48	Chinese Simplified	Chinese Simplified	zh-CN	48 kHz	Geskrewe monoloog	2,762	Chinese Simplified	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1920 Man 1535 Onbekend 270	Kontak Ons
Chinees Tradisioneel_SM_48	Tradisionele Sjinees	Tradisionele Sjinees	zh-TW	48 kHz	Geskrewe monoloog	1,028	Tradisionele Sjinees	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1069 Manlik 262 Onbekend 3	Kontak Ons
Deens_GC_8	Deense	Deense	da_DK	8 kHz	Algemene gesprek	372	Deense Algemene Gespreksdata	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou: 311, Man: 417, Onbekend: 0	Kontak Ons
Deens_MA_16	Deense	Deense	da_DK	16 kHz	Media Oudio	664	Deense media-klankdata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou: 369, Man: 864, Onbekend: 27	Kontak Ons
Deens_SM_48	Deense	Deense	da-DK	48 kHz	Geskrewe monoloog	2,579	Deense skrifmonoloog	Enkel-uiting opnames, wat geneig is om te val in die 5 tot 30 sekonde reeks, Deens uit Denemarke	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1551 Man 1233 Onbekend 42	Kontak Ons
Engels Deep South_CC_8	Engels Diep Suid	Engels Diep Suid	nl_NL>	8 kHz	Inbelsentrum	151	Engelse Deep South Call-center data	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 221 , Manlik 1004 , Onbekend 7	Kontak Ons
Engels Deep South_GC_8	Engels Diep Suid	Engels Diep Suid	nl_NL>	8 kHz	Algemene gesprek	56	Engelse Deep South Algemene Gespreksdata	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 99, Man 31, Onbekend 0	Kontak Ons
Engels diep suid_MA_16	Engels Diep Suid	Engels Diep Suid	nl_NL>	16 kHz	Media Oudio	266	Engelse Deep South Media oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 204, Man 356, Onbekend 21	Kontak Ons
Duits_CC_8	Duitse	Duitse	de-De	8 kHz	Inbelsentrum	64	Duitse oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Mono	lessenaar		Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 478 Manlik 1440 Onbekend 0	Kontak Ons
Duits_IVR_8	Duitse	Duitse	de-De	8 kHz	IVR	200	Duitse IVR data	Mens tot masjien. 'n IVR-tipe vloei waar daar 'n TTS-prompt is (bv. "Hoe kan ek jou help") gevolg deur 'n spontane menslike reaksie	Mono	lessenaar		Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 10115 Man 8750 Onbekend 0	Kontak Ons
Gujarati_CC_8	gujarati	Gujarati (in pyplyn)	gu_IN		Inbelsentrum	60	Gujarati (in pyplyn) oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Gujarati_GC	gujarati	Gujarati (in pyplyn)	gu_IN		Algemene gesprek	100	Gujarati (in pyplyn) Algemene gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Gujarati_MA	gujarati	Gujarati (in pyplyn)	gu_IN		Media Oudio	40	Gujarati (in pyplyn) Media-klankdata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute		Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Hebreeus_Algemene Gesprek_8	Hebreeus	Hebreeus	hy_IL	8 kHz	Algemene gesprek	399	Hebreeuse Algemene Gespreksdata	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Hebreeus in Israel	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 414, Manlik 399, Onbekend 1	Kontak Ons
Hebreeus_MA_16	Hebreeus	Hebreeus	hy_IL	16 kHz	Media Oudio	427	Hebreeuse Media klank data	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 361, Manlik 513, Onbekend 13	Kontak Ons
Hindi_MA_16	hindi	hindi	hi_IN	16 kHz	Media Oudio	219	Hindi Media klank data	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 83, Manlik 309, Onbekend 0	Kontak Ons
Hindi_SM_48	hindi	hindi	hi-IN	48 kHz	Geskrewe monoloog	2,867	Hindi skrifmonoloog	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1977 Man 1864 Onbekend 147	Kontak Ons
HINGLISH_CC_8	Hengelse	Hengelse	hg_IN	8 kHz	Inbelsentrum	208	HINGLISH Inbelsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 822, Man 1262, Onbekend 0	Kontak Ons
HINGLISH_MA_16	Hengelse	Hengelse	hg_IN	16 kHz	Media Oudio	216	HINGLISH Media-oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 75, Man 380, Onbekend 0	Kontak Ons
Hispanic_CC_8	Spaans Engels	Spaans Engels	nl_NL>	8 kHz	Inbelsentrum	212	Spaanse oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 822, Man 1262, Onbekend 0	Kontak Ons
Hispanic_MA_16	Spaans Engels	Spaans Engels	nl_NL>	16 kHz	Media Oudio	155	Hispanic Call Media klank	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 140, Man 219, Onbekend 5	Kontak Ons
Indonesies_GC_8	Indonesiese	Indonesiese	ek het	8 kHz	Algemene gesprek	496	Indonesiese algemene gespreksdata	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Indonesies	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 524, Man 454, Onbekend 2	Kontak Ons
Indonesies_MA_16	Indonesiese	Indonesiese	ek het	16 kHz	Media Oudio	643	Indonesiese media-klankdata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 746, Man 1507, Onbekend 129	Kontak Ons
Iers_GC_8	Ierse	Ierse	en_IE	8 kHz	Algemene gesprek	192	Ierse Algemene Gespreksdata	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 213, Manlik 153, Onbekend 0	Kontak Ons
Japannees_SM_48	Japannese	Japannese	ek-JP	48 kHz	Geskrewe monoloog	2,335	Japannese skrifmonoloog	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1460 Man 1221 Onbekend 194	Kontak Ons
Kannada_CC_8	kannada	Kannada (in pyplyn)	kn_IN		Inbelsentrum	60	Kannada (in pyplyn) oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Kannada_GC	kannada	Kannada (in pyplyn)	kn_IN		Algemene gesprek	100	Kannada (In Pyplyn) Algemene Gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Kannada_MA	kannada	Kannada (in pyplyn)	kn_IN		Media Oudio	40	Kannada (in pyplyn) Media-oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute		Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Koreaans_CC_8	Koreaanse	Koreaanse	ko_KR	8 kHz	Inbelsentrum	107	Koreaanse oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1086, Manlik 210, Onbekend 4	Kontak Ons
Koreaans_MA_16	Koreaanse	Koreaanse	ko_KR	16 kHz	Media Oudio	204	Koreaanse media klank data	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 70 Man 303, Onbekend 25	Kontak Ons
Koreaans_SM_48	Koreaanse	Koreaanse	ko-KR	48 kHz	Geskrewe monoloog	1,955	Koreaanse skrifmonoloog	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1195 Man 1134 Onbekend 122	Kontak Ons
Maleis_GC_8	malay	malay	ms_MY	8 kHz	Algemene gesprek	266	Maleisiese algemene gespreksdata	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Maleis in Maleisië	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 316, Manlik 176, Onbekend 0	Kontak Ons
Maleis_MA_16	malay	malay	ms_MY	16 kHz	Media Oudio	344	Maleisiese media-klankdata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 236, Man 626, Onbekend 47	Kontak Ons
Malabaars_CC_8	Malabaars	Malabaars (in pyplyn)	ml_IN		Inbelsentrum	60	Malabaars (in pyplyn) oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Malabaars_GC	Malabaars	Malabaars (in pyplyn)	ml_IN		Algemene gesprek	100	Malabaars (in pyplyn) Algemene gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Malabaars_MA	Malabaars	Malabaars (in pyplyn)	ml_IN		Media Oudio	40	Malabaars (in pyplyn) Media-oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute		Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Marathi_CC_8	Marathi	Marathi (in pyplyn)	mnr_IN		Inbelsentrum	60	Marathi (in pyplyn) oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Marathi_GC	Marathi	Marathi (in pyplyn)	mnr_IN		Algemene gesprek	100	Marathi (in pyplyn) Algemene gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Marathi_MA	Marathi	Marathi (in pyplyn)	mnr_IN		Media Oudio	40	Marathi (in pyplyn) Media-oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute		Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Mexikaanse_SM_48	Spaans (Mexiko)	Spaans (Mexiko)	af-MX	48 kHz	Geskrewe monoloog	1,492	Mexikaanse Spaanse skrifmonoloog	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1016 Manlik 1069 Onbekend 95	Kontak Ons
Nederland_SM_48	Nederlands	Nederlands	nl-NL	48 kHz	Geskrewe monoloog	1,205	Nederlandse skrifmonoloog	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1285 Manlik 531 Onbekend 3	Kontak Ons
New York Engels_CC_8	New York Engels	New York Engels	nl_NL>	8 kHz	Inbelsentrum	103	New York Engelse oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 610, Manlik 532, Onbekend 0	Kontak Ons
New York Engels_GC_8	New York Engels	New York Engels	nl_NL>	8 kHz	Algemene gesprek	107	New York Engels Algemene Gesprek data	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 118, Man 114, Onbekend 0	Kontak Ons
New York Engels_MA_16	New York Engels	New York Engels	nl_NL>	16 kHz	Media Oudio	140	New York Engelse Media oudio data	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 66, Man 230, Onbekend 11	Kontak Ons
Nieu-Seeland_GC_8	Nieu-Seeland Engels	Nieu-Seeland Engels	af_NZ	8 kHz	Algemene gesprek	148	Nieu-Seeland Engels Algemene Gesprek data	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 167, man 121, Onbekend 4	Kontak Ons
Nieu-Seeland_MA_16	Nieu-Seeland Engels	Nieu-Seeland Engels	af_NZ	16 kHz	Media Oudio	400	Nieu-Seeland Engelse media oudio	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 367, man 678, Onbekend 26	Kontak Ons
Oriya_CC_8	Oriya	Oriya (in pyplyn)	of_IN		Inbelsentrum	60	Oriya (In Pipeline) Call-Center data	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Oriya_GC	Oriya	Oriya (in pyplyn)	of_IN		Algemene gesprek	100	Oriya (In Pyplyn) Algemene Gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Oriya_MA	Oriya	Oriya (in pyplyn)	of_IN		Media Oudio	40	Oriya (In Pyplyn) Media-oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute		Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Pools_MA_16	Pools	Pools	pl_PL	16 kHz	Media Oudio	269	Poolse media klank	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 173 Manlik 354 Onbekend 6	Kontak Ons
Pools Pole_SM_48	Pools (Pole)	Pools (Pole)	pl-pl	48 kHz	Geskrewe monoloog	1,482	Pools Pole - Skrifmonoloog	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1324 Manlik 701 Onbekend 24	Kontak Ons
Punjabi_CC_8	Pandjabi	Punjabi (in pyplyn)	Pandjabi		Inbelsentrum	60	Punjabi (in pyplyn) oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Punjabi_GC	Pandjabi	Punjabi (in pyplyn)	Pandjabi		Algemene gesprek	100	Punjabi (in pyplyn) Algemene gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Punjabi_MA	Pandjabi	Punjabi (in pyplyn)	Pandjabi		Media Oudio	40	Punjabi (in pyplyn) Media-oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute		Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Russies_SM_48	Russiese	Russiese	ru-ru	48 kHz	Geskrewe monoloog	2,398	Russiese skrifmonoloog	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1689 Man 1937 Onbekend 214	Kontak Ons
Skotse_GC_8	Skots (Engelse aksent)	Skots (Engelse aksent)	en_AB	8 kHz	Algemene gesprek	292	Skotse Algemene Gespreksdata	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 285, Manlik 260, Onbekend 3	Kontak Ons
Singapoer_CC_8	Singapoer Engels	Singapoer Engels	en_SG	8 kHz	Inbelsentrum	218	Singapoer Call-Center data	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 2139, Manlik 884, Onbekend 21	Kontak Ons
Singapoer_MA_16	Singapoer Engels	Singapoer Engels	en_SG	16 kHz	Media Oudio	247	Singapore Media klank data	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 160, Man 455, Onbekend 37	Kontak Ons
Suid-Afrikaanse Engels_CC_8	Suid-Afrikaanse Engels	Suid-Afrikaanse Engels	en_ZA	8 kHz	Inbelsentrum	261	Suid-Afrikaanse Engelse oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1274, Manlik 935, Onbekend 1	Kontak Ons
Suid-Afrikaanse Engels_MA_16	Suid-Afrikaanse Engels	Suid-Afrikaanse Engels	en_ZA	16 kHz	Media Oudio	251	Suid-Afrikaanse Engelse Media oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 235, Man 432, Onbekend 36	Kontak Ons
Swahili_CC_8	swahili	swahili	sw_KE	8 kHz	Inbelsentrum	230	Swahili Call-Center data	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 611, Man 833, Onbekend 0	Kontak Ons
Swahili_MA_16	swahili	swahili	sw_KE	16 kHz	Media Oudio	265	Swahili Media klankdata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 118, Man 493, Onbekend 25	Kontak Ons
Sweeds_CC_8	Sweeds	Sweeds	sv_SE	8 kHz	Inbelsentrum	250	Sweedse oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 1581, man 727, Onbekend 2	Kontak Ons
Sweeds_MA_16	Sweeds	Sweeds	sv_SE	16 kHz	Media Oudio	278	Sweedse media klankdata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 195, man 500, Onbekend 21	Kontak Ons
Tamil_CC_8	tamil	Tamil (in pyplyn)	ta_IN		Inbelsentrum	60	Tamil (in pyplyn) oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Tamil_GC	tamil	Tamil (in pyplyn)	ta_IN		Algemene gesprek	100	Tamil (in pyplyn) Algemene gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Tamil_MA	tamil	Tamil (in pyplyn)	ta_IN		Media Oudio	40	Tamil (in pyplyn) Media-oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute		Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Telugu_GC_8	telugu	telugu	te_IN	8 kHz	Algemene gesprek	553	Telugu Algemene Gespreksdata	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 574, Manlik 564, Onbekend 0	Kontak Ons
Telugu_MA_16	telugu	telugu	te_IN	16 kHz	Media Oudio	648	Telugu Media-klankdata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 207, Man 963, Onbekend 2	Kontak Ons
Telugu_CC_8	telugu	Telugu (in pyplyn)	te_IN		Inbelsentrum	30	Telugu (in pyplyn) oproepsentrumdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Telugu_GC	telugu	Telugu (in pyplyn)	te_IN		Algemene gesprek	50	Telugu (in pyplyn) Algemene gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,		lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Telugu_MA	telugu	Telugu (in pyplyn)	te_IN		Media Oudio	20	Telugu (in pyplyn) Media-oudiodata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute		Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering		Kontak Ons
Thai_GC_8	Thai	Thai	de_DE	8 kHz	Algemene gesprek	183	Thai Algemene Gesprek	Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, 'n informele register wat tussen vriende gebruik word	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 338, Man 96, Onbekend 8	Kontak Ons
Thai_MA_8	Thai	Thai	de_DE	16 kHz	Media Oudio	173	Thai Media klank	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 143, Man 502, Onbekend 26	Kontak Ons
Turkse Turkye_SM_48	Turkse Turkye	Turkse Turkye	tr-TR	48 kHz	Geskrewe monoloog	2,027	Turkse Turkye	Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val	Mono	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vroulik 1561 Manlik 1241 Onbekend 31	Kontak Ons
Viëtnamees_GC_8	Viëtnamese	Viëtnamese	vi_VN	8 kHz	Algemene gesprek	295	Viëtnamese algemene gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, Noordelike (bv. Hanoi), Sentraal en Suidelike (bv. Ho Chi Minh-stad).	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 400, man 380, Onbekendes 2	Kontak Ons
Viëtnamees_MA_16	Viëtnamese	Viëtnamese	vi_VN	16 kHz	Media Oudio	257	Viëtnamese media-klankdata	Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute	Mono	Webverkryging	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 249, man 200, Onbekendes 45	Kontak Ons
Wallies_GC_8	Wallies (Engelse aksent)	Wallies (Engelse aksent)	en_WL	8 kHz	Algemene gesprek	278	Walliese Algemene Gespreksdata	Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,	Dual	lessenaar	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Vrou 270, Man 324, Onbekend 0	Kontak Ons
VK Engels_WW_16	Britse Engels	Britse Engels	en_uk	16 kHz	Wake Word	200 Sprekers	Wake Word UK Engels	sleutelfrases versameling van data 200 sprekers 4 unieke sleutelfrases per spreker 25-30 herhaalde sleutelfrases opnames per unieke sleutelfrase 25-30 oudiolêers per unieke sleutelfrase 120 totale aangetekende uitsprake per spreker	1 kanaal	Foon	5.0	Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering	Geslag: 50% manlik, 50% vroulik, +/- 10%.	Kontak Ons

dienste wat aangebied word

Deskundige klankdata-insameling is nie alles in die hande vir uitgebreide AI-opstellings nie. By Shaip kan u selfs die volgende dienste oorweeg om modelle meer algemeen as gewoonlik te maak:

Aanbevole bronne

Bied

Audio -aantekening vir intelligente AI's

Oudio-aantekeningdienste is sedert die begin 'n sterk punt van Shaip. Ontwikkel, lei op en verbeter gespreks-KI, kletsbotte en spraakherkenningsenjins met ons moderne klankaantekeningdienste.

Kopergids

Kopersgids: Volledige Gids tot Gespreks-KI

Die kletsbot waarmee jy gesels het, loop op 'n gevorderde gespreks-KI-stelsel wat opgelei, getoets en gebou is met behulp van tonne spraakherkenningdatastelle.

Data Katalogus

Van die rak af spraakdatakatalogus en lisensiëring

Daar is 'n wye verskeidenheid algemene toepassings vir spraakdata in KI-projekte. Ons bied u groot hoeveelhede data van hoë gehalte gereed vir u stemherkenning.

Wil jy jou eie oudiodatastel bou?

Maak kontak met ons interne spraakdata-insamelingsdeskundige om 'n oudiobewaarplek op te stel wat die beste by jou behoefte pas

Eerste naam*
Van*
E-posadres*
Kontak*
maatskappy*
Land*
Land
Kommentaar*
Deur te registreer stem ek saam met Shaip Privaatheidsbeleid en Algemene Diens en gee my toestemming om B2B-bemarkingskommunikasie van Shaip te ontvang.
CAPTCHA

Algemene vrae (FAQ)

1. Wat is Spraakdata-insameling?

Spraakdata-insameling vir 'n ML-model verwys na die proses om oudio-opnames van gesproke taal te versamel. Hierdie versameling help met die opleiding en verfyning van masjienleeralgoritmes, veral dié wat gesentreer is op die verstaan en verwerking van menslike stemme.

2. Hoe om oudiodata vir ASR (outomatiese spraakherkenning) in te samel?

Wanneer jy daarna streef om oudiodata vir Outomatiese Spraakherkenning (ASR) in te samel, moet jy begin deur jou projek se spesifieke behoeftes te definieer, insluitend die verlangde taal, aksent en tipe spraak. Nadat u hierdie parameters gestel het, maak seker dat u alle nodige toestemmings verkry om gebruikersprivaatheid te respekteer. Gebruik dan toepaslike opnametoestelle of sagteware om duidelike oudiomonsters vas te vang. Elke opname moet noukeurig geannoteer word met sy transkripsie of ander pertinente metadata en sistematies gestoor word vir moeitelose toegang.

3. Gebruik van Spraakdatastel vir Masjienleer

'n Spraakdatastel in masjienleer is deurslaggewend vir opleiding, toetsing en validering van modelle wat aangepas is om gesproke taal te herken, transkribeer of interpreteer. Sulke datastelle baan die weg vir 'n magdom toepassings, van stemassistente en transkripsiedienste tot stembiometrie.

4. Hoe om akkurate data van verskeie tale en aksente in te samel

Om presiese data van uiteenlopende tale en aksente in te samel, is samewerking met moedertaalsprekers van die verlangde linguistiese agtergronde noodsaaklik. Streef na 'n gevarieerde en verteenwoordigende steekproef om 'n breë spektrum van demografiese nuanses te dek. Gebruik gestandaardiseerde opnametoerusting in eenvormige omgewings om klankkonsekwentheid te verseker. En belangrik, annoteer elke datastuk met gedetailleerde transkripsies en metadata, wat die spesifieke taal en aksent aandui.

Mees betroubare spraakdata-insamelingsdienste vir jou KI

Ontdek klankdatapypleidings sonder knelpunte

Voorgestelde kliënte

Professionele oudio-/stemdata-insamelingsdienste

Enige onderwerp. Enige scenario.

100 +

55K +

250 +

60 +

8 / 16 / 44 / 48 kHz

Ons kundigheid

Belyn oudiodata vir slimmer NLP-modelle

Monoloog-spraakversameling

Dialoogrede versameling

Groep / Muti-party gesprekke

Versameling van natuurlike taaluitsprake

Akoestiese data versameling

Outomatiese spraakherkenning (ASR)

Veeltalige spraak-/oudio-opleidingsdata

Teks-na-spraak (TTS)

Call Center opnames

Sukses Stories

Redes om Shaip te kies as u betroubare vennoot vir die versameling van spraakdata

Mense

proses

platform

Mense

proses

platform

Van die rak spraak- / oudiodatastelle

dienste wat aangebied word

Versameling van teksdata Dienste

Dienste vir die versameling van beelddata

Dienste vir die versameling van video-data

Aanbevole bronne

Bied

Audio -aantekening vir intelligente AI's

Kopergids

Kopersgids: Volledige Gids tot Gespreks-KI

Data Katalogus

Van die rak af spraakdatakatalogus en lisensiëring

Wil jy jou eie oudiodatastel bou?

Algemene vrae (FAQ)

AI Datadienste

Speciality

Nywerheid

produkte

maatskappy

hulpbronne

Kontak Ons

Dialoogrede
versameling

Groep / Muti-party
gesprekke

Akoestiese data
versameling

Teks-na-spraak
(TTS)

Call Center
opnames

Versameling van teksdata
Dienste