Mees betroubare spraakdata-insamelingsdienste vir jou KI

Leer u NLP -modelle, VA's, TTS -prototipes en meer op met gespreksdata van hoë gehalte, met ons klank- en spraakdata -insamelingsdienste

Oudiodata-insameling

Ontdek klankdatapypleidings sonder knelpunte

Voorgestelde kliënte

Professionele oudio-/stemdata-insamelingsdienste

Enige onderwerp. Enige scenario.

By Shaip lê ons kundigheid in die skep van hoëgehalte-spraakdatastelle wat ontwerp is vir uiteenlopende KI/ML-vereistes. Ons bied 'n uitgebreide reeks tale en rekord in uiteenlopende instellings wat ons datastelle omvattend en aanpasbaar maak. Ou fokus is om modelle met die hoogste volume persoonlike spraakdata in die minste moontlike tyd te voed. Met ons aan boord kan jy verwag: 

Toespraakversameling
  • Samegestelde veeltalige klank- / stemdata van hoë gehalte om akkuraatheid te verbeter
  • Hoogste moontlike vlak van domeinspesifisiteit aan target diverse scenario setup
  •  Skaal jou ML-model om by diverse demografie en vertikale te pas
  • Opname omgewings: Studio kwaliteit, met kristalhelder oudio met minimale agtergrondgeraas, en Natuurlike omgewings, waar opnames omgewingsklanke insluit om werklike situasies na te boots.

100 +

lande

55K +

Ure se spraakdata

250 +

projekte

60 +

Tale (100+ dialekte)

8 / 16 / 44 / 48 kHz

Sampling rate

Ons kundigheid

Belyn oudiodata vir slimmer NLP-modelle

Shaip bied eind-tot-einde spraak-/klankdata-insamelingsdienste in meer as 100 tale aan om tegniese tegnologieë moontlik te maak vir 'n uiteenlopende groep gehore regoor die wêreld. Ons kan werk aan projekte van enige omvang en grootte; van die lisensiëring van bestaande klankdatastelle van die rak af, tot die bestuur van pasgemaakte klankdata-insameling, tot klank-transkripsie en aantekening. Maak nie saak hoe groot u spraakdata-insamelingsprojek is nie, ons kan die klankversamelingsdienste aanpas by u behoeftes om hoë kwaliteit NLP-datastelle te bou wat op dialekte, klanke en tale gerig is. Kies uit ons wye reeks spraakdatastelle en klankdata-insamelingshulpbronne vir intelligente opstellings wat stem moontlik maak.

Monoloog toespraak

Monoloog-spraakversameling

Dit fokus op die verwerking van spraak van 'n enkele spreker. Gebruik geskrewe aanwysings om in enkelkanaal-oudiolêers in te voer, en verseker die vaslegging van unieke spraakpatrone, tone en nuanses spesifiek vir daardie individu.

Dialoog toespraak

Dialoogrede
versameling

Twee-persoon interaksie, repliseer werklike gesprekke en dialoë met veeltalige blootstelling via dubbelkanaal lêers en getranskribeerde hulpbronne.

Veelpartygesprekke

Groep / Muti-party
gesprekke

Multipersoonbesprekings, vaslegging van groepdinamika, oorvleuelings en gevarieerde toonsoorte om spraakmodelle akkuraat op te lei.

Natuurlike taal uiting

Versameling van natuurlike taaluitsprake

Lei KI's op om frases of wakker woorde met soortgelyke betekenisse te identifiseer deur diverse, ryk en outentieke uitinge te gebruik vir gevorderde natuurlike taalverwerking en -begrip.

Akoestiese spraak

Akoestiese data
versameling

Ons kan professioneel oudiodata van ateljeegehalte opneem, hetsy restaurante, kantore of huise of van verskeie omgewings en tale, terwyl ons 'n groter akoestiese reeks dek (Omvattende klankdatastelle).

Outomatiese spraakherkenning

Outomatiese spraakherkenning (ASR)

Verbeter akkuraatheid van jou outomatiese spraakherkenning (ASR) stelsels deur toegang te hê tot moderne gediversifiseerde spraak-/klankdatastelle, uit 'n wye verskeidenheid demografiese inligting.

Natuurlike taal uiting

Veeltalige spraak-/oudio-opleidingsdata

Ons bekwame taalkundiges, regoor die wêreld, bied veeltalige oudio-/spraakdata in verskeie tale en dialekte. Hierdie poging bevorder globale kommunikasie en oorbrug taalhindernisse, wat bydra tot meer inklusiewe en doeltreffende KI-oplossings.

Digitale virtuele assistente

Teks-na-spraak
(TTS)

Bou 'n teks-na-spraak (TTS) veeltalige model met die hulp van ons wêreldwye arbeidsmag, wat jou help om spraakdata in 150+ tale en dialekte in te samel om jou KI-modelle van in-motor-kontroles tot kletsbotte en leeroplossings met hoë- kwaliteit klankdata.

Inbelsentrumopnames

Call Center
opnames

Opregte uitruilings tussen agente en kliënte, wat talle tale ondersteun soos Spaans, Duits, Amerikaanse Engels, Bengaals, Japannees, Chinees en Hindi.

Sukses Stories

Gespreks-KI-datastelle met meer as 3k uur se data oor 8 tale

Op soek na die bou van 'n veeltalige platform vir Indiese tale, het die kliënt 'n vennootskap met Shaip aangegaan om groot datastelle in verskeie Indiese tale te versamel, te segmenteer en te transkribeer. Dit sal help om effektiewe spraakmodelle te ontwikkel wat die kliënt se innoverende nuwe platform kan aandryf.

Probleem: Meer as 3,000 8 uur se oudiodata wat in XNUMX Indiese tale ingesamel is, gesegmenteer en getranskribeer om outomatiese spraakherkenning te ontwikkel.

Oplossing: Ons het data-insameling, segmentering, transkripsie verskaf en JSON-lêers met metadata afgelewer. Ons het 3000 uur se oudiodata in 8 Indiese tale op skaal ingesamel vir die kliënt se spraaktegnologieprojek.

Gevallestudie van spraakdata-insameling

Redes om Shaip te kies as u betroubare vennoot vir die versameling van spraakdata

Mense

Mense

Toegewyde en opgeleide spanne:

  • 30,000+ medewerkers vir die skep van data, etikettering en QA
  • Gesertifiseerde projekbestuurspan
  • Ervare produkontwikkelingspan
  • Talent Pool Sourcing & Onboarding Team
proses

proses

Die hoogste doeltreffendheid van die proses word verseker deur:

  • Robuuste 6 Sigma Stage-Gate-proses
  • 'N Toegewyde span van 6 Sigma swart gordels - Belangrike prosesseienaars en voldoening aan gehalte
  • Deurlopende verbetering en terugvoerlus
platform

platform

Die gepatenteerde platform bied voordele:

  • Web-gebaseerde end-to-end platform
  • Onberispelike kwaliteit
  • Vinniger TAT
  • Naadloze aflewering

Van die rak spraak- / oudiodatastelle

besonderhedeTaaldatastelVoorbeeldkoersDatastel tipeTotale oudio-ureKort beskrywingDatastelbeskrywingAudio ChannelOpname platformWER (%)Klank-formaatTranskripsie-formaatGebruiksgevalAantal sprekersGTA
Toespraakaf_US_CC_8Afro-Amerikaanse taalAfro-Amerikaanse taalnl_NL>8 kHzInbelsentrum211Afro-Amerikaanse InbelsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik: 612, Manlik: 1242, en Onbekend: 12
Toespraakaf_US_MA_16Afro-Amerikaanse taalAfro-Amerikaanse taalnl_NL>16 kHzMedia Oudio154Afro-Amerikaanse Vernacular Media dataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik: 151, Manlik: 150, en Onbekend: 10
ToespraakAfrikaans_GC_8AfrikaansAfrikaansaf_ZA8 kHzAlgemene gesprek368Afrikaans Algemene GespreksdataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Afrikaans gepraat in AfrikaDuallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik: 502, Manlik: 390, en Onbekend: 2
ToespraakAfrikaans_MA_16AfrikaansAfrikaansaf_ZA16 kHzMedia Oudio658Afrikaanse medialêersGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik: 750, Manlik: 1278, en Onbekend: 52
ToespraakArabies_GC_8ArabieseArabiesear_AE8 kHzAlgemene gesprek292Arabiese Algemene GespreksdataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Arabies van GolflandeDuallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik: 171, Manlik: 534, en Onbekend: 1
ToespraakArabies_SM_48ArabieseArabiesear48 kHzGeskrewe monoloog1,947Arabiese skrifmonoloogEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 838 Manlik 1209 Onbekend 78
ToespraakAssamees_CC_8AssameesAssamees (in pyplyn) soos inInbelsentrum60Assamees (in pyplyn) oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakAssamees_GCAssameesAssamees (in pyplyn) soos inAlgemene gesprek100Assamees (in pyplyn) Algemene gespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakAssamees_MAAssameesAssamees (in pyplyn) soos inMedia Oudio40Assamees (in pyplyn) Media-oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakBengali_CC_8bengaliBengaals (in pyplyn) bn_INInbelsentrum60Bengaalse (in pyplyn) oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakBengali_GCbengaliBengaals (in pyplyn) bn_INAlgemene gesprek100Bengaalse (in pyplyn) algemene gespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakBengali_MAbengaliBengaals (in pyplyn) bn_INMedia Oudio40Bengaals (in pyplyn) Media-oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakBoston_CC_8Boston EngelsBoston Engelsnl_NL>8 kHzInbelsentrum177Boston oproepsentrum dataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik: 605, Manlik: 711, en Onbekend: 0
ToespraakBoston_GC_8Boston EngelsBoston Engelsnl_NL>8 kHzAlgemene gesprek32Boston Algemene Gesprek dataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik: 53, Manlik: 83, en Onbekend: 0
ToespraakBoston_MA_16Boston EngelsBoston Engelsnl_NL>16 kHzMedia Oudio93Boston Media klank dataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik: 43, Manlik: 181, en Onbekend: 2
ToespraakKanadese_SM_48Kanadese FransKanadese Fransfr-CA48 kHzGeskrewe monoloog1,222Kanadese FransEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 974 Manlik 631 Onbekend 1
ToespraakChinees_CC_8Chinese EngelsChinese Engelsnl_NL>8 kHzInbelsentrum169Chinese oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik: 1790, Manlik: 523 en Onbekend: 13
ToespraakChinees_MA_16Chinese EngelsChinese Engelsnl_NL>16 kHzMedia Oudio249Chinese media oudio dataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik: 126, Manlik: 346 en Onbekend: 6
ToespraakSjinees vereenvoudig_SM_48Chinese SimplifiedChinese Simplifiedzh-CN48 kHzGeskrewe monoloog2,762Chinese SimplifiedEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1920 Man 1535 Onbekend 270
ToespraakChinees Tradisioneel_SM_48Tradisionele SjineesTradisionele Sjineeszh-TW48 kHzGeskrewe monoloog1,028Tradisionele SjineesEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1069 Manlik 262 Onbekend 3
ToespraakDeens_GC_8DeenseDeenseda_DK8 kHzAlgemene gesprek372Deense Algemene GespreksdataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou: 311, Man: 417, Onbekend: 0
ToespraakDeens_MA_16DeenseDeenseda_DK16 kHzMedia Oudio664Deense media-klankdataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou: 369, Man: 864, Onbekend: 27
ToespraakDeens_SM_48DeenseDeenseda-DK48 kHzGeskrewe monoloog2,579Deense skrifmonoloogEnkel-uiting opnames, wat geneig is om te val in die 5 tot 30 sekonde reeks, Deens uit DenemarkeMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1551 Man 1233 Onbekend 42
ToespraakEngels Deep South_CC_8Engels Diep SuidEngels Diep Suidnl_NL>8 kHzInbelsentrum151Engelse Deep South Call-center dataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 221 , Manlik 1004 , Onbekend 7
ToespraakEngels Deep South_GC_8Engels Diep SuidEngels Diep Suidnl_NL>8 kHzAlgemene gesprek56Engelse Deep South Algemene GespreksdataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 99, Man 31, Onbekend 0
ToespraakEngels diep suid_MA_16Engels Diep SuidEngels Diep Suidnl_NL>16 kHzMedia Oudio266Engelse Deep South Media oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 204, Man 356, Onbekend 21
ToespraakDuits_CC_8DuitseDuitsede-De8 kHzInbelsentrum64Duitse oproepsentrumdata Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,MonolessenaarWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 478 Manlik 1440 Onbekend 0
ToespraakDuits_IVR_8DuitseDuitsede-De8 kHz IVR200Duitse IVR dataMens tot masjien. 'n IVR-tipe vloei waar daar 'n TTS-prompt is (bv. "Hoe kan ek jou help") gevolg deur 'n spontane menslike reaksieMonolessenaarWav .jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering Vroulik 10115 Man 8750 Onbekend 0
ToespraakGujarati_CC_8gujaratiGujarati (in pyplyn) gu_INInbelsentrum60Gujarati (in pyplyn) oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakGujarati_GCgujaratiGujarati (in pyplyn) gu_INAlgemene gesprek100Gujarati (in pyplyn) Algemene gespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakGujarati_MAgujaratiGujarati (in pyplyn) gu_INMedia Oudio40Gujarati (in pyplyn) Media-klankdataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakHebreeus_Algemene Gesprek_8HebreeusHebreeushy_IL8 kHzAlgemene gesprek399Hebreeuse Algemene GespreksdataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Hebreeus in IsraelDuallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 414, Manlik 399, Onbekend 1
ToespraakHebreeus_MA_16HebreeusHebreeushy_IL16 kHzMedia Oudio427Hebreeuse Media klank dataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 361, Manlik 513, Onbekend 13
ToespraakHindi_MA_16hindihindihi_IN16 kHzMedia Oudio219Hindi Media klank dataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 83, Manlik 309, Onbekend 0
ToespraakHindi_SM_48hindihindihi-IN48 kHzGeskrewe monoloog2,867Hindi skrifmonoloogEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1977 Man 1864 Onbekend 147
ToespraakHINGLISH_CC_8HengelseHengelsehg_IN8 kHzInbelsentrum208HINGLISH InbelsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 822, Man 1262, Onbekend 0
ToespraakHINGLISH_MA_16HengelseHengelsehg_IN16 kHzMedia Oudio216HINGLISH Media-oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 75, Man 380, Onbekend 0
ToespraakHispanic_CC_8Spaans EngelsSpaans Engelsnl_NL>8 kHzInbelsentrum212Spaanse oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 822, Man 1262, Onbekend 0
ToespraakHispanic_MA_16Spaans EngelsSpaans Engelsnl_NL>16 kHzMedia Oudio155Hispanic Call Media klankGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 140, Man 219, Onbekend 5
ToespraakIndonesies_GC_8IndonesieseIndonesieseek het8 kHzAlgemene gesprek496Indonesiese algemene gespreksdataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, IndonesiesDuallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 524, Man 454, Onbekend 2
ToespraakIndonesies_MA_16IndonesieseIndonesieseek het16 kHzMedia Oudio643Indonesiese media-klankdataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 746, Man 1507, Onbekend 129
ToespraakIers_GC_8IerseIerseen_IE8 kHzAlgemene gesprek192Ierse Algemene GespreksdataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 213, Manlik 153, Onbekend 0
ToespraakJapannees_SM_48JapanneseJapanneseek-JP48 kHzGeskrewe monoloog2,335Japannese skrifmonoloogEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1460 Man 1221 Onbekend 194
ToespraakKannada_CC_8kannadaKannada (in pyplyn) kn_INInbelsentrum60Kannada (in pyplyn) oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakKannada_GCkannadaKannada (in pyplyn) kn_INAlgemene gesprek100Kannada (In Pyplyn) Algemene GespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakKannada_MAkannadaKannada (in pyplyn) kn_INMedia Oudio40Kannada (in pyplyn) Media-oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakKoreaans_CC_8KoreaanseKoreaanseko_KR8 kHzInbelsentrum107Koreaanse oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1086, Manlik 210, Onbekend 4
ToespraakKoreaans_MA_16KoreaanseKoreaanseko_KR16 kHzMedia Oudio204Koreaanse media klank dataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 70 Man 303, Onbekend 25
ToespraakKoreaans_SM_48KoreaanseKoreaanseko-KR48 kHzGeskrewe monoloog1,955Koreaanse skrifmonoloogEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1195 Man 1134 Onbekend 122
ToespraakMaleis_GC_8malaymalayms_MY8 kHzAlgemene gesprek266Maleisiese algemene gespreksdataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Maleis in MaleisiëDuallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 316, Manlik 176, Onbekend 0
ToespraakMaleis_MA_16malaymalayms_MY16 kHzMedia Oudio344Maleisiese media-klankdataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 236, Man 626, Onbekend 47
ToespraakMalabaars_CC_8MalabaarsMalabaars (in pyplyn) ml_INInbelsentrum60Malabaars (in pyplyn) oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakMalabaars_GCMalabaarsMalabaars (in pyplyn) ml_INAlgemene gesprek100Malabaars (in pyplyn) Algemene gespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakMalabaars_MAMalabaarsMalabaars (in pyplyn) ml_INMedia Oudio40Malabaars (in pyplyn) Media-oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakMarathi_CC_8MarathiMarathi (in pyplyn) mnr_INInbelsentrum60Marathi (in pyplyn) oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakMarathi_GCMarathiMarathi (in pyplyn) mnr_INAlgemene gesprek100Marathi (in pyplyn) Algemene gespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakMarathi_MAMarathiMarathi (in pyplyn) mnr_INMedia Oudio40Marathi (in pyplyn) Media-oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakMexikaanse_SM_48Spaans (Mexiko)Spaans (Mexiko)af-MX48 kHzGeskrewe monoloog1,492Mexikaanse Spaanse skrifmonoloogEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1016 Manlik 1069 Onbekend 95
ToespraakNederland_SM_48NederlandsNederlandsnl-NL48 kHzGeskrewe monoloog1,205Nederlandse skrifmonoloogEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1285 Manlik 531 Onbekend 3
ToespraakNew York Engels_CC_8New York EngelsNew York Engelsnl_NL>8 kHzInbelsentrum103New York Engelse oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 610, Manlik 532, Onbekend 0
ToespraakNew York Engels_GC_8New York EngelsNew York Engelsnl_NL>8 kHzAlgemene gesprek107New York Engels Algemene Gesprek dataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 118, Man 114, Onbekend 0
ToespraakNew York Engels_MA_16New York EngelsNew York Engelsnl_NL>16 kHzMedia Oudio140New York Engelse Media oudio dataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 66, Man 230, Onbekend 11
ToespraakNieu-Seeland_GC_8Nieu-Seeland Engels Nieu-Seeland Engels af_NZ8 kHzAlgemene gesprek148Nieu-Seeland Engels Algemene Gesprek dataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 167, man 121, Onbekend 4
ToespraakNieu-Seeland_MA_16Nieu-Seeland Engels Nieu-Seeland Engels af_NZ16 kHzMedia Oudio400Nieu-Seeland Engelse media oudioGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 367, man 678, Onbekend 26
ToespraakOriya_CC_8OriyaOriya (in pyplyn) of_INInbelsentrum60Oriya (In Pipeline) Call-Center dataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakOriya_GCOriyaOriya (in pyplyn) of_INAlgemene gesprek100Oriya (In Pyplyn) Algemene GespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakOriya_MAOriyaOriya (in pyplyn) of_INMedia Oudio40Oriya (In Pyplyn) Media-oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakPools_MA_16PoolsPoolspl_PL16 kHzMedia Oudio269Poolse media klankGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 173 Manlik 354 Onbekend 6
ToespraakPools Pole_SM_48Pools (Pole)Pools (Pole)pl-pl48 kHzGeskrewe monoloog1,482Pools Pole - SkrifmonoloogEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1324 Manlik 701 Onbekend 24
ToespraakPunjabi_CC_8PandjabiPunjabi (in pyplyn) PandjabiInbelsentrum60Punjabi (in pyplyn) oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakPunjabi_GCPandjabiPunjabi (in pyplyn) PandjabiAlgemene gesprek100Punjabi (in pyplyn) Algemene gespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakPunjabi_MAPandjabiPunjabi (in pyplyn) Pandjabi Media Oudio40Punjabi (in pyplyn) Media-oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakRussies_SM_48RussieseRussieseru-ru48 kHzGeskrewe monoloog2,398Russiese skrifmonoloogEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1689 Man 1937 Onbekend 214
ToespraakSkotse_GC_8Skots (Engelse aksent)Skots (Engelse aksent)en_AB8 kHzAlgemene gesprek292Skotse Algemene GespreksdataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 285, Manlik 260, Onbekend 3
ToespraakSingapoer_CC_8Singapoer EngelsSingapoer Engelsen_SG8 kHzInbelsentrum218Singapoer Call-Center dataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 2139, Manlik 884, Onbekend 21
ToespraakSingapoer_MA_16Singapoer EngelsSingapoer Engelsen_SG16 kHzMedia Oudio247Singapore Media klank dataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 160, Man 455, Onbekend 37
ToespraakSuid-Afrikaanse Engels_CC_8Suid-Afrikaanse EngelsSuid-Afrikaanse Engelsen_ZA8 kHzInbelsentrum261Suid-Afrikaanse Engelse oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1274, Manlik 935, Onbekend 1
ToespraakSuid-Afrikaanse Engels_MA_16Suid-Afrikaanse EngelsSuid-Afrikaanse Engelsen_ZA16 kHzMedia Oudio251Suid-Afrikaanse Engelse Media oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 235, Man 432, Onbekend 36
ToespraakSwahili_CC_8swahiliswahilisw_KE8 kHzInbelsentrum230Swahili Call-Center dataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 611, Man 833, Onbekend 0
ToespraakSwahili_MA_16swahiliswahilisw_KE16 kHzMedia Oudio265Swahili Media klankdataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 118, Man 493, Onbekend 25
ToespraakSweeds_CC_8SweedsSweedssv_SE8 kHzInbelsentrum250Sweedse oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 1581, man 727, Onbekend 2
ToespraakSweeds_MA_16SweedsSweedssv_SE16 kHzMedia Oudio278Sweedse media klankdataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 195, man 500, Onbekend 21
ToespraakTamil_CC_8tamilTamil (in pyplyn) ta_INInbelsentrum60Tamil (in pyplyn) oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakTamil_GCtamilTamil (in pyplyn) ta_INAlgemene gesprek100Tamil (in pyplyn) Algemene gespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakTamil_MAtamil Tamil (in pyplyn) ta_INMedia Oudio40Tamil (in pyplyn) Media-oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakTelugu_GC_8telugutelugute_IN8 kHzAlgemene gesprek553Telugu Algemene GespreksdataOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 574, Manlik 564, Onbekend 0
ToespraakTelugu_MA_16telugutelugute_IN16 kHzMedia Oudio648Telugu Media-klankdataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 207, Man 963, Onbekend 2
ToespraakTelugu_CC_8teluguTelugu (in pyplyn) te_INInbelsentrum30Telugu (in pyplyn) oproepsentrumdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakTelugu_GCteluguTelugu (in pyplyn) te_INAlgemene gesprek50Telugu (in pyplyn) Algemene gespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,lessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakTelugu_MAteluguTelugu (in pyplyn) te_INMedia Oudio20Telugu (in pyplyn) Media-oudiodataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering
ToespraakThai_GC_8ThaiThaide_DE8 kHzAlgemene gesprek183Thai Algemene GesprekOngeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, 'n informele register wat tussen vriende gebruik wordDuallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 338, Man 96, Onbekend 8
ToespraakThai_MA_8ThaiThaide_DE16 kHzMedia Oudio173Thai Media klankGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 143, Man 502, Onbekend 26
ToespraakTurkse Turkye_SM_48Turkse TurkyeTurkse Turkyetr-TR48 kHzGeskrewe monoloog2,027Turkse TurkyeEnkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te valMonoFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVroulik 1561 Manlik 1241 Onbekend 31
ToespraakViëtnamees_GC_8ViëtnameseViëtnamesevi_VN8 kHzAlgemene gesprek295Viëtnamese algemene gespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, Noordelike (bv. Hanoi), Sentraal en Suidelike (bv. Ho Chi Minh-stad).Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 400, man 380, Onbekendes 2
ToespraakViëtnamees_MA_16ViëtnameseViëtnamesevi_VN16 kHzMedia Oudio257Viëtnamese media-klankdataGelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minuteMonoWebverkryging5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 249, man 200, Onbekendes 45
ToespraakWallies_GC_8Wallies (Engelse aksent)Wallies (Engelse aksent)en_WL8 kHzAlgemene gesprek278Walliese Algemene GespreksdataOngeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute,Duallessenaar5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringVrou 270, Man 324, Onbekend 0
ToespraakVK Engels_WW_16Britse EngelsBritse Engelsen_uk16 kHzWake Word200 SprekersWake Word UK Engelssleutelfrases versameling van data
  • 200 sprekers
  • 4 unieke sleutelfrases per spreker
  • 25-30 herhaalde sleutelfrases opnames per unieke sleutelfrase
  • 25-30 oudiolêers per unieke sleutelfrase
  • 120 totale aangetekende uitsprake per spreker
1 kanaalFoon5.0Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringGeslag: 50% manlik, 50% vroulik, +/- 10%.

dienste wat aangebied word

Deskundige klankdata-insameling is nie alles in die hande vir uitgebreide AI-opstellings nie. By Shaip kan u selfs die volgende dienste oorweeg om modelle meer algemeen as gewoonlik te maak:

Teksdataversameling

Versameling van teksdata
Dienste

Die ware waarde van Shaip -kognitiewe data -insamelingsdienste is dat dit organisasies die sleutel gee om kritieke inligting wat in ongestruktureerde data voorkom, te ontsluit

Beelddataversameling

Dienste vir die versameling van beelddata

Maak seker dat u rekenaarvisiemodel elke beeld akkuraat identifiseer om die volgende generasie AI-modelle van die toekoms naatloos op te lei

Video data-insameling

Dienste vir die versameling van video-data

Konsentreer nou op rekenaarvisie saam met NLP vir die opleiding van u modelle om voorwerpe, individue, afskrikmiddels en ander visuele elemente tot volmaaktheid te identifiseer

Shaip kontak ons

Wil jy jou eie oudiodatastel bou?

Maak kontak met ons interne spraakdata-insamelingsdeskundige om 'n oudiobewaarplek op te stel wat die beste by jou behoefte pas

  • Deur te registreer stem ek saam met Shaip Privaatheidsbeleid en Algemene Diens en gee my toestemming om B2B-bemarkingskommunikasie van Shaip te ontvang.

Spraakdata-insameling vir 'n ML-model verwys na die proses om oudio-opnames van gesproke taal te versamel. Hierdie versameling help met die opleiding en verfyning van masjienleeralgoritmes, veral dié wat gesentreer is op die verstaan ​​en verwerking van menslike stemme.

Wanneer jy daarna streef om oudiodata vir Outomatiese Spraakherkenning (ASR) in te samel, moet jy begin deur jou projek se spesifieke behoeftes te definieer, insluitend die verlangde taal, aksent en tipe spraak. Nadat u hierdie parameters gestel het, maak seker dat u alle nodige toestemmings verkry om gebruikersprivaatheid te respekteer. Gebruik dan toepaslike opnametoestelle of sagteware om duidelike oudiomonsters vas te vang. Elke opname moet noukeurig geannoteer word met sy transkripsie of ander pertinente metadata en sistematies gestoor word vir moeitelose toegang.

'n Spraakdatastel in masjienleer is deurslaggewend vir opleiding, toetsing en validering van modelle wat aangepas is om gesproke taal te herken, transkribeer of interpreteer. Sulke datastelle baan die weg vir 'n magdom toepassings, van stemassistente en transkripsiedienste tot stembiometrie.

Om presiese data van uiteenlopende tale en aksente in te samel, is samewerking met moedertaalsprekers van die verlangde linguistiese agtergronde noodsaaklik. Streef na 'n gevarieerde en verteenwoordigende steekproef om 'n breë spektrum van demografiese nuanses te dek. Gebruik gestandaardiseerde opnametoerusting in eenvormige omgewings om klankkonsekwentheid te verseker. En belangrik, annoteer elke datastuk met gedetailleerde transkripsies en metadata, wat die spesifieke taal en aksent aandui.