Mees betroubare spraakdata-insamelingsdienste vir jou KI
Leer u NLP -modelle, VA's, TTS -prototipes en meer op met gespreksdata van hoë gehalte, met ons klank- en spraakdata -insamelingsdienste
Ontdek klankdatapypleidings sonder knelpunte.
Voorgestelde kliënte
Waarom is spraakopleidingsdatastel nodig vir die verwerking van natuurlike tale?
Het u al ooit opgemerk dat u smartphone VA, dit wil sê Siri, Bixby, of enigiets anders, interaksie het? Die manier waarop hulle elke vraag beantwoord en die resultate volgens u vereistes analiseer en aanbied!
Wel, soveel as wat hierdie VA's ons intrigeer, moet hierdie intelligente hulpbronne en programme progressief opgelei word om so akkuraat te kan reageer. Dit is die rede waarom jy dit moet oorweeg om spraak-/klank- en stemdata-insameling aan gespesialiseerde data-insamelingsmaatskappye uit te kontrakteer, met validerende professionele kundigheid.
Belegging in oudiodata-insameling berei jou beweerde NLP voor om aan 'n veeltalige gehoor te voldoen. Nie net dit nie, spraakdata-insameling vir NLP, soos en wanneer dit deur 'n deskundige hanteer word, neem selfs in-veld-insameling, semantiese analise en oudio-transkripsie in ag. Met professionele oplossings vir spraakdata-insameling kan jy:
- Verkry klankdatastelle van hoë gehalte om akkuraatheid te verbeter
- Teiken uiteenlopende scenario-opstelling
- Versamel veeltalige AI -opleidingsdata
- Skaal jou ML-model om by diverse demografie en vertikale te pas
Professionele klank- / stemdata -insamelingdienste vir NLP
Enige onderwerp. Enige scenario.
Intelligente NLP -stelsels is alles behalwe generies. Afhangende van die funksionaliteit van die program, moet u moontlik fokus op ruimtelike en meertalige klankdatadienste, wat slegs aangebied kan word deur bekende stem-/klankdata -insamelingsondernemings. Dit is waar Shaip as 'n baie betroubare diensverskaffer van dataverbindings deelneem, wat trots is op die harde werk van u vermeende intelligente AI's.
By Shaip is ons primêre fokus op die voed van modelle met die hoogste moontlike volume aangepaste spraakmonsters, in die minste moontlike tyd. By ons aan boord kan u verwag:
- Versamelde klank- / stemdata -insameling vir NLP
- Programme op maat wat reageer volgens spesifieke gebruiksgevalle
- Maak klankdatastelselontginning gereed
- Patroon-spesifieke en outomatiese dataverwerking
- Hoogste moontlike vlak van domeinspesifisiteit
- Vinniger bemarkingstyd met versnelde AI -modelle
Ons kundigheid
Rig oudiodata aan om slim NLP -modelle voor te berei
Shaip bied eind-tot-einde spraak-/klankdata-insamelingsdienste in meer as 100 tale aan om tegniese tegnologieë moontlik te maak vir 'n uiteenlopende groep gehore regoor die wêreld. Ons kan werk aan projekte van enige omvang en grootte; van die lisensiëring van bestaande klankdatastelle van die rak af, tot die bestuur van pasgemaakte klankdata-insameling, tot klank-transkripsie en aantekening. Maak nie saak hoe groot u spraakdata-insamelingsprojek is nie, ons kan die klankversamelingsdienste aanpas by u behoeftes om hoë kwaliteit NLP-datastelle te bou wat op dialekte, klanke en tale gerig is. Kies uit ons wye reeks spraakdatastelle en klankdata-insamelingshulpbronne vir intelligente opstellings wat stem moontlik maak.
Monoloog-spraakversameling
Hanteer spraakgebaseerde vereistes met betrekking tot 'n selfstandige luidspreker vir u teks-na-spoed-prototipes en transkripsiespesifieke vereistes met vinnige inskrywing via eenkanaal-lêers.
Dialoogrede
versameling
Stel intelligente virtuele assistente, spoedspesifieke chatbots en modelle vir outomatiese spraakherkenning op met meertalige blootstelling via dubbelkanaal-lêers en getranskribeerde hulpbronne.
Akoestiese data
versameling
Ons kan klankdata van ateljeekwaliteit professioneel opneem, hetsy restaurante, kantore of huise of uit verskillende omgewings en tale, via ons wêreldwye netwerk van medewerkers, terwyl ons 'n groter akoestiese reeks dek
Versameling van natuurlike taaluitsprake
Leer slim kommersiële opsette op om verskillende klantefrases met dieselfde betekenis te identifiseer om die AI's betyds meer outonoom te maak
Digitaal / virtueel
assistente
Fokus op die bou van u komende Virtual Assistant deur modelle op te lei met voorbehoud van menslike spraak, meertalige blootstelling, kontekstuele analise en NLU.
Outomatiese spraakherkenning (ASR)
Verbeter akkuraatheid van jou outomatiese spraakherkenning (ASR) stelsels deur toegang te hê tot moderne gediversifiseerde spraak-/klankdatastelle, uit 'n wye verskeidenheid demografiese inligting.
Veeltalige spraak-/oudio-opleidingsdata
Ons hoogs bekwame taalkundiges regoor die wêreld bied veeltalige oudio-/spraakopleidingsdata in verskeie tale en dialekte, insluitend Arabies, Deens, Chinees, Afrikaans, Singapoer, Nieu-Seeland, Hebreeus, Indonesies, Iers, Koreaans, Maleis, Pools, Skots, Sweeds , Frans, Duits, Viëtnamees, Thai, Italiaans, Spaans en meer.
Teks-na-spraak
(TTS)
Om 'n beter gebruikerservaring met TTS te bied, is dit van kritieke belang om 'n stelsel te ontwikkel om natuurlik te klink. Bou 'n teks-na-spraak (TTS) veeltalige model met die hulp van ons wêreldwye arbeidsmag, wat jou help om spraakdata in 150+ tale en dialekte in te samel om jou KI-modelle van in-motor-kontroles tot kletsbotte en leeroplossings met hoë- kwaliteit klankdata.
Redes om Shaip te kies as u betroubare vennoot vir die versameling van spraakdata
Mense
Toegewyde en opgeleide spanne:
- 30,000+ medewerkers vir die skep van data, etikettering en QA
- Gesertifiseerde projekbestuurspan
- Ervare produkontwikkelingspan
- Talent Pool Sourcing & Onboarding Team
proses
Die hoogste doeltreffendheid van die proses word verseker deur:
- Robuuste 6 Sigma Stage-Gate-proses
- 'N Toegewyde span van 6 Sigma swart gordels - Belangrike prosesseienaars en voldoening aan gehalte
- Deurlopende verbetering en terugvoerlus
platform
Die gepatenteerde platform bied voordele:
- Web-gebaseerde end-to-end platform
- Onberispelike kwaliteit
- Vinniger TAT
- Naadloze aflewering
Mense
Toegewyde en opgeleide spanne:
- 30,000+ medewerkers vir die skep van data, etikettering en QA
- Gesertifiseerde projekbestuurspan
- Ervare produkontwikkelingspan
- Talent Pool Sourcing & Onboarding Team
proses
Die hoogste doeltreffendheid van die proses word verseker deur:
- Robuuste 6 Sigma Stage-Gate-proses
- 'N Toegewyde span van 6 Sigma swart gordels - Belangrike prosesseienaars en voldoening aan gehalte
- Deurlopende verbetering en terugvoerlus
platform
Die gepatenteerde platform bied voordele:
- Web-gebaseerde end-to-end platform
- Onberispelike kwaliteit
- Vinniger TAT
- Naadloze aflewering
Taal: Oudiodatastelle versamel
Van die rak spraak- / oudiodatastelle
besonderhede | Corpus ID (Uniek) | Sleutelwoord | Taaldatastel | Taalkode | Voorbeeldkoers | Datastel tipe | Totale oudio-ure | Kort beskrywing | Datastelbeskrywing | Audio Channel | Opname platform | WER (%) | Klank-formaat | Transkripsie-formaat | Gebruiksgeval | Aantal sprekers | GTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
af_US_CC_8 | Afro-Amerikaanse taal | Afro-Amerikaanse taal | nl_NL> | 8 kHz | Inbelsentrum | 211 | Afro-Amerikaanse Inbelsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 612, Manlik: 1242, en Onbekend: 12 | Kontak | |
af_US_MA_16 | Afro-Amerikaanse taal | Afro-Amerikaanse taal | nl_NL> | 16 kHz | Media Oudio | 154 | Afro-Amerikaanse Vernacular Media data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 151, Manlik: 150, en Onbekend: 10 | Kontak | |
Afrikaans_GC_8 | Afrikaans | Afrikaans | af_ZA | 8 kHz | Algemene gesprek | 368 | Afrikaans Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Afrikaans gepraat in Afrika | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 502, Manlik: 390, en Onbekend: 2 | Kontak | |
Afrikaans_MA_16 | Afrikaans | Afrikaans | af_ZA | 16 kHz | Media Oudio | 658 | Afrikaanse medialêers | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 750, Manlik: 1278, en Onbekend: 52 | Kontak | |
Arabies_GC_8 | Arabiese | Arabiese | ar_AE | 8 kHz | Algemene gesprek | 292 | Arabiese Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Arabies van Golflande | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 171, Manlik: 534, en Onbekend: 1 | Kontak | |
Arabies_SM_48 | Arabiese | Arabiese | ar | 48 kHz | Geskrewe monoloog | 1,947 | Arabiese skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 838 Manlik 1209 Onbekend 78 | Kontak | |
Assamees_CC_8 | Assamees | Assamees (in pyplyn) | soos in | Inbelsentrum | 60 | Assamees (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Assamees_GC | Assamees | Assamees (in pyplyn) | soos in | Algemene gesprek | 100 | Assamees (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Assamees_MA | Assamees | Assamees (in pyplyn) | soos in | Media Oudio | 40 | Assamees (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Bengali_CC_8 | bengali | Bengaals (in pyplyn) | bn_IN | Inbelsentrum | 60 | Bengaalse (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Bengali_GC | bengali | Bengaals (in pyplyn) | bn_IN | Algemene gesprek | 100 | Bengaalse (in pyplyn) algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Bengali_MA | bengali | Bengaals (in pyplyn) | bn_IN | Media Oudio | 40 | Bengaals (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Boston_CC_8 | Boston Engels | Boston Engels | nl_NL> | 8 kHz | Inbelsentrum | 177 | Boston oproepsentrum data | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 605, Manlik: 711, en Onbekend: 0 | Kontak | |
Boston_GC_8 | Boston Engels | Boston Engels | nl_NL> | 8 kHz | Algemene gesprek | 32 | Boston Algemene Gesprek data | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 53, Manlik: 83, en Onbekend: 0 | Kontak | |
Boston_MA_16 | Boston Engels | Boston Engels | nl_NL> | 16 kHz | Media Oudio | 93 | Boston Media klank data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 43, Manlik: 181, en Onbekend: 2 | Kontak | |
Kanadese_SM_48 | Kanadese Frans | Kanadese Frans | fr-CA | 48 kHz | Geskrewe monoloog | 1,222 | Kanadese Frans | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 974 Manlik 631 Onbekend 1 | Kontak | |
Chinees_CC_8 | Chinese Engels | Chinese Engels | nl_NL> | 8 kHz | Inbelsentrum | 169 | Chinese oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 1790, Manlik: 523 en Onbekend: 13 | Kontak | |
Chinees_MA_16 | Chinese Engels | Chinese Engels | nl_NL> | 16 kHz | Media Oudio | 249 | Chinese media oudio data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik: 126, Manlik: 346 en Onbekend: 6 | Kontak | |
Sjinees vereenvoudig_SM_48 | Chinese Simplified | Chinese Simplified | zh-CN | 48 kHz | Geskrewe monoloog | 2,762 | Chinese Simplified | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1920 Man 1535 Onbekend 270 | Kontak | |
Chinees Tradisioneel_SM_48 | Tradisionele Sjinees | Tradisionele Sjinees | zh-TW | 48 kHz | Geskrewe monoloog | 1,028 | Tradisionele Sjinees | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1069 Manlik 262 Onbekend 3 | Kontak | |
Deens_GC_8 | Deense | Deense | da_DK | 8 kHz | Algemene gesprek | 372 | Deense Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou: 311, Man: 417, Onbekend: 0 | Kontak | |
Deens_MA_16 | Deense | Deense | da_DK | 16 kHz | Media Oudio | 664 | Deense media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou: 369, Man: 864, Onbekend: 27 | Kontak | |
Deens_SM_48 | Deense | Deense | da-DK | 48 kHz | Geskrewe monoloog | 2,579 | Deense skrifmonoloog | Enkel-uiting opnames, wat geneig is om te val in die 5 tot 30 sekonde reeks, Deens uit Denemarke | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1551 Man 1233 Onbekend 42 | Kontak | |
Engels Deep South_CC_8 | Engels Diep Suid | Engels Diep Suid | nl_NL> | 8 kHz | Inbelsentrum | 151 | Engelse Deep South Call-center data | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 221 , Manlik 1004 , Onbekend 7 | Kontak | |
Engels Deep South_GC_8 | Engels Diep Suid | Engels Diep Suid | nl_NL> | 8 kHz | Algemene gesprek | 56 | Engelse Deep South Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 99, Man 31, Onbekend 0 | Kontak | |
Engels diep suid_MA_16 | Engels Diep Suid | Engels Diep Suid | nl_NL> | 16 kHz | Media Oudio | 266 | Engelse Deep South Media oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 204, Man 356, Onbekend 21 | Kontak | |
Duits_CC_8 | Duitse | Duitse | de-De | 8 kHz | Inbelsentrum | 64 | Duitse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Mono | lessenaar | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 478 Manlik 1440 Onbekend 0 | Kontak | ||
Duits_IVR_8 | Duitse | Duitse | de-De | 8 kHz | IVR | 200 | Duitse IVR data | Mens tot masjien. 'n IVR-tipe vloei waar daar 'n TTS-prompt is (bv. "Hoe kan ek jou help") gevolg deur 'n spontane menslike reaksie | Mono | lessenaar | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 10115 Man 8750 Onbekend 0 | Kontak | ||
Gujarati_CC_8 | gujarati | Gujarati (in pyplyn) | gu_IN | Inbelsentrum | 60 | Gujarati (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Gujarati_GC | gujarati | Gujarati (in pyplyn) | gu_IN | Algemene gesprek | 100 | Gujarati (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Gujarati_MA | gujarati | Gujarati (in pyplyn) | gu_IN | Media Oudio | 40 | Gujarati (in pyplyn) Media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Hebreeus_Algemene Gesprek_8 | Hebreeus | Hebreeus | hy_IL | 8 kHz | Algemene gesprek | 399 | Hebreeuse Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Hebreeus in Israel | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 414, Manlik 399, Onbekend 1 | Kontak | |
Hebreeus_MA_16 | Hebreeus | Hebreeus | hy_IL | 16 kHz | Media Oudio | 427 | Hebreeuse Media klank data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 361, Manlik 513, Onbekend 13 | Kontak | |
Hindi_MA_16 | hindi | hindi | hi_IN | 16 kHz | Media Oudio | 219 | Hindi Media klank data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 83, Manlik 309, Onbekend 0 | Kontak | |
Hindi_SM_48 | hindi | hindi | hi-IN | 48 kHz | Geskrewe monoloog | 2,867 | Hindi skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1977 Man 1864 Onbekend 147 | Kontak | |
HINGLISH_CC_8 | Hengelse | Hengelse | hg_IN | 8 kHz | Inbelsentrum | 208 | HINGLISH Inbelsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 822, Man 1262, Onbekend 0 | Kontak | |
HINGLISH_MA_16 | Hengelse | Hengelse | hg_IN | 16 kHz | Media Oudio | 216 | HINGLISH Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 75, Man 380, Onbekend 0 | Kontak | |
Hispanic_CC_8 | Spaans Engels | Spaans Engels | nl_NL> | 8 kHz | Inbelsentrum | 212 | Spaanse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 822, Man 1262, Onbekend 0 | Kontak | |
Hispanic_MA_16 | Spaans Engels | Spaans Engels | nl_NL> | 16 kHz | Media Oudio | 155 | Hispanic Call Media klank | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 140, Man 219, Onbekend 5 | Kontak | |
Indonesies_GC_8 | Indonesiese | Indonesiese | ek het | 8 kHz | Algemene gesprek | 496 | Indonesiese algemene gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Indonesies | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 524, Man 454, Onbekend 2 | Kontak | |
Indonesies_MA_16 | Indonesiese | Indonesiese | ek het | 16 kHz | Media Oudio | 643 | Indonesiese media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 746, Man 1507, Onbekend 129 | Kontak | |
Iers_GC_8 | Ierse | Ierse | en_IE | 8 kHz | Algemene gesprek | 192 | Ierse Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 213, Manlik 153, Onbekend 0 | Kontak | |
Japannees_SM_48 | Japannese | Japannese | ek-JP | 48 kHz | Geskrewe monoloog | 2,335 | Japannese skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1460 Man 1221 Onbekend 194 | Kontak | |
Kannada_CC_8 | kannada | Kannada (in pyplyn) | kn_IN | Inbelsentrum | 60 | Kannada (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Kannada_GC | kannada | Kannada (in pyplyn) | kn_IN | Algemene gesprek | 100 | Kannada (In Pyplyn) Algemene Gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Kannada_MA | kannada | Kannada (in pyplyn) | kn_IN | Media Oudio | 40 | Kannada (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Koreaans_CC_8 | Koreaanse | Koreaanse | ko_KR | 8 kHz | Inbelsentrum | 107 | Koreaanse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1086, Manlik 210, Onbekend 4 | Kontak | |
Koreaans_MA_16 | Koreaanse | Koreaanse | ko_KR | 16 kHz | Media Oudio | 204 | Koreaanse media klank data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 70 Man 303, Onbekend 25 | Kontak | |
Koreaans_SM_48 | Koreaanse | Koreaanse | ko-KR | 48 kHz | Geskrewe monoloog | 1,955 | Koreaanse skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1195 Man 1134 Onbekend 122 | Kontak | |
Maleis_GC_8 | malay | malay | ms_MY | 8 kHz | Algemene gesprek | 266 | Maleisiese algemene gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, Maleis in Maleisië | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 316, Manlik 176, Onbekend 0 | Kontak | |
Maleis_MA_16 | malay | malay | ms_MY | 16 kHz | Media Oudio | 344 | Maleisiese media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 236, Man 626, Onbekend 47 | Kontak | |
Malabaars_CC_8 | Malabaars | Malabaars (in pyplyn) | ml_IN | Inbelsentrum | 60 | Malabaars (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Malabaars_GC | Malabaars | Malabaars (in pyplyn) | ml_IN | Algemene gesprek | 100 | Malabaars (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Malabaars_MA | Malabaars | Malabaars (in pyplyn) | ml_IN | Media Oudio | 40 | Malabaars (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Marathi_CC_8 | Marathi | Marathi (in pyplyn) | mnr_IN | Inbelsentrum | 60 | Marathi (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Marathi_GC | Marathi | Marathi (in pyplyn) | mnr_IN | Algemene gesprek | 100 | Marathi (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Marathi_MA | Marathi | Marathi (in pyplyn) | mnr_IN | Media Oudio | 40 | Marathi (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Mexikaanse_SM_48 | Spaans (Mexiko) | Spaans (Mexiko) | af-MX | 48 kHz | Geskrewe monoloog | 1,492 | Mexikaanse Spaanse skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1016 Manlik 1069 Onbekend 95 | Kontak | |
Nederland_SM_48 | Nederlands | Nederlands | nl-NL | 48 kHz | Geskrewe monoloog | 1,205 | Nederlandse skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1285 Manlik 531 Onbekend 3 | Kontak | |
New York Engels_CC_8 | New York Engels | New York Engels | nl_NL> | 8 kHz | Inbelsentrum | 103 | New York Engelse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 610, Manlik 532, Onbekend 0 | Kontak | |
New York Engels_GC_8 | New York Engels | New York Engels | nl_NL> | 8 kHz | Algemene gesprek | 107 | New York Engels Algemene Gesprek data | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 118, Man 114, Onbekend 0 | Kontak | |
New York Engels_MA_16 | New York Engels | New York Engels | nl_NL> | 16 kHz | Media Oudio | 140 | New York Engelse Media oudio data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 66, Man 230, Onbekend 11 | Kontak | |
Nieu-Seeland_GC_8 | Nieu-Seeland Engels | Nieu-Seeland Engels | af_NZ | 8 kHz | Algemene gesprek | 148 | Nieu-Seeland Engels Algemene Gesprek data | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 167, man 121, Onbekend 4 | Kontak | |
Nieu-Seeland_MA_16 | Nieu-Seeland Engels | Nieu-Seeland Engels | af_NZ | 16 kHz | Media Oudio | 400 | Nieu-Seeland Engelse media oudio | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 367, man 678, Onbekend 26 | Kontak | |
Oriya_CC_8 | Oriya | Oriya (in pyplyn) | of_IN | Inbelsentrum | 60 | Oriya (In Pipeline) Call-Center data | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Oriya_GC | Oriya | Oriya (in pyplyn) | of_IN | Algemene gesprek | 100 | Oriya (In Pyplyn) Algemene Gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Oriya_MA | Oriya | Oriya (in pyplyn) | of_IN | Media Oudio | 40 | Oriya (In Pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Pools_MA_16 | Pools | Pools | pl_PL | 16 kHz | Media Oudio | 269 | Poolse media klank | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 173 Manlik 354 Onbekend 6 | Kontak | |
Pools Pole_SM_48 | Pools (Pole) | Pools (Pole) | pl-PL | 48 kHz | Geskrewe monoloog | 1,482 | Pools Pole - Skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1324 Manlik 701 Onbekend 24 | Kontak | |
Punjabi_CC_8 | Pandjabi | Punjabi (in pyplyn) | Pandjabi | Inbelsentrum | 60 | Punjabi (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Punjabi_GC | Pandjabi | Punjabi (in pyplyn) | Pandjabi | Algemene gesprek | 100 | Punjabi (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Punjabi_MA | Pandjabi | Punjabi (in pyplyn) | Pandjabi | Media Oudio | 40 | Punjabi (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Russies_SM_48 | Russiese | Russiese | ru-ru | 48 kHz | Geskrewe monoloog | 2,398 | Russiese skrifmonoloog | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1689 Man 1937 Onbekend 214 | Kontak | |
Skotse_GC_8 | Skots (Engelse aksent) | Skots (Engelse aksent) | en_AB | 8 kHz | Algemene gesprek | 292 | Skotse Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 285, Manlik 260, Onbekend 3 | Kontak | |
Singapoer_CC_8 | Singapoer Engels | Singapoer Engels | en_SG | 8 kHz | Inbelsentrum | 218 | Singapoer Call-Center data | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 2139, Manlik 884, Onbekend 21 | Kontak | |
Singapoer_MA_16 | Singapoer Engels | Singapoer Engels | en_SG | 16 kHz | Media Oudio | 247 | Singapore Media klank data | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 160, Man 455, Onbekend 37 | Kontak | |
Suid-Afrikaanse Engels_CC_8 | Suid-Afrikaanse Engels | Suid-Afrikaanse Engels | en_ZA | 8 kHz | Inbelsentrum | 261 | Suid-Afrikaanse Engelse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1274, Manlik 935, Onbekend 1 | Kontak | |
Suid-Afrikaanse Engels_MA_16 | Suid-Afrikaanse Engels | Suid-Afrikaanse Engels | en_ZA | 16 kHz | Media Oudio | 251 | Suid-Afrikaanse Engelse Media oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 235, Man 432, Onbekend 36 | Kontak | |
Swahili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Inbelsentrum | 230 | Swahili Call-Center data | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 611, Man 833, Onbekend 0 | Kontak | |
Swahili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Media Oudio | 265 | Swahili Media klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 118, Man 493, Onbekend 25 | Kontak | |
Sweeds_CC_8 | Sweeds | Sweeds | sv_SE | 8 kHz | Inbelsentrum | 250 | Sweedse oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 1581, man 727, Onbekend 2 | Kontak | |
Sweeds_MA_16 | Sweeds | Sweeds | sv_SE | 16 kHz | Media Oudio | 278 | Sweedse media klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 195, man 500, Onbekend 21 | Kontak | |
Tamil_CC_8 | tamil | Tamil (in pyplyn) | ta_IN | Inbelsentrum | 60 | Tamil (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Tamil_GC | tamil | Tamil (in pyplyn) | ta_IN | Algemene gesprek | 100 | Tamil (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Tamil_MA | tamil | Tamil (in pyplyn) | ta_IN | Media Oudio | 40 | Tamil (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Algemene gesprek | 553 | Telugu Algemene Gespreksdata | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 574, Manlik 564, Onbekend 0 | Kontak | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Media Oudio | 648 | Telugu Media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 207, Man 963, Onbekend 2 | Kontak | |
Telugu_CC_8 | telugu | Telugu (in pyplyn) | te_IN | Inbelsentrum | 30 | Telugu (in pyplyn) oproepsentrumdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Telugu_GC | telugu | Telugu (in pyplyn) | te_IN | Algemene gesprek | 50 | Telugu (in pyplyn) Algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Telugu_MA | telugu | Telugu (in pyplyn) | te_IN | Media Oudio | 20 | Telugu (in pyplyn) Media-oudiodata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Kontak | ||||
Thai_GC_8 | Thai | Thai | de_DE | 8 kHz | Algemene gesprek | 183 | Thai Algemene Gesprek | Ongeskrewe telefoniese gesprek tussen twee mense. Ongeveer. Oudioduur (reeks) - 15-60 minute, 'n informele register wat tussen vriende gebruik word | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 338, Man 96, Onbekend 8 | Kontak | |
Thai_MA_8 | Thai | Thai | de_DE | 16 kHz | Media Oudio | 173 | Thai Media klank | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 143, Man 502, Onbekend 26 | Kontak | |
Turkse Turkye_SM_48 | Turkse Turkye | Turkse Turkye | tr-TR | 48 kHz | Geskrewe monoloog | 2,027 | Turkse Turkye | Enkeluitingopnames, wat geneig is om in die 5 tot 30 sekonde reeks te val | Mono | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vroulik 1561 Manlik 1241 Onbekend 31 | Kontak | |
Viëtnamees_GC_8 | Viëtnamese | Viëtnamese | vi_VN | 8 kHz | Algemene gesprek | 295 | Viëtnamese algemene gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, Noordelike (bv. Hanoi), Sentraal en Suidelike (bv. Ho Chi Minh-stad). | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 400, man 380, Onbekendes 2 | Kontak | |
Viëtnamees_MA_16 | Viëtnamese | Viëtnamese | vi_VN | 16 kHz | Media Oudio | 257 | Viëtnamese media-klankdata | Gelisensieerde publieke domein oudio-/videolêers soos onderhoude, poduitsendings, ens. - 1 tot 5 mense. Ongeveer. Oudioduur (reeks) 15-60 minute | Mono | Webverkryging | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 249, man 200, Onbekendes 45 | Kontak | |
Wallies_GC_8 | Wallies (Engelse aksent) | Wallies (Engelse aksent) | en_WL | 8 kHz | Algemene gesprek | 278 | Walliese Algemene Gespreksdata | Ongeskrewe, sintetiese telefoniese gesprek tussen "agent" en "kliënt", Ongeveer. Oudioduur (reeks) 5-15 minute, | Dual | lessenaar | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Vrou 270, Man 324, Onbekend 0 | Kontak | |
VK Engels_WW_16 | Britse Engels | Britse Engels | en_uk | 16 kHz | Wake Word | 200 Sprekers | Wake Word UK Engels | sleutelfrases versameling van data
| 1 kanaal | Foon | 5.0 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Geslag: 50% manlik, 50% vroulik, +/- 10%. | Kontak |
dienste wat aangebied word
Deskundige klankdata-insameling is nie alles in die hande vir uitgebreide AI-opstellings nie. By Shaip kan u selfs die volgende dienste oorweeg om modelle meer algemeen as gewoonlik te maak:
Versameling van teksdata
Dienste
Die ware waarde van Shaip -kognitiewe data -insamelingsdienste is dat dit organisasies die sleutel gee om kritieke inligting wat in ongestruktureerde data voorkom, te ontsluit
Dienste vir die versameling van beelddata
Maak seker dat u rekenaarvisiemodel elke beeld akkuraat identifiseer om die volgende generasie AI-modelle van die toekoms naatloos op te lei
Dienste vir die versameling van video-data
Konsentreer nou op rekenaarvisie saam met NLP vir die opleiding van u modelle om voorwerpe, individue, afskrikmiddels en ander visuele elemente tot volmaaktheid te identifiseer
Aanbevole bronne
Bied
Audio -aantekening vir intelligente AI's
Oudio-aantekeningdienste is sedert die begin 'n sterk punt van Shaip. Ontwikkel, lei op en verbeter gespreks-KI, kletsbotte en spraakherkenningsenjins met ons moderne klankaantekeningdienste.
Kopergids
Kopersgids: Volledige Gids tot Gespreks-KI
Die kletsbot waarmee jy gesels het, loop op 'n gevorderde gespreks-KI-stelsel wat opgelei, getoets en gebou is met behulp van tonne spraakherkenningdatastelle.
Data Katalogus
Van die rak af spraakdatakatalogus en lisensiëring
Daar is 'n wye verskeidenheid algemene toepassings vir spraakdata in KI-projekte. Ons bied u groot hoeveelhede data van hoë gehalte gereed vir u stemherkenning.
Wil jy jou eie oudiodatastel bou?
Maak kontak met ons interne spraakdata-insamelingsdeskundige om 'n oudiobewaarplek op te stel wat die beste by jou behoefte pas