Kry nou 50% AF* oor Gespreks-KI Off-the-Shelf-datastelle
Spraak- en oudiodatastel vir kletsbotte, stemassistente, spraakgeaktiveerde toestelle.
*Beperkte tydperk aanbod
Vertrou deur bedryfsleiers
besonderhede | Sleutelwoord | Van die rak taaldatastel | Inbelsentrumgesprekke 8khz* | Generiese gesprekke 8khz* | Media en poduitsendings 16khz* | Uiting/ Skrifmonoloog 16khz* | Totale volume in ure | Dialekte gedek | Klank-formaat | Tekstranskripsieformaat | Gebruiksgeval | Bron | GTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Afrikaans | Afrikaanse oudiodatastel | 600 | 900 | 1500 | Afrikaans wat in Afrika gepraat word | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Arabiese | Arabiese oudiodatastel | 800 | 1500 | 2300 | Arabies van Golflande | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Chinese | Chinese oudiodatastel | 2000 | 2000 | Chinese uit China | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
Deense | Deense oudiodatastel | 400 | 600 | 2000 | 3000 | Deens uit Denemarke | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
Nederlands | Nederlandse oudiodatastel | 2000 | 2000 | Nederlands uit Nederland | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
Engels - AAVE Accent | Engels - AAVE (African American Vernacular English) Oudiodatastel | 500 | 500 | 1000 | Die volksvariëteit (soms bekend as AAVE, tipies gepraat deur die oorgrote meerderheid van werkers- en middelklas Afro-Amerikaners) en die meer standaardvariëteit (gewoonlik gepraat deur middelklas Afro-Amerikaners in formele en openbare situasies) maar met 'n sterker klem op die volksmond. | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Engels - Boston/New York Accent | Engels - Boston/New York oudiodatastel | 225 | 225 | 350 | 800 | Dit is 'n versameling van verskeie plaaslike aksente wat in en om die stede Boston, New York en Philadelphia gepraat word. Hierdie aksent klink dalk soortgelyk aan nie-lokale mense, maar verskil van ander Amerikaanse aksente. Ten spyte van sommige plaaslike woordeskat wat verskil van ander dele van die Engelssprekende wêreld, is hierdie aksente wedersyds verstaanbaar met Engels wat elders gepraat word. | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
Engels - Chinese aksent | Engels - Sjinees geaksenteerde oudiodatastel | 150 | 300 | 450 | Sprekers wat Chinees as hul eerste taal praat en wat as tieners/volwassenes na die Verenigde State verhuis/geïmmigreer het en Engels as hul tweede taal geleer het. | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Engels - Deep South Accent | Engels - Deep South Audio Dataset | 275 | 275 | 450 | 1000 | Sprekers van (i) Texas; (ii) Noord-Carolina, Suid-Carolina, Georgia; (iii) New Orleans; (iv) Florida panhandle; (v) Tennessee, Arkansas, Michigan. | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
Engels - Spaanse aksent | Engels - Hispanic Accented Audio Dataset | 400 | 400 | 800 | Spaans-Engels verwys na die variëteite van Amerikaanse Engels wat gepraat word deur Spaanse Amerikaners van uiteenlopende nasionale erfenis. Die hooffokus was op Mexikaanse Amerikaners, sprekers van verskillende nasionale oorsprong (bv. Mexiko, Puerto Rico, Dominikaanse Republiek, Ecuador, Kuba, ens.) en ook van verskillende streke (bv. Kalifornië, New York, Florida). Sprekers ingesluit was wat Spaans as 'n eerste taal praat, sowel as sprekers van Spaanse oorsprong wat Spaans praat, het 'n erfenistaal. | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Engels - Nieu-Seelandse aksent | Engels - Nieu-Seeland oudiodatastel | 250 | 750 | 1000 | Sprekers op beide eilande, insluitend 'n mengsel van jonger sprekers (<40 jaar oud) en ouer sprekers (>40 jaar oud) in gelyke verhoudings. | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Engels - Singapoer aksent | Engels - Singapoer oudiodatastel | 400 | 600 | 1000 | Beide Standard Singapore English en Colloquial Singapore English. Singapoerers van verskillende etniese agtergronde (bv. Chinees, Maleis, Indiër, ens.) en van verskillende opvoedkundige vlakke. | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Engels - Suid-Afrika Aksent | Engels - Suid-Afrika Oudiodatastel | 400 | 600 | 1000 | Verteenwoordigers van verskeie sosio-ekonomiese klasse en etnologiese agtergronde (bv. Suid-Afrikaners van Europese, Afrika-, Indiese of gemengde agtergrond). | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Engels - Ierse aksent | Engels - Ierse oudiodatastel | 500 | 500 | Engels wat in Ierland gepraat word | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
Engels - Skotse aksent | Engels - Skotse oudiodatastel | 800 | 800 | Engels gepraat deur Skots | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
Engels - Walliese aksent | Engels - Walliese oudiodatastel | 800 | 800 | Wallies Engels | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
Frans Kanadees | Frans-Kanadese oudiodatastel | 1000 | 1000 | Kanadese Frans | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
Hebreeus | Hebreeuse oudiodatastel | 750 | 750 | 1500 | Hebreeus in Israel | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Indonesiese | Indonesiese oudiodatastel | 1000 | 1000 | 2000 | Bahasa Indonesies | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Japannese | Japannese oudiodatastel | 2000 | 2000 | Japannees uit Japan | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
Koreaanse | Koreaanse oudiodatastel | 100 | 200 | 1500 | 1800 | Sprekers het deur Suid-Korea versprei. | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
malay | Maleisiese oudiodatastel | 500 | 500 | 1000 | Maleis in Maleisië | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Mexikaanse Spaans | Mexikaanse Spaanse oudiodatastel | 1250 | 1250 | Meksikaans van Mexiko | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
Pools | Poolse oudiodatastel | 250 | 2000 | 2250 | Pools uit Pole | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Russiese | Russiese oudiodatastel | 2000 | 2000 | Russies uit Rusland | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
swahili | Swahili oudiodatastel | 350 | 650 | 1000 | Suid-Afrikaanse en Keniaanse Swahili | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Sweeds | Sweedse oudiodatastel | 350 | 650 | 1000 | Sweeds in Swede | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Taiwan Sjinees | Taiwan Chinese oudiodatastel | 1000 | 1000 | Chinese van Taiwan | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
Thai | Thaise oudiodatastel | 350 | 450 | 800 | 'n Informele register wat tussen vriende gebruik word, | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Turkse | Turkse oudiodatastel | 2000 | 2000 | Turks uit Turkye | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||||
Viëtnamese | Viëtnamese oudiodatastel | 600 | 400 | 1000 | Noordelike (bv. Hanoi), Sentraal en Suidelike (bv. Ho Chi Minh-stad). | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
hindi | Hindi oudiodatastel | 800 | 2000 | 2800 | Hindi in Indië spesifiek in Noord-, Oos- en Wes-streke | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Hengelse | Indiese Engelse oudiodatastel | 300 | 500 | 800 | Versamel uit stedelike Indiese stede wat finansiële spilpunte van die land is as gevolg van groeiende ekonomiese geleenthede. Sulke plekke kan Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad, ens. | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||
Inglese | Engelse oudiodatastel | 700 | 700 | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | |||||
kannada | Kannada oudiodatastel | 60 | 100 | 40 | 200 | Kannada van Karnataka, Indië | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
Malabaars | Malabaars oudiodatastel | 60 | 100 | 40 | 200 | Malayalam van Kerala, Lakshadweep en Puducherry | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
Oriya | Oriya oudiodatastel | 60 | 100 | 40 | 200 | Oriya uit dele van Odisha, Wes-Bengale, Jharkhand en Chhattisgarh | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
Pandjabi | Punjabi oudiodatastel | 60 | 100 | 40 | 200 | Punjabi van Punjab, Indië | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
tamil | Tamil oudiodatastel | 60 | 100 | 240 | 400 | Tamil van Tamil Nadu, Indië | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
telugu | Telugu oudiodatastel | 100 | 950 | 950 | 2000 | Telugu van Andhra Pradesh, Indië | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
bengali | Bengaalse oudiodatastel | 60 | 100 | 40 | 200 | Bengaals van Wes-Bengale, Indië | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
gujarati | Gujarati oudiodatastel | 60 | 100 | 40 | 200 | Gujarati van Gujarat, Indië | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
Marathi | Marathi oudiodatastel | 60 | 100 | 40 | 200 | Marathi van Maharashtra, Indië | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons | ||
Assamees | Assamees oudiodatastel | 60 | 100 | 40 | 200 | Assamees van Asssam, Indië | Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, Taalmodellering | Shaip | Kontak Ons Kontak Ons |
Diep kundigheid in gespreksgenote
Gespreks-KI of Chatbots of virtuele / digitale assistente is net so slim soos die tegnologie en data agter hulle. By Shaip bied ons jou 'n wye reeks van die gediversifiseerde oudiodatastel vir Natuurlike Taalverwerking (NLP) wat gesprekke met regte mense naboots wat jou in staat stel om jou KI tot lewe te bring. Met ons diepgaande begrip help ons jou om AI-geaktiveerde spraakmodelle te bou en te lokaliseer, met die grootste akkuraatheid met ryk en gestruktureerde datastelle in veelvuldige tale van regoor die wêreld. Ons bied meertalige oudioversameling, oudiotranskripsie en oudio-aantekeningdienste op grond van jou vereiste, terwyl die verlangde bedoeling, uitsprake en demografiese verspreiding volledig aangepas word.
Gesproke versameling
Versameling van spontane toespraak
Transkripsie van klankdata
Datamerking en -aantekening
Met Shaip kan jy jou Gesprek-KI-platform akkuraat oplei sodat dit:
- Praat, SMS en klets naatloos oor verskeie kanale.
- Leer uit bestaande interaksies in die vorm van klets, stemtranskripsies, transaksies, ens. en stel voor en gesels, gebaseer op hierdie leerstellings.
- Verstaan ​​die bedoeling agter menslike spraak en verwyder dubbelsinnigheid in die verstaan ​​van menslike taal.
- Interaksie met jou op 'n een-tot-een basis en kan opgelei word om gebruikers te identifiseer en vorige gesprekke te onthou.
'N Wêreldleier op die gebied van AI-opleidingsdata
Ure klankdata in meer as 100 tale - verkry, getranskribeer en geannoteer
Lisensiëring van spraakdata
20k + uur spraakgegewens in meer as 40 tale en dialekte wat 'n verskeidenheid van 55+ onderwerpe dek van verskillende domeine, naamlik oproepsentrum, debatte, algemene gesprekke, toesprake, podcasts, ens.
Versameling van spraakdata
Versamel klank- en spraakdata (monoloog, tweepersoonsgesprek, mens-bot-klets) in meer as 2 tale van regoor die wêreld, aangepas volgens u AI-vereiste.
Spraakdatatranskripsie
Koste-effektiewe oudio-transkripsie of oudio-aantekeninge deur 'n sterk arbeidsmag van 30,000 XNUMX medewerkers met gewaarborgde TAT, akkuraatheid en besparings
Versnel die gesprekontwikkeling van AI-toepassings met Audio Collection & Audio Annotation Services
Die Shaip-voordeel
Skaal
Ons kan klankdata van regoor die wêreld in verskillende tale en dialekte verkry, skaal en aflewer op grond van u vereistes.
Kundigheid
Ons beskik oor die regte kundigheid rakende akkurate en onbevooroordeelde data-insameling, transkripsie en goudstandaard-aantekeninge.
Netwerk
'N Netwerk van meer as 30,000 gekwalifiseerde bydraers, wat vinnig data-insameltake kan opdra om AI-opleidingsmodelle en opskaaldienste te bou.
Tegnologie
Ons het 'n volledig AI-gebaseerde platform met eie instrumente en prosesse om die werkvloeibestuur 24 * 7 XNUMX uur per dag te benut.
Agility
Ons pas baie vinnig aan by veranderinge in klantvereistes en help om KI-ontwikkeling te versnel met kwaliteit spraakdata 5-10x vinniger as kompetisie.
Sekuriteit
Ons is van uiterste belang vir datasekuriteit en privaatheid en is ook gesertifiseer om sensitiewe data met hoogs gereguleerde inligting te hanteer.
Wat ons die beste doen
Opleidingsdata
Kry die hoogste kwaliteit gemerkte data in 'n fraksie van die tyd. Dit is goudstandaard, betroubaar en gereed om jou KI- en ML-modelle op te lei om die hoogste vlakke van werkverrigting te bereik.
Data-insameling, etikettering en annotasie
Met Shaip kry jy 15+ jaar se bewese kundigheid in die insameling, transkribering en annotasie van kwaliteitdata. Met ons wêreldwye arbeidsmag kan ons data van regoor die wêreld insamel, en dan etiketteer- en annotasiedienste verskaf met die perfekte hoeveelheid vaardigheidsvlak en kundigheid wat vir jou data vereis word.
Datakatalogusse en lisensiëring
Met ons groot voorraad van miljoene datastelle kan jy versamel en organiseer soos nodig. Ons kan dan daardie kwaliteitdata lisensieer vir jou spesifieke KI- en ML-gebruiksvereistes. Boonop is hierdie data beskikbaar teen 'n fraksie van die koste as u dit self sou skep.
Wil jy jou eie datastel bou?
Kontak ons ​​nou om te leer hoe ons 'n pasgemaakte datastel vir jou unieke KI-oplossing kan insamel.