Kry nou 50% AF* oor Gespreks-KI Off-the-Shelf-datastelle

Spraak- en oudiodatastel vir kletsbotte, stemassistente, spraakgeaktiveerde toestelle.

*Beperkte tydperk aanbod

  • Deur te registreer stem ek saam met Shaip Privaatheidsbeleid en Algemene Diens en gee my toestemming om B2B-bemarkingskommunikasie van Shaip te ontvang.

Vertrou deur bedryfsleiers

besonderhedeVan die rak taaldatastelInbelsentrumgesprekke 8khz*Generiese gesprekke 8khz*Media en poduitsendings 16khz*Uiting/ Skrifmonoloog 16khz*Totale volume in ureDialekte gedekKlank-formaatTekstranskripsieformaatGebruiksgevalBronGTA
ToespraakAfrikaansAfrikaanse oudiodatastel6009001500Afrikaans wat in Afrika gepraat wordWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakArabieseArabiese oudiodatastel80015002300Arabies van GolflandeWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakChineseChinese oudiodatastel20002000Chinese uit ChinaWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakDeenseDeense oudiodatastel40060020003000Deens uit DenemarkeWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakNederlandsNederlandse oudiodatastel20002000Nederlands uit NederlandWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - AAVE AccentEngels - AAVE (African American Vernacular English) Oudiodatastel5005001000Die volksvariëteit (soms bekend as AAVE, tipies gepraat deur die oorgrote meerderheid van werkers- en middelklas Afro-Amerikaners) en die meer standaardvariëteit (gewoonlik gepraat deur middelklas Afro-Amerikaners in formele en openbare situasies) maar met 'n sterker klem op die volksmond.Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - Boston/New York AccentEngels - Boston/New York oudiodatastel225225350800Dit is 'n versameling van verskeie plaaslike aksente wat in en om die stede Boston, New York en Philadelphia gepraat word. Hierdie aksent klink dalk soortgelyk aan nie-lokale mense, maar verskil van ander Amerikaanse aksente. Ten spyte van sommige plaaslike woordeskat wat verskil van ander dele van die Engelssprekende wêreld, is hierdie aksente wedersyds verstaanbaar met Engels wat elders gepraat word.Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - Chinese aksentEngels - Sjinees geaksenteerde oudiodatastel150300450Sprekers wat Chinees as hul eerste taal praat en wat as tieners/volwassenes na die Verenigde State verhuis/geïmmigreer het en Engels as hul tweede taal geleer het.Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - Deep South AccentEngels - Deep South Audio Dataset2752754501000Sprekers van (i) Texas; (ii) Noord-Carolina, Suid-Carolina, Georgia; (iii) New Orleans; (iv) Florida panhandle; (v) Tennessee, Arkansas, Michigan.Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - Spaanse aksentEngels - Hispanic Accented Audio Dataset400400800Spaans-Engels verwys na die variëteite van Amerikaanse Engels wat gepraat word deur Spaanse Amerikaners van uiteenlopende nasionale erfenis. Die hooffokus was op Mexikaanse Amerikaners, sprekers van verskillende nasionale oorsprong (bv. Mexiko, Puerto Rico, Dominikaanse Republiek, Ecuador, Kuba, ens.) en ook van verskillende streke (bv. Kalifornië, New York, Florida). Sprekers ingesluit was wat Spaans as 'n eerste taal praat, sowel as sprekers van Spaanse oorsprong wat Spaans praat, het 'n erfenistaal.Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - Nieu-Seelandse aksentEngels - Nieu-Seeland oudiodatastel2507501000Sprekers op beide eilande, insluitend 'n mengsel van jonger sprekers (<40 jaar oud) en ouer sprekers (>40 jaar oud) in gelyke verhoudings.Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - Singapoer aksentEngels - Singapoer oudiodatastel4006001000Beide Standard Singapore English en Colloquial Singapore English. Singapoerers van verskillende etniese agtergronde (bv. Chinees, Maleis, Indiër, ens.) en van verskillende opvoedkundige vlakke.Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - Suid-Afrika AksentEngels - Suid-Afrika Oudiodatastel4006001000Verteenwoordigers van verskeie sosio-ekonomiese klasse en etnologiese agtergronde (bv. Suid-Afrikaners van Europese, Afrika-, Indiese of gemengde agtergrond).Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - Ierse aksentEngels - Ierse oudiodatastel500500Engels wat in Ierland gepraat wordWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - Skotse aksentEngels - Skotse oudiodatastel800800Engels gepraat deur SkotsWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakEngels - Walliese aksentEngels - Walliese oudiodatastel800800Wallies EngelsWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakFrans KanadeesFrans-Kanadese oudiodatastel10001000Kanadese FransWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakHebreeusHebreeuse oudiodatastel7507501500Hebreeus in IsraelWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakIndonesieseIndonesiese oudiodatastel100010002000Bahasa IndonesiesWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakJapanneseJapannese oudiodatastel20002000Japannees uit JapanWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakKoreaanseKoreaanse oudiodatastel10020015001800Sprekers het deur Suid-Korea versprei.Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakmalayMaleisiese oudiodatastel5005001000Maleis in MaleisiëWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakMexikaanse SpaansMexikaanse Spaanse oudiodatastel12501250Meksikaans van MexikoWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakPoolsPoolse oudiodatastel25020002250Pools uit PoleWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakRussieseRussiese oudiodatastel20002000Russies uit RuslandWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakswahiliSwahili oudiodatastel3506501000Suid-Afrikaanse en Keniaanse SwahiliWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakSweedsSweedse oudiodatastel3506501000Sweeds in SwedeWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakTaiwan SjineesTaiwan Chinese oudiodatastel10001000Chinese van TaiwanWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakThaiThaise oudiodatastel350450800'n Informele register wat tussen vriende gebruik word,Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakTurkseTurkse oudiodatastel20002000Turks uit TurkyeWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakViëtnameseViëtnamese oudiodatastel6004001000Noordelike (bv. Hanoi), Sentraal en Suidelike (bv. Ho Chi Minh-stad).Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakhindiHindi oudiodatastel80020002800Hindi in Indië spesifiek in Noord-, Oos- en Wes-strekeWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakHengelseIndiese Engelse oudiodatastel300500800Versamel uit stedelike Indiese stede wat finansiële spilpunte van die land is as gevolg van groeiende ekonomiese geleenthede. Sulke plekke kan Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad, ens.Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakIngleseEngelse oudiodatastel700700Wav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakkannadaKannada oudiodatastel6010040200Kannada van Karnataka, IndiëWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakMalabaarsMalabaars oudiodatastel6010040200Malayalam van Kerala, Lakshadweep en PuducherryWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakOriyaOriya oudiodatastel6010040200Oriya uit dele van Odisha, Wes-Bengale, Jharkhand en ChhattisgarhWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakPandjabiPunjabi oudiodatastel6010040200Punjabi van Punjab, IndiëWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraaktamilTamil oudiodatastel60100240400Tamil van Tamil Nadu, IndiëWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakteluguTelugu oudiodatastel1009509502000Telugu van Andhra Pradesh, IndiëWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakbengaliBengaalse oudiodatastel6010040200Bengaals van Wes-Bengale, IndiëWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakgujaratiGujarati oudiodatastel6010040200Gujarati van Gujarat, IndiëWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakMarathiMarathi oudiodatastel6010040200Marathi van Maharashtra, IndiëWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip
ToespraakAssameesAssamees oudiodatastel6010040200Assamees van Asssam, IndiëWav.jsonASR, Virtual Assistant, Chatbot, Conversational KI, Spraakanalise, TTS, TaalmodelleringShaip

Diep kundigheid in gespreksgenote

Gespreks-KI of Chatbots of virtuele / digitale assistente is net so slim soos die tegnologie en data agter hulle. By Shaip bied ons jou 'n wye reeks van die gediversifiseerde oudiodatastel vir Natuurlike Taalverwerking (NLP) wat gesprekke met regte mense naboots wat jou in staat stel om jou KI tot lewe te bring. Met ons diepgaande begrip help ons jou om AI-geaktiveerde spraakmodelle te bou en te lokaliseer, met die grootste akkuraatheid met ryk en gestruktureerde datastelle in veelvuldige tale van regoor die wêreld. Ons bied meertalige oudioversameling, oudiotranskripsie en oudio-aantekeningdienste op grond van jou vereiste, terwyl die verlangde bedoeling, uitsprake en demografiese verspreiding volledig aangepas word.

Gesproke versameling

Versameling van spontane toespraak

Transkripsie van klankdata

Datamerking en -aantekening

Met Shaip kan jy jou Gesprek-KI-platform akkuraat oplei sodat dit:

  • Praat, SMS en klets naatloos oor verskeie kanale.
  • Leer uit bestaande interaksies in die vorm van klets, stemtranskripsies, transaksies, ens. en stel voor en gesels, gebaseer op hierdie leerstellings.
  • Verstaan ​​die bedoeling agter menslike spraak en verwyder dubbelsinnigheid in die verstaan ​​van menslike taal.
  • Interaksie met jou op 'n een-tot-een basis en kan opgelei word om gebruikers te identifiseer en vorige gesprekke te onthou.

'N Wêreldleier op die gebied van AI-opleidingsdata

Ure klankdata in meer as 100 tale - verkry, getranskribeer en geannoteer

Lisensiëring van spraakdata

20k + uur spraakgegewens in meer as 40 tale en dialekte wat 'n verskeidenheid van 55+ onderwerpe dek van verskillende domeine, naamlik oproepsentrum, debatte, algemene gesprekke, toesprake, podcasts, ens.

Versameling van spraakdata

Versamel klank- en spraakdata (monoloog, tweepersoonsgesprek, mens-bot-klets) in meer as 2 tale van regoor die wêreld, aangepas volgens u AI-vereiste.

Spraakdatatranskripsie

Koste-effektiewe oudio-transkripsie of oudio-aantekeninge deur 'n sterk arbeidsmag van 30,000 XNUMX medewerkers met gewaarborgde TAT, akkuraatheid en besparings

Versnel die gesprekontwikkeling van AI-toepassings met Audio Collection & Audio Annotation Services

Die Shaip-voordeel

Skaal

Ons kan klankdata van regoor die wêreld in verskillende tale en dialekte verkry, skaal en aflewer op grond van u vereistes.

Kundigheid

Ons beskik oor die regte kundigheid rakende akkurate en onbevooroordeelde data-insameling, transkripsie en goudstandaard-aantekeninge.

Netwerk

'N Netwerk van meer as 30,000 gekwalifiseerde bydraers, wat vinnig data-insameltake kan opdra om AI-opleidingsmodelle en opskaaldienste te bou.

Tegnologie

Ons het 'n volledig AI-gebaseerde platform met eie instrumente en prosesse om die werkvloeibestuur 24 * 7 XNUMX uur per dag te benut.

Agility

Ons pas baie vinnig aan by veranderinge in klantvereistes en help om KI-ontwikkeling te versnel met kwaliteit spraakdata 5-10x vinniger as kompetisie.

Sekuriteit

Ons is van uiterste belang vir datasekuriteit en privaatheid en is ook gesertifiseer om sensitiewe data met hoogs gereguleerde inligting te hanteer.

Wat ons die beste doen

Opleidingsdata

Kry die hoogste kwaliteit gemerkte data in 'n fraksie van die tyd. Dit is goudstandaard, betroubaar en gereed om jou KI- en ML-modelle op te lei om die hoogste vlakke van werkverrigting te bereik.

Leer meer

Data-insameling, etikettering en annotasie

Met Shaip kry jy 15+ jaar se bewese kundigheid in die insameling, transkribering en annotasie van kwaliteitdata. Met ons wêreldwye arbeidsmag kan ons data van regoor die wêreld insamel, en dan etiketteer- en annotasiedienste verskaf met die perfekte hoeveelheid vaardigheidsvlak en kundigheid wat vir jou data vereis word.

Leer meer

Datakatalogusse en lisensiëring

Met ons groot voorraad van miljoene datastelle kan jy versamel en organiseer soos nodig. Ons kan dan daardie kwaliteitdata lisensieer vir jou spesifieke KI- en ML-gebruiksvereistes. Boonop is hierdie data beskikbaar teen 'n fraksie van die koste as u dit self sou skep.

Leer meer

Wil jy jou eie datastel bou?

Kontak ons ​​nou om te leer hoe ons 'n pasgemaakte datastel vir jou unieke KI-oplossing kan insamel.