Stemgebaseerde UPI-betalingsopdragte: Vaslegging van diversiteit vir verbeterde KI-modelle
Gebruik Shaip se kundigheid in vinnige skepping en diverse oudio-opnames om stemgebaseerde UPI-betalingstelsels te ondersteun met hoë-gehalte, kultureel diverse data.
projek Oorsig
Shaip het 'n vennootskap met 'n toonaangewende fintech-maatskappy aangegaan om 'n stemgebaseerde betaaltoepassing te ontwikkel deur diverse UPI-betalingsopdragte te skep en op te neem. Die projek het die skepping van 2,500 87,000 unieke aanmanings en 13 200 gediversifiseerde versoeke oor 45 betalingsverwante voornemens behels, soos die stuur van geld, aanvra van geld, saldo-navrae en rekeningbetalings. Hierdie opdragte is meer as XNUMX uur deur XNUMX sprekers van uiteenlopende streke, agtergronde en ouderdomsgroepe opgeneem, wat 'n wye verskeidenheid taal- en omgewingsdiversiteit verseker.
Die doel van die projek was om opleidingsdata van hoë gehalte te ontwikkel vir 'n KI-model wat stemopdragte wat verband hou met UPI-betalings in werklike omgewings kan herken en daarop reageer.

Sleutelstatistieke
Oudio-ure van UPI-betalingsopdragte is aangeteken
200
Sprekers van uiteenlopende agtergronde (ouderdom, onderwys, streek)
45
Voornemens gedek, met 87,000 XNUMX+ gediversifiseerde aanwysings
13
Tale: Engels, met sprekers van verskillende moedertaal agtergronde (Kumaoni, Bengali, Malabaars, Gujarati, Hindi, Marathi ens.)
Projek Omvang
Vinnige skepping
Die omvang het die skep van unieke versoeke vir 'n stemgebaseerde UPI-betalingstelsel ingesluit. Aanwysings is ontwerp om veelvuldige bedoelings te dek, om te verseker dat hulle uiteenlopend in struktuur, woordeskat en benoemde entiteite was. Enkele sleutelaspekte sluit in:
13 Sleutelbedoelings, insluitend:
- Stuur geld: 65,653 XNUMX unieke en gediversifiseerde aanwysings
- Saldo-navraag: 3,052 opdragte
- Versoek geld: 26,972 opdragte
- Transaksiegeskiedenis, herlaai, rekeningbetaling, ens.
Oudioopname
Om egtheid en werklike toepaslikheid te verseker, is aansporings deur 45 sprekers van verskillende taalagtergronde opgeneem. Die diversiteit wat deur verskillende moedertale, streeksdialekte en omgewings (binne en buite) vasgelê is, het gehelp om die opleidingsdata te verbeter.
- Taaldiversiteit: Gebruikers is vlot in Engels, maar met verskillende moedertale, soos Kumaoni, Gujarati, Hindi, Bangla, Marathi en Malabaars.
- Ouderdom, geslag en opvoedkundige agtergrond: Data het 'n wye verskeidenheid van demografie vasgelê.
- Stedelike en landelike sprekers: Om die werklike gebruik te weerspieël, is beide stedelike en landelike sprekers ingesluit.
- Opname omgewing: Oudio-opnames is in beide binne- en buite-omgewings gedoen, met 'n verskeidenheid agtergrondgeluide ingesluit.
Uitdagings
Om te verseker dat aansporings uiteenlopende streeksdialekte en sprekerkenmerke weerspieël, het noukeurige beplanning en uitvoering vereis.
Die hantering van agtergrondgeluide en omgewingstoestande (binne en buite) was van kardinale belang vir werklike toepassing.
Die insluiting van sprekers van verskillende ouderdomsgroepe, opvoedkundige agtergronde en landelike/stedelike streke het kompleksiteit ingestel in die vaslegging van outentieke data.
Oplossing
Shaip het 'n oplossing gelewer wat die projek se uitdagings aangespreek het deur gevorderde NLP-tegnieke en noukeurige beplanning in beide vinnige skepping en opname te implementeer. Sleutel aspekte van die
oplossing ingesluit:
Vinnige skepping
- 2,500 unieke aanwysings is geskep, elkeen gediversifiseer deur struktuur en woordeskat.
- 13 voornemens is gedek, wat wissel van basiese betalingsversoeke tot meer komplekse navrae soos transaksiegeskiedenis en rekeningbetalings.
Oudioopname
- 200 uur van oudio-opnames is uitgevoer deur 45 gebruikers, wat diversiteit oor inheemse tale, omgewings en sprekerdemografie verseker.
- Beide binne- en buite-omgewings is vir opname gebruik om natuurlike klankvariasie te verseker.
- Sprekers het 'n reeks streeksdialekte verteenwoordig, wat akkurate linguistiese voorstelling verseker het.
Voorneme | Stuur | Saldo-ondersoek | Versoek geld | Transaksie Geskiedenis |
---|---|---|---|---|
prompt | Doen 'n betaling van een-en-twintig honderd aan Sumatri vir huishuur | Ek wil my huidige saldo in my spaarrekening weet. | Kan jy vir Raji, driehonderd-en-agtien roepies vir 'n noodgeval aanvra? | Wys my my debietkaarttransaksiegeskiedenis. |
gujarati | સુમાત્રીને ઘરના ભાડા પેટે એકવીસસફ ચસૂ | હું મારા બચત ખાતામાં મારી વર્તમાનલનબફ વા માંગુ છું. | શું તમે રાજી પાસેથી ઇમર્જન્સી માટઢ ત ર રૂપિયા માંગી શકો છો? | મને મારા ડેબિટ કાર્ડના વ્યવહાર દેડા. |
hindi | सुमात्री को मकान किराए के लिए इक्ॕरऌ ा भुगतान करें | | मैं अपने बचत खाते में वर्तमान शेष शाननाान ाहता हूँ। | क्या आप राजी से किसी इमरजेंसी के ल।तऌ रह रुपये मांग सकते हैं? | मुझे मेरा डेबिट कार्ड का लेनदेन ब्रौ |
Malabaars | വീട്ടുവാടകയായി സുമത്രിക്ക് രണ്ടിര്ടാര ന്നൂറ് നൽകൂ. | എൻ്റെ സേവിംഗ്സ് അക്കൗണ്ടിലെ നിലവിലയവില ാൻ ഞാൻ ആഗ്രഹിക്കുന്നു. | രാജിയോട് മുന്നൂറ്റി പതിനെട്ട് രൿടാനരട വശ്യത്തിന് ആവശ്യപ്പെടാമോ? | എൻ്റെ ഡെബിറ്റ് കാർഡ് ഇടപാട് വിവകണ വകണിം . |
telugu | ఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క ించండి | నేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రత్రత ెన్స్ ను తెలుసుకోవాలనుకుంటున్నాను. | ఎమర్జెన్సీ కోసం రాజిని మూడు వందల్ররররর রর రూపాయలు అడగగలరా? | నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రనన ంచండి. |
Bangla বাংলা | বাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০০০ ০০০ োধ করুন | আমি আমার সঞ্চয় অ্যাকাউন্টে বর্লমান স জানতে চাই। | আপনি রাজির কাছে তাৎক্ষণিক অবস্থানজননজষণিক আঠারো টাকাচেয়ে নিতে পারেন? | আমার ডেবিট কার্ডের লেনদেনের ইতিহনাই আমার ডেবিট |
Marathi | सुमात्री ला घरा चे रेंट साठी दोन हरतरस ुपये चुकवा | मला माये बचत खाते मधी चालू बॅलन्स णाआ जाआ | काय तुम्ही राजी पासून तीन सो अठराँहर। शकते इमरजेंसी साठी ? | मला माझे डेबिट कार्ड चे लेन देन दाखवत. |
Die uitkoms
Die hoë-gehalte, diverse klankdata wat deur Shaip gelewer is, het die kliënt toegelaat om 'n KI-gedrewe stemgebaseerde UPI-betalingstelsel te ontwikkel wat in staat is om opdragte in verskeie dialekte, omgewings en kontekste te herken. Die data het gehelp om:
- Intydse stemherkenning in komplekse omgewings.
- Meer akkurate UPI-transaksie hantering vir 'n groter verskeidenheid gebruikers.
- Scalability: Die projek lê 'n sterk grondslag vir uitbreiding na ander Indiese tale.
Aflewerbares
- 200 uur van oudiolêers (8 kHz PCM WAV-formaat, mono)
- 87,000 + gediversifiseerde aansporings wat met unieke bedoelings geannoteer is
- Metadata: Luidsprekerprofiele, omgewingsbesonderhede en transkripsieakkuraatheid
Shaip se vermoë om die diversiteit van Indië vas te vang deur unieke aanmanings en outentieke oudio-opnames was 'n speletjie-wisselaar vir ons stemgebaseerde UPI-betalingstelsel. Hul span het verseker dat elke aspek van die projek – van vinnige skepping tot opnamekwaliteit – met presisie hanteer is, wat ons gehelp het om 'n meer inklusiewe, robuuste stemherkenningsmodel te bou.