Gevallestudie: Inhoudmoderering

Soos die gebruik van sosiale media aanhou groei, het die probleem van kuberafknouery opgeduik as 'n beduidende struikelblok vir platforms wat daarna streef om 'n veilige aanlynruimte te verseker. ’n Verstommende 38% van individue kom daagliks teë met hierdie nadelige gedrag, wat die dringende vraag na vindingryke benaderings vir inhoudmoderering beklemtoon. Organisasies maak vandag staat op die gebruik van kunsmatige intelligensie om die blywende probleem van kuberafknouery proaktief aan te spreek.
Kuber sekuriteit:
Facebook se verslag oor die toepassing van gemeenskapstandaarde in die vierde kwartaal het aan die lig gebring – optrede teen 4 miljoen stukke boelie- en teistering-inhoud, met 'n proaktiewe opsporingsyfer van 6.3%
Onderrig:
A 2021 studie het bevind dat 36.5%% van die studente in die Verenigde State tussen die ouderdomme van 12 & 17 jare tydens hul skoolopleiding kuberafknouery ervaar het.
Volgens 'n 2020-verslag is die wêreldwye mark vir oplossings vir inhoudmoderering in 4.07 gewaardeer teen USD 2019 miljard en daar word verwag om teen 11.94 USD 2027 miljard te bereik, met 'n CAGR van 14.7%.
Regte wêreld oplossing
Data wat globale gesprekke modereer
Die kliënt was besig om 'n robuuste outomatiese inhoudmoderasie-masjienleermodel vir sy Wolk-aanbieding te ontwikkel, waarvoor hulle op soek was na domeinspesifieke verskaffer wat hulle kon help met akkurate opleidingsdata.
Deur gebruik te maak van ons uitgebreide kennis in natuurlike taalverwerking (NLP), het ons die kliënt gehelp om meer as 30,000 XNUMX dokumente in beide Engels en Spaans in te samel, te kategoriseer en aan te teken om outomatiese inhoudmoderering Masjienleermodel te bou wat verdeel is in Giftige, Volwasse of Seksueel Eksplisiete inhoud kategorieë.
Probleem
- Web skraap 30,000 XNUMX dokumente in beide Spaans en Engels uit geprioritiseerde domeine
- Kategoriseer die versamelde inhoud in kort, medium en lang segmente
- Benoem die saamgestelde data as giftige, volwasse of seksueel eksplisiete inhoud
- Verseker hoë kwaliteit aantekeninge met 'n minimum van 90% akkuraatheid.
Oplossing
- Web het 30,000 XNUMX dokumente elk vir Spaans en Engels van BFSI, Gesondheidsorg, Vervaardiging, Kleinhandel geskrap. Die inhoud is verder verdeel in kort, medium en lang dokumente
- Die suksesvolle etikettering van die inhoud as giftige, volwasse of seksueel eksplisiete inhoud geklassifiseer
- Om 90% gehalte te behaal, het Shaip 'n tweevlak-gehaltebeheerproses geïmplementeer:
» Vlak 1: Gehalteversekeringskontrole: 100% van die lêers moet bekragtig word.
» Vlak 2: Kritieke Kwaliteit Analise Kontrole: Shaips se CQA-span om 15%-20% van die retrospektiewe monsters te assesseer.
Gevolg
Die opleidingsdata het gehelp met die bou van outomatiese inhoudmoderering ML-model wat verskeie uitkomste kan lewer wat voordelig is vir die handhawing van 'n veiliger aanlyn omgewing. Sommige van die sleuteluitkomste sluit in:
- Doeltreffendheid om 'n groot hoeveelheid data te verwerk
- Konsekwentheid om eenvormige toepassing van modereringsbeleide te verseker
- Skaalbaarheid om aan te pas by groeiende gebruikersbasis en inhoudvolumes
- Intydse moderering kan identifiseer en
verwyder potensieel skadelike inhoud soos dit gegenereer word - Koste-effektiwiteit deur die afhanklikheid van menslike moderators te verminder
Versnel jou Conversational AI-toepassingsontwikkeling met 100%
Vertel ons hoe ons kan help met u volgende KI-inisiatief.