'n Gevallestudie oor gesigsherkenningsmodel
Anti-spoofing-videodatastel vir bedrogopsporing-KI-modelle
Ontdek hoe Shaip 25,000 XNUMX hoë-gehalte anti-spoofing-videodatastelle gelewer het met werklike en herspeel-aanvalscenario's om KI-modelle op te lei vir bedrogopsporing.
projek Oorsig
Shaip het 'n vennootskap aangegaan met 'n toonaangewende KI-sekuriteitsmaatskappy om 'n hoëgehalte, van die rak af teen-spoofing-videodatastel te verskaf wat ontwerp is om KI-modelopleiding vir bedrogopsporing te verbeter. Die datastel het 25,000 XNUMX video's ingesluit wat beide werklike en herspeel-aanvalscenario's vaslê, wat robuuste opleidingsdata vir anti-spoofing-modelle verseker.
Elkeen van die 12,500 deelnemers het twee video's bygedra—een regte en een herhalingsaanval—opgeneem by 720p of hoër resolusie met 'n raamkoers van 26 FPS en hoër.
Die projek se doel was om te lewer outentieke en diverse datastelle wat KI-modelle in staat sal stel om effektief te onderskei tussen werklike en bedrieglike biometriese video's, en sodoende bedrogrisiko's in biometriese verifikasiestelsels verminder.

Sleutelstatistieke
25,000 totale video's (12,500 regte video's, 12,500 speel aanvalvideo's weer)
12,500 unieke
deelnemers
5 etnisiteitsgroepe
verteenwoordig in die datastel
Gefaseerde aflewering: 4 bondels van 6,250 video's elk
Metadata-kenmerke: 12 sleutelparameters vir verbeterde datastel bruikbaarheid
Anti-spoofing biometriese datastel Omvang
Datastel samestelling: Die projek het gefokus op die lewering van hoë gehalte anti-spoofing video datastelle bestaande uit regte en herspeel aanvalvideo's. Sleutel aspekte sluit in:
- 12,500 deelnemers bydra twee video's elk (1 eg, 1 bedrieglik).
- Diversiteit in opname toestelle om modelaanpasbaarheid te verbeter.
- Gebalanseerde etniese verteenwoordiging om datastelinklusiwiteit te verseker.
Metadataversameling: Elke video is vergesel van 12 metadata-kenmerke om datastel bruikbaarheid te verbeter.
Uitdagings vir videodata-insameling
Handhawing van gebalanseerde etnisiteitsgewyse dataverspreiding terwyl video's van hoë gehalte verkry word.
Verseker dat elke deelnemer een werklike en een herhalingsaanvalvideo bydra om datastelintegriteit te handhaaf.
Voldoening aan streng riglyne vir FPS (≥ 26), resolusie (≥ 720p), en tydstempel akkuraatheid (+/- 0.5ms).
Hoe ons dit opgelos het
Shaip het 'n gestruktureerde datastel van hoë gehalte verskaf om aan die projek se vereistes te voldoen. Die oplossing het ingesluit:
Datastelkurasie en kwaliteitbeheer
- 25,000 videos dwarsoor versamel 4 fases om 'n bestendige en gestruktureerde datavloei te verseker en knelpunte te vermy.
- Streng valideringsproses om nakoming te verseker FPS, resolusie en metadata akkuraatheid. Elke video het verskeie kwaliteitkontroles ondergaan voor finale aanvaarding.
- Omvattende metadata-tagging met 12 eienskappe:
- Lêer ID/naam
- Tipe aanval (Real/Replay)
- Persoon ID
- Video Resolution
- Video Tydsduur
- Etnisiteit van die onderwerp
- Geslag van die onderwerp
- Of video oorspronklik of vervals is
- Toestelnaam/model
- Persoon wat praat of nie
- Tydstempel Begin Tyd
- Tydstempel Eindtyd
- Gebalanseerde etniese groepverspreiding: Die datastel is noukeurig saamgestel om 'n gebalanseerde etniese verteenwoordiging te handhaaf. Die verspreiding sluit Spaanse (33%), Suid-Asiatiese (21%), Kaukasiese (20%), Afrika- (15%) en Oos-Asiatiese en Midde-Oosterse bevolkings in (elkeen bestaan uit tot 6%).
- Geen duplikaatinskrywings nie om datastel uniekheid te handhaaf en vooroordele in KI-opleiding te voorkom.
- Etnies diverse deelnemer seleksie om 'n datastel te skep wat werklike gebruikersvariasies weerspieël, wat KI-modelaanpasbaarheid en regverdigheid verbeter.
- Opname toestelvariasie het verskeie slimfoonmodelle, kameras en beligtingstoestande ingesluit om die model se robuustheid teen verskillende omgewingsinstellings te verbeter.
Uitkoms
Die hoë-gehalte, diverse anti-spoofing-videodatastel wat deur Shaip verskaf is, het die kliënt in staat gestel om KI-modelle op te lei om akkuraat te onderskei tussen regte en bedrieglike video's in verskeie biometriese verifikasie-scenario's. Die datastel het bygedra tot:
Verbeterde KI-prestasie in die opsporing van bedrieglike biometriese aanvalle.
Versterk die model se vermoë om herhalingsaanvalle oor verskillende etnisiteite, toestelle en omgewingstoestande te herken.
Die datastel dien as 'n grondslag vir toekomstige anti-spoofing-modelverbeterings en -uitbreidings.
Shaip se datastel was instrumenteel in die verbetering van ons KI-gedrewe anti-spoofing-modelle. Die diversiteit, kwaliteit en gestruktureerde metadata het 'n sterk grondslag verskaf vir die verbetering van bedrogopsporing in biometriese verifikasiestelsels.