Programavimas

Kas yra veido atpažinimas? Didelio brolio dirbtinis intelektas

Ar didelis brolis gali atpažinti jūsų veidą stebėdamas gatvės lygio vaizdo stebėjimo sistemą ir pasakyti, ar esate laimingas, ar liūdnas, ar piktas? Ar dėl to asmens tapatybės gali būti areštuotas neįvykdytas orderis? Koks yra tikimybė, kad identifikacija yra neteisinga ir tikrai susijusi su kuo nors kitu? Ar galite visiškai nugalėti stebėjimą naudodamas kokį nors triuką?

Iš kitos pusės, ar galite patekti į saugyklą, apsaugotą fotoaparatu ir veido atpažinimo programine įranga, laikydami įgalioto asmens veido atspaudą? Ką daryti, jei uždėsite įgaliotojo asmens 3D 3D kaukę?

Sveiki atvykę į veido atpažinimą ir veido atpažinimo sukčiavimą.

Kas yra veido atpažinimas?

Veido atpažinimas yra metodas, skirtas atpažinti nežinomą asmenį arba patvirtinti konkretaus asmens tapatybę iš jo veido. Tai yra kompiuterio matymo šaka, tačiau veido atpažinimas yra specializuotas ir tam tikroms programoms skirtas socialinis bagažas, taip pat kai kurie apgavystės pažeidimai.

Kaip veikia veido atpažinimas?

Ankstyvojo veido atpažinimo algoritmai (kurie šiandien vis dar naudojami patobulinta ir automatizuota forma) remiasi biometrija (pvz., Atstumu tarp akių), kad išmatuoti veido bruožai iš dviejų matmenų vaizdo paverstų skaičių rinkiniu (funkcija vektorius ar šablonas), kuris apibūdina veidą. Tada atpažinimo procese šie vektoriai lyginami su žinomų veidų duomenų baze, kurie taip pat buvo susieti su funkcijomis. Viena šio proceso komplikacijų yra veidų pritaikymas normalizuotam vaizdui, kad būtų atsižvelgta į galvos pasisukimą ir pasvirimą prieš išskleidžiant metriką. Ši algoritmų klasė vadinama geometrinis.

Kitas būdas atpažinti veidą yra normalizuoti ir suspausti 2-D veido atvaizdus ir palyginti juos su panašiai normalizuotų ir suglaudintų vaizdų duomenų baze. Ši algoritmų klasė vadinama fotometrinis.

Trimatis veido atpažinimas naudoja 3D daviklius, kad užfiksuotų veido vaizdą, arba rekonstruoja 3D vaizdą iš trijų 2-D sekimo kamerų, nukreiptų skirtingais kampais. 3D veido atpažinimas gali būti žymiai tikslesnis nei 2-D atpažinimas.

Odos tekstūros analizė žymi žmogaus veido linijas, raštus ir dėmes į kitą požymių vektorių. Pridėjus odos tekstūros analizę prie 2-D ar 3-D veido atpažinimo, atpažinimo tikslumas gali padidėti 20–25 procentais, ypač panašaus išvaizdos ir dvynių atveju. Taip pat galite sujungti visus metodus ir įtraukti į kelių spektrų vaizdus (matoma šviesa ir infraraudonieji spinduliai), kad būtų dar tiksliau.

Nuo šios srities pradžios 1964 m. Veido atpažinimas kasmet gerėjo. Vidutiniškai klaidų lygis kas dvejus metus sumažėjo perpus.

Susijęs vaizdo įrašas: Kaip veikia veido atpažinimas

Veido atpažinimo pardavėjo testai

NIST, JAV nacionalinis standartų ir technologijos institutas, nuo 2000 m. Atlieka veido atpažinimo algoritmų „Veido atpažinimo tiekėjo testas“ (FRVT) testus. Naudojami vaizdo duomenų rinkiniai dažniausiai yra teisėsaugos puodeliai, bet taip pat apima laukiniai nejudantys vaizdai, tokie kaip rasti „Wikimedia“, ir mažos raiškos vaizdai iš internetinių kamerų.

FRVT algoritmus dažniausiai pateikia komerciniai pardavėjai. Palyginimai per metus rodo didelį rezultatų ir tikslumo laimėjimą; pardavėjų teigimu, tai visų pirma yra dėl gilių konvoliucinių neuroninių tinklų naudojimo.

Susijusiose NIST veido atpažinimo testavimo programose buvo tiriami demografiniai efektai, veido morfijos nustatymas, socialiniuose tinkluose paskelbtų veidų atpažinimas ir veidų atpažinimas vaizdo įraše. Ankstesnė bandymų serija buvo atlikta 1990-aisiais, naudojant kitą moniką „Veido atpažinimo technologija“ (FERET).

NIST

Veido atpažinimo programos

Veido atpažinimo programos dažniausiai skirstomos į tris pagrindines kategorijas: saugumas, sveikata ir rinkodara / mažmeninė prekyba. Saugumas apima teisėsaugą, o ta veido atpažinimo klasė gali būti tokia pat gerybiška, kaip žmonių suderinimas su jų paso nuotraukomis greičiau ir tiksliau, nei tai gali padaryti žmonės, ir taip pat šiurpi, kaip „dominančio asmens“ scenarijus, kai žmonės yra stebimi per vaizdo stebėjimo sistemą. į sugretintas nuotraukų duomenų bazes. Ne teisėsaugos saugumas apima tokias įprastas programas kaip mobiliųjų telefonų atrakinimas pagal veidą ir laboratorijų bei saugyklų prieigos kontrolė.

Veido atpažinimo taikymas sveikatos srityje apima pacientų patikrinimus, emocijų aptikimą realiuoju laiku, pacientų stebėjimą įstaigoje, neverbalinių pacientų skausmo lygio vertinimą, tam tikrų ligų ir sąlygų nustatymą, personalo identifikavimą ir įstaigos saugumą. Rinkodaros ir mažmeninės veido atpažinimo programos apima lojalumo programos narių identifikavimą, žinomų parduotuvių vagystės identifikavimą ir sekimą, žmonių ir jų emocijų atpažinimą pagal tikslinius produktų pasiūlymus.

Veido atpažinimo ginčai, šališkumas ir draudimai

Jei teigtume, kad kai kurios iš šių programų yra prieštaringos, būtų neįvertinta. Kaip aptarta 2019 m. „New York Times“ straipsnyje, veido atpažinimą sukėlė ginčai, pradedant jo naudojimu stadiono stebėjimu ir baigiant rasistine programine įranga.

Arenos stebėjimas? Veido atpažinimas buvo naudojamas 2001 m. „Super Bowl“: programinė įranga nustatė 19 žmonių, kurie, kaip manoma, yra neįvykdytų orderių objektai, nors nė vienas nebuvo areštuotas (ne dėl bandymo trūkumo).

Rasistinė programinė įranga? Buvo kelios problemos, pradedant 2009 m. Veido sekimo programine įranga, kuria galima stebėti baltus, bet ne juodaodžius, ir tęsiant 2015 m. MIT tyrimą, kuris parodė, kad to meto veido atpažinimo programinė įranga baltų vyrų veiduose veikė daug geriau nei moterų ir (arba) Juodi veidai.

Dėl tokių problemų buvo visiškai uždrausta veido atpažinimo programinė įranga tam tikrose vietose arba tam tikroms reikmėms. 2019 m. San Franciskas tapo pirmuoju dideliu Amerikos miestu, užblokavusiu policijos ir kitų teisėsaugos institucijų naudojimąsi veido atpažinimo programine įranga; „Microsoft“ paragino nustatyti federalines veido atpažinimo taisykles; ir MIT parodė, kad „Amazon Rekognition“ turėjo daugiau problemų nustatyti moters lytį nei vyriškos lyties pagal veido atvaizdus, ​​taip pat daugiau problemų dėl juodos moteriškos lyties nei baltos moters lyties.

2020 m. Birželio mėn. „Microsoft“ paskelbė, kad neparduos ir nepardavė savo veido atpažinimo programinės įrangos policijai; „Amazon“ metams uždraudė policijai naudotis „Rekognition“; o IBM atsisakė veido atpažinimo technologijos. Vis dėlto uždrausti veido atpažinimą nebus lengva, atsižvelgiant į tai, kad jis plačiai pritaikomas „iPhone“ („Face ID“) ir kituose įrenginiuose, programinėje įrangoje ir technologijose.

Ne visa veido atpažinimo programinė įranga kenčia nuo tų pačių šališkumų. 2019 m. NIST demografinių efektų tyrimas tęsė MIT darbą ir parodė, kad algoritminis demografinis šališkumas labai skiriasi veido atpažinimo programinės įrangos kūrėjams. Taip, veido atpažinimo algoritmų klaidingas atitikties rodiklis ir klaidingas neatitikimo rodiklis turi demografinį poveikį, tačiau jie gali skirtis keliais dydžiais nuo kiekvieno tiekėjo, o laikui bėgant jie mažėjo.

Įsilaužimo veido atpažinimas ir kovos su klastojimu metodai

Atsižvelgiant į galimą privatumo grėsmę, atsirandančią dėl veido atpažinimo, ir patrauklumą gauti prieigą prie didelės vertės išteklių, apsaugotų veido autentifikavimu, buvo dedama daug pastangų nulaužti ar suklastoti technologiją. Norėdami perduoti autentifikavimą, galite pateikti atspausdintą veido vaizdą vietoj gyvo veido, vaizdą ekrane arba 3D spausdintą kaukę. Norėdami stebėti vaizdo stebėjimą, galite atkurti vaizdo įrašą. Kad išvengtumėte priežiūros, galite išbandyti „CV Dazzle“ audinius ir makiažą ir (arba) infraraudonųjų spindulių šviesą skleidžiančias medžiagas, kad suklaidintumėte programinę įrangą neaptikdami jūsų veido.

Žinoma, stengiamasi sukurti visų šių atakų kovos su klastojimu metodus. Norėdami aptikti atspausdintus vaizdus, ​​pardavėjai naudoja gyvumo testą, pavyzdžiui, laukia, kol objektas mirksi, arba atlieka judesio analizę, arba naudoja infraraudonųjų spindulių ryšį, kad atskirtų gyvą veidą nuo atspausdinto vaizdo. Kitas būdas yra atlikti mikrotekstūros analizę, nes žmogaus oda optiškai skiriasi nuo spaudinių ir kaukių medžiagų. Naujausios kovos su klastojimu technikos dažniausiai grindžiamos giliais konvoliuciniais neuroniniais tinklais.

Tai yra besivystanti sritis. Vyksta ginklų karas tarp užpuolikų ir kovos su šnipinėjimu programinės įrangos, taip pat vykdomi akademiniai įvairių atakų ir gynybos metodų efektyvumo tyrimai.

Veido atpažinimo pardavėjai

Pasak „Electronic Frontier Foundation“, „Idemia“ dukterinė įmonė „MorphoTrust“ (anksčiau žinoma kaip „OT-Morpho“ arba „Safran“) yra viena didžiausių veido atpažinimo ir kitų biometrinių identifikavimo technologijų pardavėjų JAV. Jis sukūrė sistemas valstybinėms DMV, federalinėms ir valstijų teisėsaugos agentūroms, pasienio kontrolei ir oro uostams (įskaitant TSA PreCheck) ir valstybės departamentui. Kiti įprasti pardavėjai yra „3M“, „Cognitec“, „DataWorks Plus“, „Dynamic Imaging Systems“, „FaceFirst“ ir „NEC Global“.

„NIST“ veido atpažinimo paslaugų teikėjo teste pateikiami daugelio kitų tiekėjų iš viso pasaulio algoritmai. Taip pat yra keletas skirtingos kokybės atvirojo kodo veido atpažinimo algoritmų ir kelios pagrindinės debesų paslaugos, siūlančios veido atpažinimą.

„Amazon Rekognition“ yra vaizdo ir vaizdo analizės paslauga, galinti identifikuoti objektus, žmones, tekstą, scenas ir veiklą, įskaitant veido analizę ir pasirinktines etiketes. „Google Cloud Vision“ API yra iš anksto parengta vaizdų analizės paslauga, galinti aptikti objektus ir veidus, skaityti atspausdintą ir ranka rašytą tekstą ir kaupti metaduomenis į jūsų vaizdų katalogą. „Google AutoML Vision“ leidžia mokyti pasirinktinius vaizdų modelius.

„Azure Face“ API atlieka veido aptikimą, kuris suvokia veidus ir atributus vaizde, atlieka asmens identifikavimą, kuris atitinka asmenį jūsų privačioje saugykloje, kurioje yra iki 1 milijono žmonių, ir atlieka suvokiamą emocijų atpažinimą. „Face API“ gali veikti debesyse arba kraštuose konteineriuose.

Veido duomenų rinkiniai atpažinimo mokymams

Yra dešimtys atsisiųstų veido duomenų rinkinių, kuriuos galima naudoti atpažinimo mokymams. Ne visi veido duomenų rinkiniai yra vienodi: jie paprastai skiriasi pagal vaizdo dydį, atstovaujamų žmonių skaičių, vienam asmeniui skirtų vaizdų skaičių, vaizdų sąlygas ir apšvietimą. Teisėsauga taip pat turi prieigą prie neviešų veido duomenų rinkinių, tokių kaip dabartiniai puodeliai ir vairuotojo pažymėjimo atvaizdai.

Kai kurios didesnės veidų duomenų bazės yra „Labeled Faces in the Wild“, kuriose yra apie 13 000 unikalių žmonių; FERET, naudojamas ankstyviesiems NIST testams; „Mugshot“ duomenų bazė, naudojama vykstančiame NIST FRVT; stebėjimo kamerų duomenų bazę „SCFace“, taip pat prieinamą su veido orientyrais; ir paženklinti „Wikipedia Faces“ su ~ 1,5 tūkst. unikalių tapatybių. Keliose iš šių duomenų bazių yra keli atvaizdai vienoje tapatybėje. Šiame tyrinėtojo Ethano Meyerso sąraše pateikiama rimtų patarimų, kaip pasirinkti veido duomenų rinkinį konkrečiam tikslui.

Apibendrinant galima pasakyti, kad veido atpažinimas gerėja ir pardavėjai mokosi aptikti daugumą klastotės, tačiau kai kurios šios technologijos programos yra prieštaringos. Pasak NIST, veido atpažinimo klaidų lygis kas dvejus metus mažėja perpus. Pardavėjai patobulino kovos su klastojimu metodus, įtraukdami konvoliucinius neuroninius tinklus.

Tuo tarpu yra iniciatyvų uždrausti veidų atpažinimą naudoti stebint, ypač policijos. Vis dėlto uždrausti veido atpažinimą būtų sunku, atsižvelgiant į tai, kaip jis plačiai paplito.

Skaitykite daugiau apie mašininį mokymąsi ir gilųjį mokymąsi:

  • Gilus mokymasis ir mašininis mokymasis: supraskite skirtumus
  • Kas yra mašininis mokymasis? Intelektas, gautas iš duomenų
  • Kas yra gilus mokymasis? Algoritmai, imituojantys žmogaus smegenis
  • Mašininio mokymosi algoritmai paaiškinti
  • Automatinis mašininis mokymasis arba „AutoML“ paaiškinimas
  • Paaiškintas vadovaujamas mokymasis
  • Pusiau prižiūrimas mokymasis paaiškintas
  • Neprižiūrimas mokymasis paaiškintas
  • Išaiškintas mokymasis apie sustiprinimą
  • Kas yra kompiuterio matymas? AI vaizdams ir vaizdo įrašams
  • Kas yra veido atpažinimas? Didelio brolio dirbtinis intelektas
  • Kas yra natūralios kalbos apdorojimas? AI kalbai ir tekstui
  • Kaggle: Kur duomenų mokslininkai mokosi ir varžosi
  • Kas yra CUDA? Lygiagretus GPU apdorojimas