A webhely "sütiket" használ Részletek
teringette.hu_logo

Nálunk ügyesebben ismeri fel az ember nemét a mesterséges intelligencia

Szerző: Uzonyi Ádám
Megjelenés dátuma: 2020/07/21




A kaliforniai Salk Intézet kutatást készített, olyan neurális hálózatokról, amelyek az emberi arc alapján, az ember nemét képesek meghatározni. Bár a kutatás már régen napvilágot látott, a mesterséges intelligencia egyik fontos területe manapság is a neurális hálózatokban megjelenő előítéletek és azok csökkentése. Ezek vizsgálatához jó alapot adhat a SEXNET-ről szóló tanulmány.

A világ számos területén alkalmazunk mesterséges neurális hálózatokat problémák megoldására, megkönnyítésére. Szeretnénk számítógép segítségével eldönteni, hogy egy képen látható ember férfi vagy nő, felismerni egy növényfajt, kiválasztani egy emberhez illő foglalkozást, vagy szeretnénk emberszerű chatbotot építeni, mindegyik esetben hasznos segítség a mesterséges neurális hálózat.

A mesterséges neurális hálózat ugyanis egy tanulóhalmaz alapján feldolgoz hatalmas mennyiségű adatot és az adatelemek közötti hasonlóságok és eltérések miatt képes megtanulni egyes adat csoportokat, például: ember neve és a növény faja. Ezeket a tanulás folyamata után képes felismerni egy számára ismeretlen képről vagy adatelemről is. 

A Salk intézet munkatársai az emberi nem felismerést kutatták, így alkották meg SEXNET nevű neurális hálózatukat. Az állatok esetében biológiai jelentősége van a nem felismerésének. Amíg az ember főleg a szemére hagyatkozik a kérdésben, sok állat feromonok segítségével tájékozódik a közelében lévő egyed neméről. A feromon olyan kémiai vegyület, aminek elsődleges szerepe van a kommunikációban. Az állatok a területüket ezzel jelölik meg, társaikat ennek segítségével ismerik fel és a nemi érdeklődés jelzésében is fontos szerepe van.

Felvetődik a kérdés, hogy az ember, aki főleg a látására hagyatkozik a nem felismerés kérdésében, hogyan tájékozódik.

Vajon milyen módon döntjük el, hogy a velünk szembejövő járókelő férfi vagy nő?

A tudomány jelen állása erre algoritmust nem ismer, úgy hisszük, hogy prototípusos mintafelismerést alkalmazunk. Sok nőt és sok férfit látunk életünkben és már gyerekkorunkban megtanuljuk a két kategóriának a fogalmát és a mintákat  – legtöbb esetben sikeresen  – fel is ismerjük.

Az emberek tudnak következtetni társaik nemére az arcuk alapján, azonban a gépek erre nem képesek. Vagy fogalmazzunk inkább úgy, hogy a gépek erre nem képesek, addig amíg meg nem tanítjuk őket rá. 

A recept egyszerű. Kell egy adathalmaz, amely emberi arcokat tartalmaz és az adott ember nemét is el kell tároljuk. A tanulóhalmaz  – a képek és a nemeket tartalmazó címkék segítségével taníthatjuk a neurális hálónkat arra, melyik a férfi és melyik a női arc.

Erre egy úgynevezett fully-connected neurális hálót használunk, és a tanítás során keletkező hibákat visszavezetjük a rendszerbe, hogy korrigálni tudja a döntéshozásnak a mechanizmusát a hálózatunk, és ezzel fejleszti, tanítja önmagát a program. 

Olyan hatékonyan képes a program a nemek megtanulására az adatok jelentősebb előfeldolgozása, és a programunk optimalizálása előtt is, hogy az emberéhez hasonló pontossággal képes a nem felismerésére az arcok alapján, ami nagyjából 10%-os hibaarányt jelent.

Miből ítél az ember és miből a gép? 

Hasonlóan képes a mesterséges neurális hálózat tanulni, mint a mi agyunk. Nem csoda, hiszen a természetes neurális hálózatnak, az állati idegrendszernek a mintájára jött létre. Ha az ember hoz döntést egy másik személy neméről, olyan tulajdonságokat is figyelembe vesz, mint a testékszerek, a smink , a fizikai felépítés, továbbá fontos a másik ember hangja és viselkedése is. Az emberi arcképekből és a nemet tartalmazó címkékből tanuló neurális háló, értelemszerűen a hangra és a viselkedésre utaló információkat nem használ fel, azonban a testfelépítés, az öltözködés, az ékszerek és a smink is releváns attribútum a számítógépnek. A SEXNET hálózat betanításához 90 darab fiatal felnőtt arcról készült fotót használtak a kutatók. Odafigyeltek arra, hogy az arcon kívül semmilyen zavaró vagy megtévesztő részlet ne látszódjon az emberből, így nyaktól lefelé mindenki testét fehér lepedővel takarták el, hogy ne az öltözködésből vagy a testfelépítésből ítéljen a program, hanem kizárólag a személy arcából. 

Így a neurális hálózat átlag hibarátáját 8.1%-re sikerült csökkenteni, míg az emberé 11.6% volt. Olyan is előfordult, hogy rájött a program, hogy a tanítására használt adathalmazban az egyik kép rosszul van címkézve és férfiként tárolták el az egyébként női alany fotóját.

Fontos kérdés a mesterséges intelligenciával rendelkező programok esetében, hogy szükségük van-e memóriára. Van, hogy a program hatékonyságát növeli a memória alkalmazása, azonban ebben az esetben nincsen rá szükségünk. Tekintve, hogy a  mesterséges neurális hálózatok, az emberi észlelés és tanulás analógiájára készültek, itt is kiindulhatunk az emberi természetből. 

Létezik egy betegség a prosopagnosia, ami abban nyilvánul meg, hogy az ismerős arcokat képtelenek vagyunk felismerni. Tekintve, hogy a prosopagnosiás ember is képes a nem felismerésére, így a prototípusos mintafelismerés ellenére, nem kell memóriát alkalmaznunk a neurális hálózat megalkotásához, hiszen az ember beazonosításától, felismerésétől független a nem felismerése.

Bár önmagában nagyon sok felhasználási lehetőség nincsen ebben a nem felismerő programban, mégis számos tudományterületen nyerhetünk hasznos információt a segítségével és a továbbfejlesztésével. Például nem tudjuk, hogy a rézuszmajmoknál különbözőek-e a nőstény és a hím egyedek arcai. Ha hálózatunkat nem emberi arcokkal, hanem rézuszmajmok arcaival tanítjuk, akkor egy fontos etimológiai kérdést válaszolhatunk meg. Megtudhatjuk, hogy a majmok felismerik-e az fajuk egyedeinek nemét, illetve a neurális hálózat hibaarányából a két nem képviselőinek arca eltéréseiről és különbözőségének mértékéről is információt kaphatunk.