AI prekonala ľudí vo viacerých oblastiach života, v tejto však máme stále navrch. Aspoň zatiaľ
Ľudia výrazne prekonávajú umelú inteligenciu v chápaní sociálnych scén, ukazuje výskum z Johns Hopkins. AI stále nedokáže spoľahlivo interpretovať medziľudské interakcie v reálnom svete.
Výskum z Univerzity Johns Hopkins ukazuje, že ľudia sú výrazne lepší ako súčasné AI modely v chápaní sociálnych interakcií v pohyblivých scénach. Ide o kľúčovú schopnosť pre technológie ako sú samojazdiace autá, asistívne roboty či iné zariadenia, ktoré musia fungovať v reálnom svete v kontakte s ľuďmi.
Štúdia vedená Leylou Isik, odborníčkou na kognitívne vedy, odhalila, že umelá inteligencia nedokáže spoľahlivo identifikovať a interpretovať sociálne dynamiky. Medzi ne patrí například to, či sa dvaja ľudia rozprávajú alebo sa chystajú prejsť cez cestu. Tento nedostatok je obzvlášť závažný, pretože pre bezpečnú interakciu s ľuďmi musia systémy umelej inteligencie rozumieť ľudským zámerom, emóciám a kontextu.
Testovanie prebiehalo tak, že ľudskí účastníci pozerali trojsekundové videá a hodnotili správanie ľudí podľa rôznych kritérií. Tieto videá zobrazovali buď vzájomné interakcie, paralelné aktivity alebo samostatné činnosti osôb. Následne vedci zadali tú istú úlohu viac ako 350 rôznym AI modelom. Medzi nimi boli jazykové, obrazové a video modely. Ich úlohou bolo predpovedať, ako by ľudia tieto scény vnímali a ako by na ne reagoval ľudský mozog.
Umelá inteligencia zlyháva ukazujú štúdie
Výsledky boli jasné. Ľudia sa vo svojich hodnoteniach vo veľkej miere zhodli. AI modely však vôbec nie. Video modely mali problémy so správnym popisom a identifikáciou činností vo videách. Obrazové modely, ktoré dostali na analýzu sekvenciu statických záberov, často nedokázali rozpoznať, či ľudia medzi komunikujú. Ukazuje sa, že tieto modely majú veľké problémy v pochopení interakcií. Jazykové modely síce dosahovali lepšie výsledky pri predikcii ľudského správania, ale stále to nestačilo. Paradoxne, práve video modely sa viac priblížili k predikcii mozgovej aktivity v porovnaní s jazykovými modelmi. V celkovom hodnotení všetky typy AI zaostali za ľuďmi.
Podľa výskumníkov tento problém vychádza z architektúry dnešných neurónových sietí. Väčšina z nich je inšpirovaná časťou mozgu, ktorá spracováva statické obrázky. Avšak rozpoznávanie sociálnych scén vyžaduje spracovanie dynamiky, čo je úloha inej časti mozgu. Teda už samotný základ AI môže byť nastavený nesprávnym smerom pre porozumenie reálnemu svetu.
Neprehliadni
Výskum tak poukazuje na zásadný nedostatok súčasných AI systémov, kým sa dokážu orientovať v statických obrazoch, na pochopenie reálnych, živých scén im chýba kontext, intuícia a schopnosť čítať medzi riadkami. Niečo, čo ľudský mozog robí prirodzene.
Autori štúdie preto zdôrazňujú, že ak chceme vytvárať AI, ktoré budú schopné bezpečne a efektívne fungovať v spoločnosti, musíme sa posunúť ďalej ako len k rozpoznávaniu objektov a zdá sa, že je to ešte ďaleká cesta. Budúcnosť AI závisí od schopnosti pochopiť príbeh, ktorý sa odohráva v scéne. Ten často stojí práve na medziľudských vzťahoch a neverbálnych signáloch, ktoré sú pre stroj zatiaľ „neviditeľné“.
Komentáre