Táto AI práve prekonala Turingov test. Bola dokonca častejšie označená za človeka než reálny človek
Jedna z najpokročilejších umelej inteligencií zmiatla ľudí natoľko, že ju považovali za človeka častejšie než reálneho človeka.
Dokáže umelá inteligencia rozmýšľať ako človek? Doposiaľ sme žili v presvedčení, že AI má od ľudského myslenia ešte ďaleko.
Umelá inteligencia zatiaľ nebola schopná prejsť Turingovým testom. Ide o experiment navrhnutý britským matematikom a informatikom Alanom Turingom v roku 1950, ktorého cieľom je posúdiť, či stroj dokáže myslieť ako človek. Zaujímavosťou však je, že pôvodne šlo skôr o myšlienkový experiment než praktický test, no dnes sa často používa ako symbolická hranica medzi „ľudskou“ a „neľudskou“ inteligenciou.
Turingov test skúma, či umelá inteligencia dokáže napodobniť ľudské myslenie natoľko, že ju človek nerozozná od skutočného človeka. V teste sa súdiaci rozpráva cez text s dvoma partnermi, jedným je iný človek, druhým je, ako už asi tušíš, stroj, pričom má určiť, kto je kto. Ak nedokáže spoľahlivo rozoznať stroj od človeka, AI test úspešne zvládla. Tento test sa považuje za symbolickú hranicu schopnosti stroja „myslieť“ ľudským spôsobom.
Ako sme už spomenuli vyššie, zdalo sa, že AI zatiaľ týmto testom prejsť nedokáže. Zdá sa však, že to už neplatí, upozorňuje server futurism.com.
Model GPT-4.5 zvládol Turingov test
Veľký jazykový model GPT-4.5 tento test najnovšie zvládol. GPT-4.5 od OpenAI bol v Turingovom teste označený ako človek v 73 % prípadov, keď sa predstavil ako určitá „persona“. To výrazne prevyšuje náhodnú úspešnosť 50 %. Samotný experiment prebiehal v trojstrannej forme, kde účastníci súčasne komunikovali s človekom aj s AI a mali určiť, kto je kto.
Neprehliadni
Paradoxom je, že GPT-4.5 bol označený ako človek častejšie než skutočný človek, čo naznačuje, že modely ako GPT-4.5 a LLaMa dokážu veľmi efektívne napodobniť ľudskú komunikáciu.
„Ľudia nerozoznávali GPT-4.5 a LLaMu (keď mali zadanú personu) od skutočných ľudí lepšie než náhodne,“ napísal hlavný autor štúdie Cameron Jones, výskumník z Laboratória jazyka a poznávania na Kalifornskej univerzite v San Diegu, v príspevku na sieti X. „A GPT-4.5 bol dokonca častejšie označený za človeka ako skutoční ľudia!“
Okrem GPT-4.5 boli testované aj GPT-4o od OpenAI, LLaMa 3.1-405B od Metay a historický chatbot ELIZA, ktorý bol vyvinutý pred približne osemdesiatimi rokmi.
Treba však poznamenať, že Turingov test nezisťuje, či AI „skutočne chápe“ to, čo hovorí, ale len to, či sa správa ako človek. Preto ho viacerí odborníci označujú skôr za test schopnosti AI napodobňovať ľudí.
Podľa Camerona Jonesa tieto výsledky neznamenajú, že LLM modely sú inteligentné ako ľudia, ale ide o jeden z mnohých dôkazov ich schopnosti imitovať ľudské správanie.
Does this mean LLMs are intelligent? I think that’s a very complicated question that’s hard to address in a paper (or a tweet). But broadly I think this should be evaluated as one among many other pieces of evidence for the kind of intelligence LLMs display.
— Cameron Jones (@camrobjones) April 1, 2025
„Znamená to, že veľké jazykové modely sú inteligentné? Myslím si, že to je veľmi zložitá otázka, na ktorú je ťažké odpovedať v článku (alebo v tweete). Vo všeobecnosti si však myslím, že by sa to malo posudzovať ako jeden z mnohých dôkazov o tom, aký druh inteligencie LLM modely prejavujú.“, hovorí Cameron Jones.
Komentáre