Spravodajstvo
AI začala hovoriť vlastným jazykom, ktorému nerozumieme. Vedci nevedia, čo sa deje. Je to predzvesť začiatku konca?
Na prvý pohľad zábavný úkaz môže mať výrazné bezpečnostné dopady.
Výskumníci, pracujúci s umelou inteligenciou častokrát sami nevedia, ako presne sa umelá inteligencia dopracovala k požadovaným výsledkom, píše portál IFL Science.
Podobný prípad nastal aj pri Umelej inteligencii, ktorá sa nazýva DALLE-2. Táto umelá inteligencia začala vytvárať svoj vlastný jazyk. Úlohou umelej inteligencie je vytváranie obrazov na základe textového vstupu, no študent počítačových vied, Giannis Daras, si všimol, že v niektorých prípadoch umelá inteligencia hovorí úplné nezmysly.
„Je známe, že má DALLE-2 problém s textom. Napríklad ak jej dáte úlohu vytvoriť obraz, na ktorom bude slovo auto, vytvorí obraz s nezrozumiteľným textom,“ vysvetľuje Daras.
Nakoniec ale vysvitlo, že text nie je až tak úplne náhodný, ako sa môže na prvý pohľad zdať, no pracuje na základe nejakej formy slovníka, ktorú nepozná nikto, len samotná umelá inteligencia. Keď vedci do textového poľa zadali nezmyselné slovo z príkladu, umelá inteligencia nakreslila auto. Prostredníctvom sociálnej siete Twitter Daras zdieľal konkrétny príklad z praxe, ktorý sa výskumníkom podarilo rozlúštiť.
Podľa všetkého slovo „Apoploe vesrreaitais“ znamená vtáky a „Contarra ccetnxniams luryca tanniounons“ znamená hmyz. Ak tieto slová spojili do vety, umelá inteligencia zakaždým generovala vtákov, ktoré pojedajú hmyz. Znamená to, že konkrétne slová nie sú len hatlaninou, no umelá inteligencia si ku nim priradila svoj vlastný význam. Hoci sa to spočiatku môže zdať ako zábavná zaujímavosť, výskumníci veria, že to výrazným spôsobom ovplyvní bezpečnosť a dôveryhodnosť umelej inteligencie.
DALLE-2 has a secret language.
"Apoploe vesrreaitais" means birds.
"Contarra ccetnxniams luryca tanniounons" means bugs or pests.The prompt: "Apoploe vesrreaitais eating Contarra ccetnxniams luryca tanniounons" gives images of birds eating bugs.
A thread (1/n)🧵 pic.twitter.com/VzWfsCFnZo
— Giannis Daras (@giannis_daras) May 31, 2022
Neprehliadnite
Nezmysel alebo počiatky vlastnej reči?
Používanie pre nás nezmyselných slov, nech už sa za nimi ukrýva akýkoľvek význam, môže pomôcť útočníkom obísť filtre, ktoré blokujú textové príkazy porušujúce podmienky používania. Daras zároveň dodáva, že „absurdné príkazy generujúce konkrétne obrazy znižujú dôveryhodnosť umelej inteligencie“.
Aj ostatné algoritmy schopné pretvárať textové príkazy na obraz, si časom vyvinuli svoje vlastné jazyky. Analytik Benjamin Hilton dal umelej inteligencii príkaz na vytvorenie obrazu, na ktorom by sa dve veľryby rozprávali o jedle, no na obraze museli byť aj „titulky“. Prvý obraz neukázal žiadne rozlúštiteľné slová, no po niekoľkých pokusoch získal Hilton obraz, na ktorom stálo „Evve Waeles“.
None of these pictures really have transcribable text, so I asked DALL-E to generate more whales until there was an image with text to copy. This is the first one DALL-E gave me.
(11/15) pic.twitter.com/6o5tb91JPx
— Benjamin Hilton (@benjamin_hilton) May 31, 2022
Následne Hilton zadal toto slovné spojenie do generátora a získal obrazy chutne vyzerajúceho dezertu, futbalistov a zvierat. Analytik sa domnieva, že slovo Waeles môže byť skomoleninou anglického slova Whales, čo znamená veľryby. Keď sa o rovnaký experiment pokúsil Daras, jeho veľryby hovorili „Wa ch zod rea“. Keď toto slovo zadal do generátora, dostal obrazy jedál.
Vedci si nie sú istí, čo sa deje a je celkom možné, že daná „reč“ nie je ničím iným, len anomáliou, ktorá nemá hlbší význam. Zároveň ale poukazujú na to, že ak do generátora zadajú spojenie „Apoploe vesrreaitais“ zakaždým umelá inteligencia vygeneruje obraz vtákov. Štúdia, v ktorej bližšie rozoberajú záhadný jazyk umelej inteligencie zatiaľ nebola recenzovaná. Je otázne, čo na tento kuriózny problém povedia iní vedci.