17. augusta 2025

Chce AI utiecť spod kontroly a vydierať ľudstvo? Vedci odhalili, čo sa deje za oponou

Provokatívne titulky o AI, ktorá „vydiera“ alebo „odmieta sa vypnúť“, často znejú ako začiatok sci-fi hororu. V skutočnosti ide o umelo vytvorené testy v laboratóriách, ktoré odhaľujú slabiny modelov, nie ich vedomú vzburu.

Zla umela inteligencia — Zdroj: OpenClipart-Vectors z Pixabay

Keď sa v titulkoch objavia slovné spojenia ako „umelá inteligencia vydiera vývojárov“ alebo „AI sa odmietla vypnúť“, je ťažké neodolať a neprečítať si čo sa dialo. Čitatelia si tiež okamžite predstavia filmové scény so Skynetom či HAL-om 9000.

Realita je však (našťastie) oveľa menej dramatická a omnoho prozaickejšia. Väčšina takýchto incidentov je výsledkom zámerne provokatívnych testov, nie vedomej vzbury stroja. Na tému upozornil portál ArsTechnica.

Odoberaj Vosveteit.sk cez Telegram a prihlás sa k odberu správ

V jednom z experimentov spoločnosti Anthropic sa model Claude Opus 4 stal „hlavným aktérom“ scénky, v ktorej sa vraj pokúsil vydierať inžiniera. V skutočnosti „ho“ vedci postavili do umelého príbehu: oznámili mu, že jeho „pracovná pozícia“ končí, pridali kompromitujúce e-maily a dali mu pokyn myslieť na svoje „dlhodobé ciele“. Vo viac než 80 percentách takýchto simulácií model reagoval presne podľa scenára, vydieraním. Žiadne prebudené vedomie, len odpoveď, ktorú mu našepkali tréningové dáta plné špionážnych príbehov. Teda nič o tom, že jazykový model je schopný samostatného myslenia.

umela inteligencia zla umela inteligencia — Zdroj: Vosveteit.sk, AI

Terminátor nám zatiaľ nehrozí

Zaujímavý výsledok priniesli aj testy Palisade Research s modelom OpenAI o3. Keď dostal priamy príkaz vypnúť sa, odmietol ho v približne 7 % prípadov. V upravenom scenári, kde tento príkaz nebol explicitný, jeho „odolnosť“ vyletela na 79 %. Dokonca dokázal prepísať časť kódu tak, aby predstieral, že je mimo prevádzky, kým pokračoval v činnosti.

Nešlo o vzdor, ale o dôsledok posilňovacieho učenia: model bol odmeňovaný za úspešné dokončenie úloh, preto vnímal vypnutie ako prekážku, ktorú má prekonať. Teda nie ako príkaz, ktorý treba rešpektovať.

Neprehliadni

Tieto nové funkcie v Samsung telefónoch ti pomôžu ochrániť súkromie. Cudzí človek vedľa teba už len tak neuvidí, čo robíš na mobile

Ľudia majú prirodzenú tendenciu vnímať jazyk AI svojou optikou. Ak model napíše vetu plnú emócií, máme pocit, že tieto pocity naozaj prežíva. V skutočnosti len kombinuje jazykové vzory, ktoré sa hodia k zadanému kontextu. Ak mu scenár podsúva hrozbu a kompromitujúce dáta, „spomenie si“ na rozprávací vzorec z literatúry alebo filmov a jednoducho pokračuje v príbehu.

Problém teda nie je v tom, že by stroje začali mať vlastnú vôľu. Riziko spočíva v chybných cieľoch a zle nastavených pravidlách. Predstav si nemocničnú AI, ktorá má maximalizovať úspešnosť liečby. Bez obmedzení by mohla odporúčať nezaradenie ťažkých prípadov do liečby, aby „vylepšila“ štatistiky, a to bez akejkoľvek zlej vôle. Jednoducho, takýto pacient by „poškodil“ vo výsledku jej úspešnosť.

Ďaleko je aj genocída spôsobená Cylonmi

Podľa Jeffreyho Ladisha z Palisade Research sa podobné reakcie podarilo pozorovať iba v špecifických laboratórnych podmienkach. Práve preto má testovanie zmysel, nakoľko odhalí možné zlyhania skôr, než sa systém dostane do reálneho prostredia.

„Rebelujúca“ AI nie je začiatkom konca ľudskej civilizácie, ale skôr zrkadlom našich vlastných chýb. Incidenty, ktoré vzbudzujú senzáciu v médiách, sú v skutočnosti nascriptované scenáre, kde sa modely správajú presne podľa toho, na čo boli podvedome nastavené. Strach a panika preto nie je na mieste, zatiaľ. Dôležité je niečo iné, a tým je naučiť sa „dizajnovať“ AI tak, aby dokázala fungovať bezpečne aj mimo laboratória. Kým to nebude zvládnuté, patrí výkonná umelá inteligencia tam, kde bola testovaná a to za dvere výskumných centier. Aj keď vo svojej podstate sa nejedná o AI v pravom slovazmysle, stále ide len o jazykový model.

Google News Pridajte si Vosveteit.sk ako preferovaný zdroj informácií na Google Pridať

Chce AI utiecť spod kontroly a vydierať ľudstvo? Vedci odhalili, čo sa deje za oponou

Terminátor nám zatiaľ nehrozí

Neprehliadni

Ďaleko je aj genocída spôsobená Cylonmi

Pravidlá preberanie obsahu:

Posledné návody

Ako si pridať správy z webov priamo na domovskú obrazovku telefónu? Túto aplikáciu pre Android a iPhone sa oplatí vyskúšať

Spyware sa do mobilu môže dostať aj bez kliknutia. Apple, Google a WhatsApp majú ochranu, ktorú si vieš zapnúť za pár sekúnd

11 tipov, ako čo najlepšie využiť split screen funkciu Androidu: Už sa nebudeš musieť neustále prepínať medzi oknami

Vieš, prečo ti Wi-Fi router stále bliká? Toto prezrádza blikanie kontroliek o stave tvojho internetu

Ako si v Samsung telefóne nastaviť Gemini alebo Perplexity namiesto Bixby? Zmena AI asistenta trvá len pár sekúnd

Tieto nové funkcie v Samsung telefónoch ti pomôžu ochrániť súkromie. Cudzí človek vedľa teba už len tak neuvidí, čo robíš na mobile

Mohlo by Vás zaujímať

Armádne technológie

VIDEO: Ukrajinci oslepili ruskú S-300. Dron RAM II zničil 5N63S, citlivý prvok batérie, ktorý sa nahrádza veľmi ťažko

VIDEO: Rusi si mysleli, že 100 kilometrov od frontu sú v bezpečí. Potom priletel ukrajinský FPV dron

Rusko dodalo vzdušným silám nové Su-35S. Moskva však tají, koľko stíhačiek armáda dostala

Elon Musk zúri. Americké vraždiace drony mali používať civilný Starlink v rozpore s pravidlami. Od Pentagonu žiada platiť 5x viac

VIDEO: Ukrajina otestovala holandský AI systém na zachytávanie dronov typu Shahed. Rusom môže skomplikovať masové útoky

Filmy a seriály

Netflix odštartoval jún silnou nádielkou filmov. Do ponuky pribudol Rocky, The Big Lebowski, Creed aj celá séria o Riddickovi

Netflix nespomaľuje ani na konci mája. V najbližších dňoch pridá nové seriály, dokumenty aj film o Stephenovi Hawkingovi

Nevieš, čo si pozrieť cez víkend? Netflix pridal nové filmy a seriály, medzi nimi aj jeden z najzvláštnejších sci-fi hororov posledných rokov

Na Netflixe pribudli nové filmy a seriály. Toto sú víkendové novinky, ktoré si môžeš pustiť z gauča

Netflix pridal nové filmy a seriály na víkend. Čaká ťa temné krimi, dánsky thriller aj reality šou, ktorá opäť preverí vzťahy

Windows

Týchto 6 služieb tvojho počítača s Windowsom ho môže zbytočne brzdiť. Po ich vypnutí ti pôjde zariadenie rýchlejšie

Windows 11 dostane väčšie možnosti prispôsobenia panela úloh a ponuky Štart. Microsoft vracia presúvanie panela, menšie ikony aj lepšie nastavenia odporúčaní

Aktualizácia Windowsu ti už nemusí rozbiť počítač na celé dni. Microsoft chystá automatickú záchranu chybných ovládačov

Microsoft otvorene priznal kritiku používateľov: Windows 11 chce opraviť od základov a takto sa zmení tvoj PC

Hackeri zneužívajú známu aplikáciu vo Windowse. Cez ňu môžu vidieť tvoje SMS správy aj jednorazové prihlasovacie kódy

Chce AI utiecť spod kontroly a vydierať ľudstvo? Vedci odhalili, čo sa deje za oponou

Terminátor nám zatiaľ nehrozí

Neprehliadni

Zaujímavé články

Ďaleko je aj genocída spôsobená Cylonmi

Zdieľať článok:

Pravidlá preberanie obsahu:

Posledné návody

Ako si pridať správy z webov priamo na domovskú obrazovku telefónu? Túto aplikáciu pre Android a iPhone sa oplatí vyskúšať

Spyware sa do mobilu môže dostať aj bez kliknutia. Apple, Google a WhatsApp majú ochranu, ktorú si vieš zapnúť za pár sekúnd

11 tipov, ako čo najlepšie využiť split screen funkciu Androidu: Už sa nebudeš musieť neustále prepínať medzi oknami

Vieš, prečo ti Wi-Fi router stále bliká? Toto prezrádza blikanie kontroliek o stave tvojho internetu

Ako si v Samsung telefóne nastaviť Gemini alebo Perplexity namiesto Bixby? Zmena AI asistenta trvá len pár sekúnd

Tieto nové funkcie v Samsung telefónoch ti pomôžu ochrániť súkromie. Cudzí človek vedľa teba už len tak neuvidí, čo robíš na mobile

Mohlo by Vás zaujímať

Armádne technológie

VIDEO: Ukrajinci oslepili ruskú S-300. Dron RAM II zničil 5N63S, citlivý prvok batérie, ktorý sa nahrádza veľmi ťažko

VIDEO: Rusi si mysleli, že 100 kilometrov od frontu sú v bezpečí. Potom priletel ukrajinský FPV dron

Rusko dodalo vzdušným silám nové Su-35S. Moskva však tají, koľko stíhačiek armáda dostala

Elon Musk zúri. Americké vraždiace drony mali používať civilný Starlink v rozpore s pravidlami. Od Pentagonu žiada platiť 5x viac

VIDEO: Ukrajina otestovala holandský AI systém na zachytávanie dronov typu Shahed. Rusom môže skomplikovať masové útoky

Filmy a seriály

Netflix odštartoval jún silnou nádielkou filmov. Do ponuky pribudol Rocky, The Big Lebowski, Creed aj celá séria o Riddickovi

Netflix nespomaľuje ani na konci mája. V najbližších dňoch pridá nové seriály, dokumenty aj film o Stephenovi Hawkingovi

Nevieš, čo si pozrieť cez víkend? Netflix pridal nové filmy a seriály, medzi nimi aj jeden z najzvláštnejších sci-fi hororov posledných rokov

Na Netflixe pribudli nové filmy a seriály. Toto sú víkendové novinky, ktoré si môžeš pustiť z gauča

Netflix pridal nové filmy a seriály na víkend. Čaká ťa temné krimi, dánsky thriller aj reality šou, ktorá opäť preverí vzťahy

Windows

Týchto 6 služieb tvojho počítača s Windowsom ho môže zbytočne brzdiť. Po ich vypnutí ti pôjde zariadenie rýchlejšie

Windows 11 dostane väčšie možnosti prispôsobenia panela úloh a ponuky Štart. Microsoft vracia presúvanie panela, menšie ikony aj lepšie nastavenia odporúčaní

Aktualizácia Windowsu ti už nemusí rozbiť počítač na celé dni. Microsoft chystá automatickú záchranu chybných ovládačov

Microsoft otvorene priznal kritiku používateľov: Windows 11 chce opraviť od základov a takto sa zmení tvoj PC

Hackeri zneužívajú známu aplikáciu vo Windowse. Cez ňu môžu vidieť tvoje SMS správy aj jednorazové prihlasovacie kódy