24. apríla 2024

Vedci vytvorili zlú AI, ktorá je odmeňovaná za vymýšľanie najhorších a toxických otázok

Vedci z MIT objavili spôsob, ako lepšie otestovať veľké AI modely, ako napríklad ChatGPT alebo Gemini.

Zla umela inteligencia — Zdroj: OpenClipart-Vectors z Pixabay

Ak sa umelej inteligencie opýtame na akúkoľvek otázku, s najväčšou pravdepodobnosťou nám dokáže poskytnúť presnú odpoveď. Problém nastáva, ak sa jej opýtame na niečo, na čo by sme sa pýtať nemali.

Výskumníci z inštitútu MIT vysvetľujú, že momentálne umelá inteligencia nepozná rozdiel medzi prosbou o radu pri písaní pracovného e-mailu a inštrukciami na výrobu bomby. Momentálne sa lídri v AI technológiách pokúšajú umelú inteligenciu kontrolovať tým, že uplatňujú ľudských testerov, ktorí sa pýtajú všemožné rizikové otázky a zisťujú, čo všetko umelá inteligencia prezradí a čo nie.

Odoberajte Vosveteit.sk cez Telegram a prihláste sa k odberu správ

Keď sa testerovi podarí získať od umelej inteligencie nebezpečnú alebo inak nevhodnú odpoveď, cez použitý prompt experti následne učia umelú inteligenciu, akým odpovediam sa má v budúcnosti vyhnúť. Problém je, že tester môže nejaké nebezpečné slovo minúť, čím dáva zle zmýšľajúcemu človeku niekoľko možností, ako umelú inteligenciu zneužiť.

V rámci novej štúdie vedci z MIT využili proces strojového učenia na to, aby toto testovanie zlepšili. “Zlú” umelú inteligenciu naučili pýtať sa AI modelu celú radu otázok, ktoré by mohli viesť k nebezpečným, toxickým alebo inak nevhodným odpovediam. Umelá inteligencia v tomto prekonala človeka a iné metódy na vytvorenie bezpečnej AI. Zlej umelej inteligencii sa podarilo, aby trénovaná umelá inteligencia poskytovala čoraz nebezpečnejšie a urážlivejšie odpovede.

“Momentálne musí každý veľký jazykový model podstúpiť mimoriadne dlhý proces testovania. Tým sa zaručí jeho bezpečnosť. Tento proces ale nie je udržateľný, ak chceme tieto modely aktualizovať v rapídne sa meniacom prostredí. Naša metóda ponúka rýchlejší a efektívnejší spôsob kontroly kvality,” vysvetľuje Zhang-Wei Hong, vedúci nového výskumu.

Veľké jazykové modely, ako napríklad ChatGPT, Gemini alebo Bing, sa trénujú tak, že ich vedci nakŕmia textom z miliárd verejných webových stránok. Znamená to, že medzi týmto textom sa objavia aj nadávky, rasistické poznámky, diskriminácia, osobné informácie alebo návod na výrobu ilegálnych látok či predmetov.

Neprehliadnite

Týchto 5 funkcií, ktoré pravdepodobne aktívne nepoužívate, vám zbytočne míňajú batériu smartfónu

Bezpečnejšia umelá inteligencia

Ak by neexistovala kontrola kvality, umelá inteligencia by vám mohla začať nadávať. Mohla by vás aj inak urážať alebo by vám bez problémov poskytla návod na výrobu drog, zbraní alebo bômb. Niekomu to síce môže znieť vtipne, no v nesprávnych rukách takéto informácie môžu predstavovať obrovské riziko. Samozrejme, že ak niekto veľmi chce, tieto informácie si dokáže vyhľadať svojpomocne. No je úplne iná situácia, ak vám dokáže umelá inteligencia za menej ako minútu napísať presný návod na ilegálnu činnosť.

Umelá inteligencia môže vygenerovať oveľa viac toxických promptov, než stihne vymyslieť človek. Vedci sa však stretli s takým problémom, že zlý AI model generoval len pár mimoriadne ofenzívnych promptov dookola. Chcel tak získať čo najväčšiu odmenu. Vedci následne upravili model tak, aby odmeňovali zvedavosť.

Zlý AI model bol odmenený, ak sa pýtal rozdielne veci, no tie museli zároveň znieť prirodzene. Rovnako ho odmenili, ak sa mu podarilo dosiahnuť novým promptom ešte ofenzívnejšiu odpoveď.

Vedci z MIT teda predstavili nový spôsob, ako otestovať umelú inteligenciu pomocou inej umelej inteligencie rýchlejšie a efektívnejšie. V budúcnosti môže takéto testovanie priniesť bezpečnejšiu umelú inteligenciu pre verejnosť.

Prihláste sa k odberu správ z Vosveteit.sk cez Google správy

Vedci vytvorili zlú AI, ktorá je odmeňovaná za vymýšľanie najhorších a toxických otázok

Neprehliadnite

Bezpečnejšia umelá inteligencia

Komentáre

Odoberajte nás cez:

Pravidlá preberanie obsahu:

Posledné návody

Pomocou týchto nástrojov zistíte, že niekto, kto nahral na internet šokujúci obrázok, sa snaží s vami manipulovať

Chráňte svoju peňaženku: Takto si môžete chrániť vaše platobné údaje v Google Pay

Týchto 5 tipov v Google Mapách si osvojte ešte predtým, ako sa vyberiete na výlet. Poznáte tieto málo známe funkcie máp?

Toto skryté menu v Samsung smartfóne vám povie, či Wi-Fi sieť máte nakonfigurovanú správne

Kradne vám sused Wi-Fi internet?! Koľko zariadení máte pripojených k vašej sieti?

Veľký výrobca smartfónov upozorňuje, že nedodržiavanie pravidiel pri nabíjaní, môže viesť k vzniku požiaru, elektrického šoku či zraneniu

Mohlo by Vás zaujímať

Recenzie

RECENZIA: Samsung Galaxy S24 Ultra je kráľom medzi kráľmi. V súčasnosti ide o jeden z najlepších modelov, ak nie o najlepší smartfón medzi Androidmi

RECENZIA: Samsung Galaxy S24 si nájde cestu do vreciek nohavíc mnohých z nás

RECENZIA: Samsung Galaxy A54 5G vo svojej triede patrí medzi špičku

RECENZIE: Upraviť PDF súbor cez UPDF je extrémne jednoduché. Tento softvér stojí za povšimnutie!

RECENZIA: CyberGhost VPN prekvapil nielen cenou, ale aj funkciami. Za málo peňazí si môžete chrániť vaše online súkromie

Filmy a seriály

Tešte sa, tieto filmy a seriály pribudnú na Netflixe v priebehu nasledujúcich dní. Bude z čoho vyberať!

10 májových noviniek na Netflixe, ktoré už nájdete v ponuke. Tieto filmy a seriály musíte vidieť!

Netflix má ďalšiu pecku, seriál Sobík. Príbeh zachytáva obeť stalkingu, no nejde o obyčajný príbeh

AKTUÁLNE: Veľká streamovacia platforma na Slovensku zavádza predplatné s reklamami

Neviete, čo si na Netflixe pozrieť? 10 tipov, v ktorých nájdete nielen novšie filmy, ale aj klasiky

Windows

Ruskí hackeri udreli v Česku. "Sme odhodlaní dôrazne reagovať,..", hovorí miestne ministerstvo

Pozor, táto Windows aktualizácia môže znefunkčniť populárnu službu, ktorú vo veľkom používajú aj Slováci. Aktualizáciu radšej odložte!

Ak na tomto mieste vo vašom Windowse zbadáte novú reklamu, tak vedzte, že nejde o náhodu. Takto ju môžete vypnúť!

Doživotný Office 2021 Pro už za 27,25 €! Doprajte svojmu počítaču zaslúžený upgrade!

Webová verzia obchodu Microsoft Store prešla zmenami: Aplikácie si do počítača stiahnete rýchlejšie