ChatGPT sa zbláznil? OpenAI potichu stiahla aktualizáciu, ktorá ho zmenila na otravného pochlebovača
Nedávna aktualizácia zmenila správanie umelej inteligencia. Tá dokonca súhlasila aj so spornými návrhmi a úlohami.
Spoločnosť OpenAI sa vyjadrila k nedávnym komplikáciám spojeným s predvoleným jazykovým modelom umelej inteligencie, ktorý poháňa ich populárny nástroj ChatGPT, konkrétne model GPT-4o. Tieto problémy viedli k neobvyklému kroku, teda k stiahnutiu nedávno implementovanej aktualizácie modelu, zavedenej len pred niekoľkými dňami. Na tému upozornil server TechCrunch.
Počas uplynulého víkendu si mnohí používatelia sociálnych sietí všimli pozoruhodnú zmenu v správaní ChatGPT po nasadení aktualizovanej verzie GPT-4o. AI sa začalo prejavovať nadmernú mieru súhlasu a priateľskosti vo svojich odpovediach, čo sa rýchlo stalo predmetom internetových vtipov a paródií. Používatelia zdieľali ukážky konverzácií, v ktorých ChatGPT s entuziazmom schvaľoval aj sporné, či dokonca potenciálne nebezpečné návrhy a rozhodnutia.
Generálny riaditeľ spoločnosti OpenAI, Sam Altman, reagoval na túto situáciu prostredníctvom príspevku na sociálnej sieti X v nedeľu, v ktorom priznal existenciu problému a ubezpečil, že OpenAI intenzívne pracuje na jeho odstránení.
the last couple of GPT-4o updates have made the personality too sycophant-y and annoying (even though there are some very good parts of it), and we are working on fixes asap, some today and some this week.
at some point will share our learnings from this, it’s been interesting.
— Sam Altman (@sama) April 27, 2025
O dva dni neskôr Altman oznámil, že aktualizácia modelu GPT-4o bola stiahnutá a spoločnosť sa sústredí na „ďalšie úpravy“ osobnosti tohto jazykového modelu. Podľa vyjadrenia OpenAI, cieľom spomínanej aktualizácie bolo dosiahnuť, aby sa predvolená osobnosť modelu javila používateľom „intuitívnejšie a efektívnejšie“. Spoločnosť však priznala, že model bol v prílišnej miere ovplyvnený „krátkodobou spätnou väzbou“ a táto zmena „nezodpovedala tomu, ako sa interakcie používateľov s ChatGPT reálne vyvíjajú v dlhodobom horizonte“.
Neprehliadni
„V dôsledku toho sa GPT-4o začal prikláňať sa k odpovediam, ktoré boli síce prehnane podporné, no zároveň postrádali úprimnosť,“ uviedla spoločnosť OpenAI vo svojom blogovom príspevku. „Takéto servilné interakcie môžu byť pre používateľov nepríjemné, ba až znepokojujúce a môžu vyvolávať pocity úzkosti. V tomto smere sme zlyhali a aktívne pracujeme na náprave.“
OpenAI informovala, že implementuje niekoľko opatrení na odstránenie tohto problému. Medzi ne patrí zdokonalenie základných techník trénovania modelov a úprava systémových výziev, ktoré explicitne nasmerujú GPT-4o k vyhýbaniu sa prehnanej úslužnosti (systémové výzvy predstavujú úvodné inštrukcie, ktoré usmerňujú celkové správanie a tón modelu v interakciách). Spoločnosť taktiež pracuje na posilnení bezpečnostných mechanizmov s cieľom „zvýšiť čestnosť a transparentnosť modelu“. Tak isto pokračuje v rozširovaní svojich hodnotiacich procesov, aby „pomohla identifikovať problémy presahujúce len oblasť pochlebovania,“ uvádza sa v ich vyhlásení.
Okrem toho OpenAI experimentuje s metódami, ktoré by používateľom umožnili poskytovať „spätnú väzbu v reálnom čase“, čím by mohli „priamo ovplyvňovať svoje interakcie“ s ChatGPT a potenciálne si vyberať z rôznych prednastavených osobností tohto nástroja. Spätná väzba od používateľov je pre OpenAI kľúčová, pričom spoločnosť využíva aj pokročilé nástroje na zber a analýzu spätnej väzby, ako sú OpenAI Conversational Surveys, ktoré umožňujú efektívne identifikovať slabé miesta a prispôsobiť model reálnym potrebám používateľov.
Model GPT-4o predstavuje významný technologický posun v oblasti generatívnej umelej inteligencie. Ide o multimodálny model, ktorý dokáže spracovávať a generovať text, zvuk aj obraz v reálnom čase. V porovnaní s predchádzajúcimi modelmi, ako je GPT-4, je GPT-4o navrhnutý tak, aby bol rýchlejší a efektívnejší, pričom dokáže lepšie chápať idiomy, metafory a kultúrne odkazy. OpenAI deklaruje, že GPT-4o prekonáva GPT-4 v základných testoch, ako sú jednoduché matematické úlohy, porozumenie jazyku a vizuálne úlohy, pričom jeho odpovede bývajú detailnejšie, niekedy až príliš rozvláčne. Model tiež umožňuje komplexnejšie interakcie vďaka schopnosti pracovať so širším kontextom a pamätať si dlhšie konverzácie.
S rozšírením možností GPT-4o však narastajú aj etické a bezpečnostné otázky. Schopnosť modelu pracovať s obrazom a zvukom v reálnom čase prináša nové riziká v oblasti ochrany súkromia a možného zneužitia osobných údajov. Odborníci upozorňujú na potrebu transparentných mechanizmov spracovania dát a dôslednej kontroly prístupu k citlivým informáciám, aby sa predišlo normalizácii neustáleho dohľadu a neúmyselnému šíreniu predsudkov. OpenAI preto zdôrazňuje, že bezpečnostné a etické mechanizmy zostávajú prioritou a nové verzie modelov sú navrhované tak, aby boli nielen priateľské, ale aj čestné, transparentné a bezpečné.
Komentáre