Nový AI rozmýšľa podobne ako človek. OpenAI znova prináša revolúciu
Spoločnosť vydala zatiaľ testovaciu verziu, ktorú bude postupne vylepšovať. Už teraz ale model o1 prináša fantastické výsledky.
Spoločnosť OpenAI je lídrom vo svete umelej inteligencie a predstavuje nový AI model o1, ktorý svojou schopnosťou komplexného uvažovania konkuruje expertom v odbore.
Nový model o1 dokáže vyprodukovať dlhú sieť interných myšlienok ešte predtým, ako ti odpovie na zadanú otázku. Model sa radí do percentilu 89, čo sa týka kompetitívnych programovacích otázok. Pri otázkach ohľadom fyziky, biológie a chémie vedomosťami prekračuje človeka s titulom PhD.
Spoločnosť OpenAI priznáva, že zatiaľ stále pracuje na tom, aby nový model o1 urobila tak jednoduchým na používanie, ako sú staršie modely. Spoločnosť ale vydala preview verziu, ktorú už môžu užívatelia vyskúšať.
“Náš nový algoritmus učí AI model ako produktívne uvažovať. Na to používa sieť myšlienok, ktorá vychádza z trénovania na kvalitných dátach. Pozorujeme, že výkon modelu o1 konzistentne rastie s ďalšími cvičeniami,” píše OpenAI.
Doteraz najinteligentnejší model
Predchádzajúci model ChatGPT-4o spoločnosť testovala na rôznych testoch pre ľudí a mechanizmov na cvičenie strojového učenia. Na základe týchto testov demonštruje, že model o1 výrazne prekonáva GPT-4o v drvivej väčšine úloh náročných na uvažovanie. Ďalej spoločnosť vysvetľuje, že v najnáročnejších testoch na uvažovanie model o1 konkuruje aj expertom. Schopnosti modelu o1 spoločnosť OpenAI otestovala na matematickom teste AIME, ktorý je navrhnutý tak, aby dal poriadne zabrať aj tým najbystrejším matematikom v Spojených štátoch.
Testami AIME prešiel aj model GPT-4o, a to ešte v tomto roku. Tento model vyriešil priemerne 12% matematických problémov. O1 naopak dosiahol priemerné skóre 74% pri jednej vzorke na problém, 83% pri konsenze spomedzi 64 vzoriek a 93% pri opätovnom hodnotení 1000 vzoriek.
Neprehliadnite
“Dosiahnuté skóre 93% radí model o1 medzi 500 najbystrejších študentov v celých Spojených štátoch. Zároveň by sa náš model dostal aj na národnú matematickú olympiádu,” tvrdí OpenAI.
Následne spoločnosť otestovala model o1 aj na teste GPQA diamond. Ide o náročný inteligenčný test, ktorý zároveň skúma znalosť chémie, fyziky a biológie. Pri tomto teste sa model postavil proti expertom s titulom PhD. Tu sa ukázalo, že model o1 prekonal vedomosti expertov. Tým sa stal prvým AI modelom, ktorý to dokázal pri teste GPQA diamond.
Ako o1 uvažuje?
OpenAI vysvetľuje, že nový model o1 rozmýšľa podobne ako človek. Keď nám niekto položí komplikovanú otázku, väčšinou uvažujeme dlhšiu dobu, než poskytneme odpoveď. Rovnako pracuje aj model o1, ktorý používa komplexnú sieť myšlienok. Znamená to, že tento model dokáže rozmýšľať krok po kroku a tým priniesť ešte presnejšie odpovede aj na tie najkomplikovanejšie otázky.
S pomocou cvičenia model vylepšuje svoju myšlienkovú sieť a zlepšuje uvažovacie stratégie, ktoré používa. Znamená to, že sa postupne učí rozpoznať a opraviť svoje chyby. O1 dokáže komplikovaný krok rozložiť na niekoľko menších a jednoduchších krokov. Ak jeden prístup nefunguje, umelá inteligencia to dokáže rozpoznať a zvoliť iný prístup.
OpenAI okrem vedomostného výkonu skúmala aj to, či ľudia preferujú model o1 alebo GPT-4o. Tu skúmali, ako umelá inteligencia odpovedala na náročné otvorené otázky z rôznych odborov. Odborníci dostali anonymné odpovede na svoje otázky a museli následne vybrať, ktorú odpoveď preferovali.
Tu sa ukázalo, že čo sa týka analytických, matematických alebo vedeckých otázok, tam užívatelia výrazne preferovali model o1. Zároveň sa im ale páčil viac starší model GPT-4o pri úlohách, ktoré sa spájali s jazykom alebo písaním. Spoločnosť OpenAI priznáva, že zatiaľ nemusí byť o1 dobrý vo všetkých prípadoch.
Spoločnosť ale aj naďalej vylepšuje model o1. Tvrdí, že nový AI model posúva výrazne dopredu spôsob, akým umelá inteligencia uvažuje. Momentálne si môžu užívatelia vyskúšať testovaciu verziu o1-preview, no OpenAI model doladí ešte predtým, než vydá plnohodnotnú verziu.
Komentáre