Elon Musk hovorí, že umelá inteligencia v roku 2024 vyčerpala všetky dáta vytvorené ľuďmi na internete. Čo bude nasledovať?!

Elon Musk hovorí, že minulý rok všetky AI modely minuli človekom vytvorené dáta.

Žijúci Nostradamus varuje pred umelou inteligenciou
Zdroj: Vosveteit.sk, Bing Image creator

Umelá inteligencia má potenciál transformovať náš svet. Veľké jazykové modely ako ChatGPT, Gemini alebo xAI potrebujú naozaj gigantické množstvo dát na to, aby sa mohli neustále zlepšovať. Viacerí odborníci poukázali na to, že v budúcnosti reálne hrozí, že umelej inteligencii dôjdu dáta, na ktorých môže trénovať. Zdá sa, že budúcnosť prišla rýchlejšie, než sme očakávali.  

Portál Firstpost nedávno informoval o vyjadrení Elona Muska, podľa ktorého už umelej inteligencii xAI minulý rok došli dáta vytvorené človekom, na ktorých by sa mohla učiť. Musk ďalej spomína, že nielen xAI, ale pravdepodobne aj ďalší lídri v oblasti umelej inteligencie, budú musieť používať syntetické dáta na zdokonaľovanie svojich modelov. 

Odoberaj Vosveteit.sk cez Telegram a prihlás sa k odberu správ

Syntetické dáta sú obsah, ktorý vytvorila umelá inteligencia a podľa expertov nie sú práve najlepšou voľbou pre nové AI modely. Ak sa umelá inteligencia učí zo svojich dát, môže si tak upevňovať nesprávne informácie alebo častejšie “halucinovať”, teda podávať úplné nezmysly.

umela inteligencia a robot zahlteny odpadom
Zdroj: DALL·E, Vosveteit.sk,

Pomôžu syntetické dáta? 

Prechod na syntetické dáta značí významnú zmenu v tom, ako budú vývojári ďalej pracovať na prelomových modeloch. Ako sme už spomenuli, vyspelá umelá inteligencia potrebuje kvantum dát, ktoré čerpá z internetu. Z týchto dát sa učí rôzne vzorce, ktoré AI modelu pomáhajú predpovedať, čo asi bude nasledovať, napríklad aké slovo pôjde za predchádzajúcim slovom.  

Možnosť použiť syntetický obsah, teda obsah vytvorený umelou inteligenciou, nie je úplne novou metódou. Viaceré spoločnosti, napríklad Meta alebo Microsoft, do svojho vývoja už syntetické dáta zakomponovali. Táto metóda trénovania AI predstavuje záchranný kruh, no zároveň má aj svoje problémy.  

Pri použití syntetických dát umelá inteligencia vytvorí nejaký obsah a dá mu hodnotenie na základe jeho kvality. Následne sa učí aj s ohľadom na kvalitu vytvoreného obsahu. Elon Musk sa zároveň vyjadril aj na tému AI halucinácií a čo by mohlo spôsobiť používanie syntetického obsahu.

Ak sa môže umelá inteligencia učiť aj z obsahu, ktorý sama vygenerovala, stáva sa ťažké rozoznať medzi pravdivou a vymyslenou informáciou. Expert menom Andrew Duncan z Inštitútu Alana Turinga hovorí nasledovné. Nadmerné používanie syntetických dát môže viesť k tomu, že sa výsledky AI modelu postupne stanú menej a menej kvalitné. V praxi by mohli odpovede umelej inteligencie zobrazovať väčšiu zaujatosť alebo celkovo menšiu kreativitu.  

AI lídri stoja na prahu novej kapitoly

Stále to ale nemení nič na tom, že AI spoločnosti sa ocitajú na úplne novej kapitole. Používanie syntetických dát sa stalo postupne nutnosťou, no ako experti varujú, spoločnosti musia byť opatrné v tom, ako budú syntetické dáta používať.  

Výskumníci v novej štúdii naučili dve umelé inteligencie rozprávať sa medzi sebou
Zdroj: DALL-E

Nedostatok kvalitných dát sa zároveň odzrkadľuje aj na rôznych súdnych sporoch. Spoločnosť OpenAI priznala, že ChatGPT by dnes nevyzeral tak, ako vyzerá, ak by nemala umelá inteligencia prístup aj k obsahu pod copyrightom. To vyvoláva otázky, ako budú kreatívci a publicistické spoločnosti kompenzované za to, že OpenAI použila ich obsah na trénovanie svojho AI modelu. 

Zároveň hrozí, že v budúcnosti nám už umelá inteligencia nebude schopná poskytnúť spoľahlivý obsah, pretože bude natrénovaná na svojich vlastných nepresných kreáciách. Ostáva nám len počkať a sledovať, ako sa spoločnosti vysporiadajú s touto novou výzvou.  

Približne v polovici roku 2024 sa objavili aj také správy, že spoločnosť Meta plánuje používať naše dáta z Facebooku na trénovanie umelej inteligencie. Nemusíš sa báť, že by použila tvoje súkromné správy. Využije ale akýkoľvek tvoj verejný obsah, teda príspevky, komentáre, fotografie a iné. Pochopiteľne toto rozhodnutie vyvolalo poriadnu dávku kontroverzie. Ako sa z tohto procesu môžeš odhlásiť nájdeš v tomto článku, ale upozorňujeme, že to vôbec nie je jednoduché. 

Prihlás sa k odberu správ z Vosveteit.sk cez Google správy

Komentáre