Používaš AI na vyhľadávanie informácií? Takto brutálnu chybovosť nikto nečakal!
AI vyhľadávače čelia vážnym problémom so spoľahlivosťou. Štúdia odhalila alarmujúcu 60 % chybovosť, pričom model Grok-3 dosiahol až 94 % nepresnosť.
Vyhľadávače s umelou inteligenciou (AI), ktoré sa stávajú stále populárnejšími, čelia vážnym otázkam ohľadom svojej spoľahlivosti. Nedávna štúdia odhalila alarmujúce nedostatky v presnosti týchto nástrojov, pričom celková chybovosť dosiahla až 60%. Najhoršie výsledky zaznamenal model Grok-3, ktorý vykázal šokujúcu 94 % nepresnosť. Tieto zistenia vrhajú tieň pochybností na dôveryhodnosť technológií, ktoré majú byť pilierom digitálnej éry. Na tému upozornil portál Techspot.
Výskumníci sa zamerali na osem popredných AI vyhľadávačov vrátane ChatGPT Search, Perplexity, Gemini a Grok. Metodika štúdie bola navrhnutá s cieľom zabezpečiť relevantnosť testovaných údajov. Použili 200 náhodne vybraných spravodajských článkov od 20 rôznych vydavateľov. Každý článok musel byť medzi prvými tromi výsledkami vyhľadávania Google. Následne boli rovnaké otázky položené AI nástrojom, pričom sa hodnotilo, či správne identifikovali názov článku, vydavateľa a URL odkazu.
Znepokojujúce výsledky
Štúdia priniesla niekoľko zásadných zistení:
-
Vysoká chybovosť: Viac ako polovica odpovedí testovaných nástrojov bola nepresná. Celková chybovosť dosiahla 60%, čo je alarmujúce vzhľadom na rastúci počet používateľov týchto technológií.
-
Rekordná nepresnosť Grok-3: Model Grok-3 od spoločnosti X dosiahol najhoršie výsledky zo všetkých testovaných nástrojov s chybovosťou až 94%. Tento model sa stal symbolom zlyhania AI v oblasti presnosti.
-
ChatGPT Search: Napriek svojej popularite vykázal tento nástroj nepresnosť v 57% prípadoch, pričom často prezentoval úplne nepravdivé informácie s presvedčivou istotou.
-
Microsoft Copilot: Copilot od Microsoftu mal nielen vysokú chybovosť (70%), ale odmietol odpovedať na viac ako polovicu zadaných otázok, čím výrazne obmedzil svoju použiteľnosť.
Jedným z najzávažnejších problémov odhalených štúdiou je fenomén známy ako „halucinácie“ AI. Ide o situáciu, keď modely generujú úplne nepravdivé informácie s vysokou mierou istoty. Tento jav predstavuje zásadnú výzvu pre dôveryhodnosť AI technológií a ich integráciu do oblastí, kde je presnosť kľúčová – napríklad vo vzdelávaní alebo medicíne.
Umelá inteligencia má ešte ďaleko od inteligencie
Autori štúdie kritizovali spoločnosti vyvíjajúce tieto nástroje za ich netransparentný prístup a vysoké ceny. Napriek zjavným nedostatkom v presnosti si firmy účtujú mesačné poplatky v rozmedzí od 20 do 200 dolárov za prístup k týmto technológiám. Tieto ceny môžu byť bariérou pre menšie podniky či jednotlivcov, ktorí sa spoliehajú na AI vyhľadávače pri práci alebo štúdiu.
Neprehliadni
Výsledky štúdie vyvolávajú vážne otázky o budúcnosti vyhľadávania informácií a úlohe AI vo všednom živote. Ak chceme zabezpečiť spoľahlivosť týchto technológií, je potrebné venovať pozornosť ich obmedzeniam a pristupovať k nim s opatrnosťou. V oblasti vzdelávania či podnikania môže vysoká chybovosť viesť k šíreniu dezinformácií alebo nesprávnym rozhodnutiam.
Napriek kritike existujú aj pozitívne názory na niektoré z testovaných nástrojov. Lance Ulanoff z TechRadar ocenil ChatGPT Search za jeho rýchlosť a schopnosť poskytovať relevantné odpovede v určitých oblastiach. Gemini bol zase chválený za kvalitu výsledkov pri špecifických typoch otázok. Tieto úspechy naznačujú potenciál pre ďalší rozvoj AI technológií. Štúdia Centra Tow pre digitálnu žurnalistiku otvára dôležitú diskusiu o spoľahlivosti a dôveryhodnosti AI vyhľadávačov. Je nevyhnutné, aby sa verejnosť zapojila do tejto debaty a pomohla formovať budúcnosť technológií, ktoré ovplyvňujú naše každodenné rozhodnutia.
Komentáre