Meta čelí brutálnemu obvineniu. Mala stiahnuť 82 TB ukradnutých kníh a na nich trénovať svoju AI. Ak sa to potvrdí, pôjde o mega škandál
Meta čelí obvineniam z používania pirátskych kníh na tréning AI. Aké budú dôsledky?
Meta sa opäť dostala do centra pozornosti kvôli spôsobu, akým trénuje svoje AI modely. Tentokrát čelí obvineniam, že na vývoj umelej inteligencie použila 82 terabajtov nelegálne stiahnutých kníh. Ak sa tieto tvrdenia potvrdia, môže to mať vážne dôsledky nielen pre Metu, ale aj pre celý vývoj AI. Na problematiku upozorňuje portál bgr.com.
Aké sú dôkazy?
Dokumenty zo súdneho sporu ukazujú, že spoločnosť pravdepodobne sťahovala a používala pirátske knihy na tréning svojich modelov. Podľa zverejnených informácií si Meta stiahla obsah z portálov ako Sci-Hub, ResearchGate a Library Genesis. Tieto stránky sú známe tým, že poskytujú prístup k plateným a autorsky chráneným materiálom zadarmo.
Uniknuté e-maily a správy medzi zamestnancami naznačujú, že si boli vedomí neetickosti tohto postupu. Jeden z výskumníkov v Mete vyjadril obavy, že používanie pirátskeho obsahu je „za hranicou etiky“. Iný zamestnanec dokonca vtipkoval o tom, že sťahovanie cez firemný laptop „nepôsobí správne“.
Zuckerberg chcel riešenie, ale aké?
Podľa dostupných dokumentov sa k tejto téme vyjadril aj Mark Zuckerberg. Počas interného stretnutia v januári 2023 povedal, že „je potrebné nájsť spôsob, ako sa cez to dostať“. Nie je však jasné, či myslel legálne alebo menej legálne riešenia.
Keď sa tieto informácie dostali na verejnosť, Meta chybu nepriznala. Namiesto toho argumentovala, že „stiahnutie“ a „použitie“ sú dve rôzne veci. Inými slovami, aj keď mala 82 TB pirátskych kníh, nemusí to nutne znamenať, že ich použila na tréning AI. Otázka teda znie, na čo iné by ich potrebovala?
Neprehliadni
Prečo je to problém?
Používanie nelegálneho obsahu na tréning AI je problémom nielen z hľadiska autorských práv, ale aj spravodlivosti. Autori, vedci a vydavatelia trávia roky vytváraním obsahu, ktorý AI systémy „konzumujú“ bez akejkoľvek kompenzácie.
Ak technologické firmy ignorujú autorské práva, môže sa stať, že originálneho obsahu bude v budúcnosti menej. Okrem toho, používanie pirátskych kníh môže ovplyvniť aj kvalitu AI modelov. Nie všetky materiály dostupné na nelegálnych portáloch sú aktuálne alebo presné, čo môže viesť k šíreniu nesprávnych informácií. Ak AI modely trénované na takýchto zdrojoch poskytujú nespoľahlivé odpovede, môže to mať negatívne dôsledky pre ich používateľov.
Reakcie autorov a regulačných orgánov
Mnohí autori a vydavatelia sa už vyjadrili proti takémuto spôsobu získavania údajov. Niektoré organizácie za ochranu autorských práv zvažujú ďalšie právne kroky, aby zabránili podobným praktikám v budúcnosti.
Regulačné orgány v Európskej únii a USA už začali diskusie o prísnejších pravidlách pre tréning AI modelov. Možno očakávať, že v budúcnosti budú spoločnosti ako Meta povinné transparentne uvádzať zdroje dát, na ktorých ich AI modely trénovali.
Ako to ovplyvní budúcnosť AI?
Ak súd rozhodne v neprospech Mety, môžu prísť prísnejšie regulácie pre tréning AI modelov. Spoločnosti by možno museli platiť za obsah, na ktorom AI trénujú, čo by zvýšilo náklady a mohlo spomaliť vývoj. Ak súd rozhodne v prospech Mety, môže to vytvoriť precedens, ktorý legalizuje podobné praktiky aj pre iné spoločnosti. To by mohlo viesť k situácii, kde by sa autorsky chránený obsah stal voľne dostupným pre vývoj AI.
Jasné výsledky zatiaľ nie sú, ale jedno je určite isté, tento prípad ovplyvní budúcnosť umelej inteligencie. Vývoj AI a spôsob, akým sa trénuje, sa dostáva čoraz viac pod drobnohľad regulačných orgánov aj verejnosti. Ak firmy nebudú rešpektovať autorské práva, môžu čeliť čoraz väčším právnym problémom a reputačným škandálom.
Komentáre