5. januára 2024

Výskumníci zistili, že v databáze, ktorá sa používala na trénovanie AI, boli aj fotografie sexuálneho zneužívania detí

Výskumníci poznamenávajú, že obrázky zbierané v budúcich datasetoch by mali byť skontrolované proti známym zoznamom CSAM pomocou detekčných nástrojov.

stop nasiliu na detoch — Zdroj: Marija Stepanovic / Shutterstock.com

Výskum uskutočnený Stanford Internet Observatory (SIO) odhalil stovky známych obrázkov sexuálneho zneužívania detí (CSAM) v otvorenom datasete, ktoré boli použité na trénovanie populárnych modelov generovania textu na obrázok pomocou umelej inteligencie, ako je napríklad Stable Diffusion.

Predchádzajúca správa SIO v spolupráci s neziskovou organizáciou zameranou na online bezpečnosť detí Thorn poukázala na rýchly pokrok v generatívnom strojovom učení, ktorý umožňuje vytvárať realistické obrázky podporujúce sexuálne zneužívanie detí s využitím open source modelov generovania obrázkov pomocou AI. Nové zistenia výskumníkov odhaľujú, že tieto modely sú priamo trénované na CSAM prítomnom vo verejnom datasete obsahujúcom miliardy obrázkov, známom ako LAION-5B. Dataset obsahuje zároveň aj známe prípady CSAM, ktoré boli zhromaždené z rôznych zdrojov vrátane hlavných sociálnych médií či populárnych stránok pre dospelých.

Odoberajte Vosveteit.sk cez Telegram a prihláste sa k odberu správ

Výskumníkom sa podarilo takto identifikovať viac ako 1,6-tisíc obrázkov CSAM a hoci tvoria len malú časť z celkového datasetu, tak výskumníci veria, že ide o dostatočnú vzorku, ktorá potenciálne umožňuje vytvárať nelegálny obsah.

„Súbor údajov zahŕňal známy obsah sexuálneho zneužívania detí zo širokej škály zdrojov vrátane bežných webových stránok sociálnych médií a populárnych stránok s videami pre dospelých.“, uvádzajú výskumníci v správe.

Aktuálne podľa zverejnenej správy prebieha odstránenie identifikovaných materiálov, keďže výskumníci nahlásili URL adresy obrázkov Národnému centru pre nezvestné a zneužívané deti (NCMEC) v USA a Kanadskému centru pre ochranu detí (C3P).

Existujú metódy na minimalizáciu CSAM v datasetoch používaných na trénovanie modelov AI, ale je náročné čistiť alebo zastaviť distribúciu otvorených datasetov bez centrálnej autority, ktorá by skutočné údaje hostila.

Neprehliadnite

Kradne vám sused Wi-Fi internet?! Koľko zariadení máte pripojených k vašej sieti?

Výskumníci poznamenávajú, že obrázky zbierané v budúcich datasetoch by mali byť skontrolované proti známym zoznamom CSAM pomocou detekčných nástrojov, ako je PhotoDNA od Microsoftu, alebo prostredníctvom spolupráce s organizáciami zameranými na ochranu detí, ako sú NCMEC a C3P.

Prihláste sa k odberu správ z Vosveteit.sk cez Google správy

Výskumníci zistili, že v databáze, ktorá sa používala na trénovanie AI, boli aj fotografie sexuálneho zneužívania detí

Neprehliadnite

Komentáre

Odoberajte nás cez:

Pravidlá preberanie obsahu:

Posledné návody

V Google Mapách pribudla funkcia „Zdieľať priebeh cesty“. Pozrite sa, kde túto šikovnú funkciu nájdete a na čo slúži

Ako rýchlo odhaliť sledovače vo vašom smartfóne? Toto je nástroj, ktorý vám v tom pomôže

Ako vytvoriť zálohu kontaktov na Androide? Takto si ich prenesiete z jedného smartfónu do druhého

Pomocou týchto rád, si predĺžite výdrž batérie na vašom iPhone

Google prekladač pozná každý, no týchto 6 funkcií len málokto: Takto môžete prekladač využiť efektívnejšie

„Denne mi príde aj 10 podvodných SMS správ a niekoľko podvodných hovorov“. Tieto chyby nerobte, inak dopadnete rovnako

Mohlo by Vás zaujímať

Recenzie

RECENZIA: Samsung Galaxy S24 Ultra je kráľom medzi kráľmi. V súčasnosti ide o jeden z najlepších modelov, ak nie o najlepší smartfón medzi Androidmi

RECENZIA: Samsung Galaxy S24 si nájde cestu do vreciek nohavíc mnohých z nás

RECENZIA: Samsung Galaxy A54 5G vo svojej triede patrí medzi špičku

RECENZIE: Upraviť PDF súbor cez UPDF je extrémne jednoduché. Tento softvér stojí za povšimnutie!

RECENZIA: CyberGhost VPN prekvapil nielen cenou, ale aj funkciami. Za málo peňazí si môžete chrániť vaše online súkromie

Filmy a seriály

Kričí sused "GÓL!" ešte skôr, ako vám tam padne? TUSR upozorňuje, že aj toto sa môže počas majstrovstiev stať

Počas mája nás na Netflixe ešte len čaká nádielka skvelých filmov a seriálov. Vyberáme pre vás 10, na ktoré sa oplatí počkať!

Milujete detektívky? Skúste odhaliť vraha v týchto 11 filmoch a seriáloch na Netflixe

Tešte sa, tieto filmy a seriály pribudnú na Netflixe v priebehu nasledujúcich dní. Bude z čoho vyberať!

10 májových noviniek na Netflixe, ktoré už nájdete v ponuke. Tieto filmy a seriály musíte vidieť!

Windows

Hackeri útočia na PC cez novú bezpečnostnú slabinu, aktualizujte si Windows čo najskôr!

Populárna funkcia z Androidu zavíta aj na počítače. Čoskoro Chrome dostanete túto funkciu!

Ruskí hackeri udreli v Česku. "Sme odhodlaní dôrazne reagovať,..", hovorí miestne ministerstvo

Pozor, táto Windows aktualizácia môže znefunkčniť populárnu službu, ktorú vo veľkom používajú aj Slováci. Aktualizáciu radšej odložte!

Ak na tomto mieste vo vašom Windowse zbadáte novú reklamu, tak vedzte, že nejde o náhodu. Takto ju môžete vypnúť!