Open AI ukázalo Voice Engine, umelú inteligenciu, ktorá dokáže naklonovať hlas. Ešte ju ale nezverejní, bojí sa následkov!

Spoločnosť OpenAI hovorí o príležitostiach a problémoch, ktoré môže AI na vytváranie hlasu priniesť.

Hlasová deepfake technológia dokáže vytvoriť desivo presvedčivú kópiu hlasu
Zdroj Pixabay (OpenClipart-Vectors), Unsplash (Taylor Grote), Úprava: Vosveteit.sk

Spoločnosť OpenAI je lídrom vo vývoji umelej inteligencie. Nie je to tak dávno, čo nám ukázala Soru, AI model schopný vytvárať na základe textového promptu realistické videá. Spoločnosť testovala aj svoj nový hlasový model a zdieľa s nami predbežné výsledky.  

Nový hlasový model sa nazýva Voice Engine a podľa slov spoločnosti stačila len 15-sekundová nahrávka na to, aby umelá inteligencia dokázala vytvoriť prirodzene znejúci hlasový klon. Samotný model Voice Engine je relatívne malý, preto sú realistické výsledky prekvapujúce.  

Odoberajte Vosveteit.sk cez Telegram a prihláste sa k odberu správ

Prácu na Voice Engine začala spoločnosť koncom roka 2022. Model použila napríklad na rozšírenie dostupných hlasov v rozhraní, ktoré vám prečítalo odpoveď modelu Chat GPT nahlas. Zároveň ale spoločnosť s obrovskou mierou opatrnosti postupuje k vývoju a vydaniu tohto modelu. Nateraz sa rozhodla model nevydať pre širšiu verejnosť, kvôli obavám zo zneužitia synteticky vytvorených hlasov. Veď posúďte nižšie sami, či by ste rozoznali syntetický hlas od toho skutočného.

OpenAI však plánuje začať dialógy s partnermi ohľadom zodpovedného vydania a používania tejto technológie. Následne spoločnosť vykoná informované rozhodnutie o tom, či tento model spustí aj pre verejnosť.  

Súkromné testovanie modelu Voice Engine sa začalo koncom minulého roka a prebehlo v kruhu dôveryhodných partnerov. 

“Prekvapilo nás množstvo aplikácií pre nový model. V rámci týchto testov sa viac dozvedáme o možnom potenciály tejto technológie, ale aj veciach, na ktoré by sme si mali dávať pozor. Zároveň ale myslíme aj na to, ako by mohol model Voice Engine pomôcť naprieč množstvom odvetví,” píše OpenAI.  

Hlasový model môže pomôcť napríklad deťom, ktoré sa učia čítať. Zároveň ale môžu hlasové modely pomôcť pri preklade obsahu, napríklad videí alebo podcastov. Umelá inteligencia dokáže preložiť akýkoľvek text prakticky okamžite. Použitie hlasového modelu by tvorcom umožnilo vytvoriť si svoj vlastný prirodzený dabing, ktorý by zasiahol väčšie množstvo divákov.  

OpenAI vysvetľuje, že model Voice Engine zachováva prízvuk hovoriaceho. Ak teda vygeneruje anglický hlas z francúzsky hovoriacej vzorky, nový hlas si zachová francúzsky prízvuk.  

Hrozba umelo vytvorených hlasov 

Mať možnosť vytvoriť nahrávku, ktorá sa podobá na hlas konkrétneho človeka, môže spôsobiť obrovské množstvo problémov. Jedným z najväčších je napríklad manipulácia voličov v predvolebnom období.  

OpenAI testuje model so svojimi partnermi. Tí súhlasili, že na vytvorenie nahrávky iného človeka potrebujú jeho jasný a informovaný súhlas. Partneri zároveň musia informovať divákov, že počuté hlasy sú dielom umelej inteligencie.  

Do budúcnosti OpenAI plánuje systém hlasovej autentifikácie. Ten by mal overiť, že človek, ktorému patrí hlas, dáva vedome svoj hlas modelu. Zároveň navrhujú zoznam zakázaných hlasov. Išlo by o hlasy podobné prominentným osobnostiam, z ktorých by sa nemohli vyrábať hlasové klony.  

Prihláste sa k odberu správ z Vosveteit.sk cez Google správy

Komentáre