21. novembra 2023

Výskumníci vytvorili desivo realistický 3D model hovoriaceho človeka: Stačí k tomu zvuková nahrávka a jediná fotografia

Nový softvér by mohol priniesť revolúciu v multimediálnej komunikácii.

robot cyborg — Zdroj: Shevs / Shutterstock.com

Výskumníci z technologickej univerzity Nanyang Technological University vytvorili počítačový program, ktorý dokáže vytvoriť realistické video rozprávajúcej osoby len zo zvukovej nahrávky a jedinej fotografie daného človeka.

Nový program autori štúdie nazývajú DIRFA (pozn. redakcie: Diverse yet Realistic Facial Animations). Ide o softvér založený na umelej inteligencii, do ktorého stačí nahrať fotografiu a audioklip hlasu osoby a vznikne presvedčivé 3D video. Toto video sa vyznačuje realistickou a konzistentnou mimikou, ktorá je dobre zladená s hovoreným slovom.

Odoberajte Vosveteit.sk cez Telegram a prihláste sa k odberu správ

Softvér DIRFA sa zakladá na už existujúcich programoch, ktoré ale nepriniesli až tak presvedčivé výsledky. Najväčším problémom predchádzajúcich pokusov bolo neverné zobrazenie rozličných emócií. Autori štúdie trénovali softvér DIRFA na viac ako jednom milióne audiovizuálnych klipov, ktoré zachytávali viac ako 6-tisíc ľudí. Dáta čerpali z datasetu The VoxCeleb2, ktorý je špecifický navrhnutý na rozpoznávanie rôznych znakov z reči a priraďovaní ich k mimike a pohybu celej hlavy.

DIRFA by mohol viesť k novej generácii realistických virtuálnych asistentov a chatbotov. Zároveň by však tento softvér mohol pomôcť ľuďom s postihnutím tak, že im umožní lepšie vyjadriť svoje pocity a emócie cez realistického a expresívneho avatara.

“Naša štúdia môže mať obrovský dopad, pretože prináša revolúciu do sféry multimediálnej komunikácie. DIRFA umožňuje vytvárať mimoriadne realistické videá rozprávajúcich ľudí, pričom používa techniky strojového učenia a umelej inteligencie. Videá vytvorené našim programom sa vyznačujú presnými pohybmi pier, živou mimikou a prirodzenými pohybmi hlavy. Používame pritom len audionahrávku hlasu človeka a jeho statickú fotografiu,” tvysvetlil Lu Shijian, vedúci štúdie.

Umelá inteligencia na základe kľúčových momentov v reči realisticky generuje mimiku hovoriaceho

Vedci vysvetľujú, že pri bežnej reči človek vykazuje množstvo rôznych variácií. Rovnaké slová môžeme na základe kontextu vyslovovať inak. Mení sa pritom tón hlasu, dĺžka vyslovenia jednotlivých slabík či ďalšie drobné rozdiely. Okrem samotných slov reč obsahuje aj množstvo ďalších informácií o pohlaví, veku, osobnosti, či nálady hovoriaceho. Výskum sa snaží všetky tieto parametre implementovať do softvéru, ktorý vygeneruje mimoriadne prirodzenú tvár človeka.

Neprehliadnite

Týchto 5 funkcií, ktoré pravdepodobne aktívne nepoužívate, vám zbytočne míňajú batériu smartfónu

Vytvorenie vernej mimiky len z audionahrávky pre vedcov predstavovalo komplexný proces, s ktorým sa museli vysporiadať. Jedno slovo zo zvukovej nahrávky mohlo mať niekoľko výrazov tváre, ktoré by dávali zmysel a postupom času sa možnosti len narastajú.

Autori štúdie však pracovali s tým, že reč sa najsilnejšie spája s pohybom našich pier a už o niečo slabšie s mimikou a spôsobom akým pohybujeme počas rozprávania hlavou. Synchronizácia zvuku s pohybom pier preto bola hlavná a tesne nasledovala mimika a prirodzený pohyb hlavy. Výsledný model je pôsobivý, no v budúcnosti by chceli autori vytvoriť lepšie rozhranie. To by umožnilo kontrolovať určité výsledky umelej inteligencie. Momentálne napríklad DIRFA nedovoľuje vymeniť zamračenú tvár za úsmev, no to by sa v budúcnosti malo zmeniť.

Prihláste sa k odberu správ z Vosveteit.sk cez Google správy

Výskumníci vytvorili desivo realistický 3D model hovoriaceho človeka: Stačí k tomu zvuková nahrávka a jediná fotografia

Umelá inteligencia na základe kľúčových momentov v reči realisticky generuje mimiku hovoriaceho

Neprehliadnite

Komentáre

Odoberajte nás cez:

Pravidlá preberanie obsahu:

Posledné návody

Veľký výrobca smartfónov upozorňuje, že nedodržiavanie pravidiel pri nabíjaní, môže viesť k vzniku požiaru, elektrického šoku či zraneniu

Toto si v smartfóne zmeňte, batéria mobilu vám na jedno nabitie vydrží následne fungovať o poznanie dlhšie

Tento tajný kód pre Samsung smatfóny vám môže zlepšiť odozvu dotykovej obrazovky a kvalitu Wi-Fi

Ako používať vylepšenú funkciu Quick Share na Android zariadeniach?

Google upozorňuje na 6 častých chýb v online priestore, ktoré vedú k tomu, že sa staneme obeťou hackerov či online podvodu

Ako zdieľať trasu v Google Mapách s niekým druhým či z počítača do smartfónu? Túto funkciu pozná len málokto!

Mohlo by Vás zaujímať

Recenzie

RECENZIA: Samsung Galaxy S24 Ultra je kráľom medzi kráľmi. V súčasnosti ide o jeden z najlepších modelov, ak nie o najlepší smartfón medzi Androidmi

RECENZIA: Samsung Galaxy S24 si nájde cestu do vreciek nohavíc mnohých z nás

RECENZIA: Samsung Galaxy A54 5G vo svojej triede patrí medzi špičku

RECENZIE: Upraviť PDF súbor cez UPDF je extrémne jednoduché. Tento softvér stojí za povšimnutie!

RECENZIA: CyberGhost VPN prekvapil nielen cenou, ale aj funkciami. Za málo peňazí si môžete chrániť vaše online súkromie

Filmy a seriály

Netflix má ďalšiu pecku, seriál Sobík. Príbeh zachytáva obeť stalkingu, no nejde o obyčajný príbeh

AKTUÁLNE: Veľká streamovacia platforma na Slovensku zavádza predplatné s reklamami

Neviete, čo si na Netflixe pozrieť? 10 tipov, v ktorých nájdete nielen novšie filmy, ale aj klasiky

Netflix aj v druhej polovici apríla prinesie skvosty. Týchto 10 filmov a seriálov neprehliadnite, stoja za pozretie!

Rozmýšľate, čo si pozrieť? Týchto 10 aprílových noviniek na Netflixe neprehliadnite!

Windows

Pozor, táto Windows aktualizácia môže znefunkčniť populárnu službu, ktorú vo veľkom používajú aj Slováci. Aktualizáciu radšej odložte!

Ak na tomto mieste vo vašom Windowse zbadáte novú reklamu, tak vedzte, že nejde o náhodu. Takto ju môžete vypnúť!

Doživotný Office 2021 Pro už za 27,25 €! Doprajte svojmu počítaču zaslúžený upgrade!

Webová verzia obchodu Microsoft Store prešla zmenami: Aplikácie si do počítača stiahnete rýchlejšie

Objavila sa vám vo Windowse táto nová aplikácia bez toho, aby ste ju nainštalovali? Nie je dôvod na paniku, hovorí Microsoft