SVENSKA

Nya AI-forskningen gör det lättare att skapa falska bilder av någon som talar

202

En aspekt av artificiell intelligens som ibland förbises är bara hur bra det är på att skapa falska ljud och video som är svåra att skilja från verkligheten. Tillkomsten av Photoshop fick oss att tvivla på våra ögon, men vad händer när vi inte kan lita på våra andra sinnen?

Det senaste exemplet av AI: s audiovisuella magi kommer från University of Washington, där forskare har skapat ett nytt verktyg som tar ljudfiler, omvandlar dem till realistisk mun rörelser, och sedan transplantat dessa rörelser på befintlig video. Slutresultatet är en video om någon säger något de inte. (Inte på den tiden, ändå.) Det är en förvirrande process för att förstå genom att bara läsa om det, så ta en titt på videon nedan:

Du kan se två side-by-side-klipp av Barack Obama. Den till vänster är källan för ljud, och den till höger är från ett helt annat tal, med forskarnas algoritmer använder för att ympa in nya mun former på film. Den resulterande videon är inte perfekt (Obamas mun rörelser är lite suddiga — ett vanligt problem med AI-generated imagery) men överlag är det ganska övertygande.

Forskarna sade att de används för Obama som ett test som är föremål för detta arbete på grund av hög kvalitet videofilmer av den tidigare ordföranden är god, vilket gör att utbildning neurala nätverk lättare. Sjutton timmar av materialet som behövdes data för att spåra och upprepa hans mun rörelser, forskare Ira Kemelmacher berättade Gränsen via e-post, men i framtiden kommer denna utbildning tvång kan reduceras till bara en timme.