
Underholdningsindustrien har ennå ikke regulert bruken av deepfakes og stemmekloning.
Bilde: photoworldwide/Getty Images
29. september gikk Emmy for interaktiv dokumentar til 'In Event of Moon Disaster' , en film som bruker kunstig intelligens (AI) for å lage en falsk video med USAs tidligere president Richard Nixon. Filmen viser ham holde en tale som ble forberedt i tilfelle Apollo 11 -oppdraget mislyktes, og lot astronautene Neil Armstrong og Buzz Aldrin dø på månen.
Multimediaprosjektet ble opprettet av Massachusetts Institute of Technologys Center for Advanced Virtuality, med litt hjelp fra en ukrainsk oppstart av stemmekloning, Respeecher, som jobbet med Nixons stemme.
Deretter, ved hjelp av et dypt nevrale nett, sluttet Respeechers ingeniører seg til de to, og la Nixons vokaltømmer på toppen av skuespillerens opptreden, og skapte dermed et dypt falsk lydopptak. For alle som lytter, høres den syntetiske stemmen naturlig ut, og den kan ikke skilles fra originalen.
SE: Rapporten finner en oppsiktsvekkende uinteresse i etisk, ansvarlig bruk av AI blant bedriftsledere
For å oppnå dette kvalitetsnivået trengte teamet til Serdiuk flere timer med innspilling fra både Nixon og skuespilleren. Nå har de forbedret teknologien sin, og prosessen er mer grei.
“Vi ber vanligvis om 60 minutter med taleopptak for mål- og kilde stemmer,” sier han. «I mange prosjekter hadde vi mindre data eller dårligere data, så vi vet hvordan vi skal jobbe med alle data.»
I motsetning til tekst-til-tale-konverteringer, som ofte høres kunstige ut, hjelper Respeechers teknologi å bevare følelser. “Målet vårt var å gjøre kvaliteten på det nivået der det ville være tilfredsstillende for høyt etterspurte lydprofesjonelle i Hollywood,” sier Serdiuk.
Respeecher sysselsetter for tiden rundt 20 eksperter og har profilerte klienter som Lucasfilm på bøkene sine. Oppstarten har jobbet med flere banebrytende prosjekter de siste årene. For eksempel har den gjenskapt Michael Yorks stemme, slik at han kan snakke om sin sjeldne sykdom, amyloidose.
“Det var et veldig kult prosjekt når det gjelder å bruke teknologien for noen hvis stemme er borte, som ikke kan bruke denne stemmen lenger,” sier Serdiuk. Teamet hans brakte tilbake en annen ikonisk stemme, den til avdøde amerikanske fotballtrener Vince Lombardi, som sendte en oppmuntrende melding til de som sliter med pandemien under SuperBowl. I tillegg til det syntetiserte Respeecher også stemmen til den unge Luke Skywalker for den siste episoden av sesong to av Mandalorian.
Serdiuk er optimistisk og sa at hans lille studio i Kiev vil fortsette å bidra til blockbusters. : “Det tar tid å bygge troverdighet og omdømme i Hollywood. Men nå er vi i en posisjon hvor noen kule prosjekter kommer til oss fra jungeltelegrafen fordi noen mennesker i Hollywood bruker teknologien vår, og de deler denne opplevelsen med vennene sine og kolleger. “
Tale-til-tale-konverteringer kan være nyttige i et bredt spekter av prosjekter, fra videospill til filmer, fra lydbøker til telefonsenterassistenter. Respeecher kan etterligne konverteringer mellom mann og kvinne og mann til mann, og i fremtiden kan det til og med fungere for stemmedubbing på fremmedspråk.
Etiske spørsmål
Stemmekloning reiser en rekke etiske spørsmål, og noen synes teknologien er urovekkende. Dokumentaren 'Roadrunner: A Film About Anthony Bourdain' som dukket opp på kinoer om sommeren møtte kritikk etter at det ble avslørt at et segment av stemmen til den avdøde kokken ble opprettet ved hjelp av stemmekloningsteknologi. Bourdain skrev faktisk disse setningene, men det var ingen registrering av ham som leste dem.
Bruken av AI ble ikke signalisert til publikum. Det ble først avslørt da Morgan Neville nevnte det. Det er heller ikke klart om mannskapet fikk tillatelse fra Bourdains familie til å lage stemmen hans syntetisk.
Serdiuk sier at han og de to andre grunnleggerne har laget et sett med regler som både de og deres klienter bør følge. Respeecher gir ikke et offentlig API, og når den kloner en stemme, legger den til et lydvannmerke for å tillate deteksjon av spesialisert programvare. Også når en klient ønsker å klone noens stemme, trenger de skriftlig samtykke fra den personen eller deres familie.
“Etter min mening er det ikke noe nytt med denne teknologien som samfunnet vårt aldri har sett før,” sier Serdiuk. “Det er ikke annerledes enn Photoshop, ikke sant?”
Underholdningsindustrien har ennå ikke regulert dype forfalskninger, men Serdiuk mener reglene som teamet hans utviklet burde være obligatoriske, gitt at feilinformasjon på nettet kan bli mer utbredt. Den nylige Emmy-en hans team bidro til kan være et lite skritt i å øke bevisstheten om farene ved deepfakes.
“Vi bruker mye tid på å utdanne, fortelle om hva som er mulig, vise hva som er mulig,” sa han. “Og dette MIT -prosjektet med president Nixon er et godt eksempel på det.”
Innovasjon
2022 teknologiske trender: generativ AI, autonome systemer, hyperautomasjon og mer Intels automatiske feilsøkingsverktøy ControlFlag er nå åpen kildekode De beste robotstøvsugere i 2021: Roomba er ikke det eneste alternativet Hva er AI? Alt du trenger å vite
Relaterte emner:
Artificial Intelligence CXO Digital Transformation Tech Industry Smart Cities Cloud