Nixons uhørt månekatastrofe-tale er nu en advarsel om den dybe falske fremtid

0
130

 Andrada Fiscutean

Af Andrada Fiscutean | 21. oktober 2021 | Emne: Innovation

voice-cloing-ai-artificial-intelligence-robot -mannequin.jpg

Underholdningsindustrien har endnu ikke reguleret brugen af ​​deepfakes og stemmekloning.

Billede: photoworldwide/Getty Images

Den 29. september gik Emmy for interaktiv dokumentar til 'In Event of Moon Disaster' , en film, der bruger kunstig intelligens (AI) til at skabe en falsk video med den tidligere amerikanske præsident Richard Nixon. Filmen viser ham holde en tale, der blev forberedt, hvis Apollo 11 -missionen mislykkedes, og efterlod astronauterne Neil Armstrong og Buzz Aldrin at dø på månen.

Multimedieprojektet blev skabt af Massachusetts Institute of Technologys Center for Advanced Virtuality, med lidt hjælp fra en ukrainsk stemmekloningsstartup, Respeecher, som arbejdede på Nixons stemme.

Derefter sluttede Respeechers ingeniører ved hjælp af et dybt neuralt net de to og tilføjede Nixons vokalt tømmer oven på skuespillerens præstationer og skabte således en dybfalset lydoptagelse. For alle, der lytter, lyder den syntetiske stemme naturlig, og den kan ikke skelnes fra originalen.

SE: Rapporten finder opsigtsvækkende uinteresse i etisk, ansvarlig brug af AI blandt virksomhedsledere

For at opnå dette kvalitetsniveau havde Serdiuks team brug for flere timers optagelse fra både Nixon og skuespilleren. Nu har de forbedret deres teknologi, og processen er mere ligetil.

“Vi beder normalt om cirka 60 minutters taleoptagelser for mål- og kilde stemmer,” siger han. “I mange projekter havde vi færre data eller dårligere data, så vi ved, hvordan vi arbejder med alle data.”

I modsætning til tekst-til-tale-konverteringer, som ofte lyder kunstige, hjælper Respeechers teknologi med at bevare følelser. “Vores mål var at gøre kvaliteten på det niveau, hvor den ville være tilfredsstillende for højt efterspurgte lydprofessionelle i Hollywood,” siger Serdiuk.

Respeecher beskæftiger i øjeblikket omkring 20 eksperter og har højt profilerede klienter som Lucasfilm på deres bøger. Opstarten har arbejdet på flere banebrydende projekter i de sidste par år. For eksempel har det genskabt Michael Yorks stemme, så han kunne tale om sin sjældne sygdom, amyloidose.

“Det var et meget fedt projekt med hensyn til at bruge teknologien til en, hvis stemme er væk, som ikke længere kan bruge denne stemme,” siger Serdiuk. Hans hold bragte en anden ikonisk stemme tilbage, den afdøde amerikanske fodboldtræner Vince Lombardi, der sendte en opmuntrende besked til dem, der kæmpede med pandemien under SuperBowl. Ud over det syntetiserede Respeecher også stemmen til den unge Luke Skywalker i sidste afsnit af sæson to af Mandalorian.

Serdiuk er optimistisk og siger, at hans lille studie i Kiev fortsat vil bidrage til blockbusters : “Det tager tid at opbygge troværdighed og omdømme i Hollywood. Men nu er vi i en position, hvor der kommer nogle fede projekter fra mund til mund, fordi nogle mennesker i Hollywood bruger vores teknologi, og de deler denne oplevelse med deres venner og kolleger.”

Tale-til-tale-konverteringer kan være nyttige i en lang række projekter, lige fra videospil til film, fra lydbøger til callcenterassistenter. Respeecher kan efterligne konverteringer fra mand til kvinde og kvinde til mand, og i fremtiden kan det endda fungere til stemmedubbing på fremmedsprog.

Etiske spørgsmål

Stemmekloning rejser en række etiske spørgsmål, og nogle finder teknologien foruroligende. Dokumentaren 'Roadrunner: A Film About Anthony Bourdain', der dukkede op i biograferne i løbet af sommeren, blev udsat for kritik, efter at det blev afsløret, at et segment af den afdøde koks stemme blev skabt ved hjælp af stemmekloningsteknologi. Bourdain skrev faktisk disse sætninger, men der var ingen registrering af ham, der læste dem.

Brugen af ​​AI blev ikke signaleret til publikum. Det blev først afsløret, da Morgan Neville nævnte det. Det er heller ikke klart, om besætningen fik tilladelse fra Bourdains familie til at skabe sin stemme syntetisk.

Serdiuk siger, at han og de to andre medstiftere skabte et sæt regler, både de og deres kunder skulle følge. Respeecher leverer ikke en offentlig API, og hver gang den kloner en stemme, tilføjer den et lydvandmærke for at tillade detektion af specialiseret software. Når en klient også vil klone en persons stemme, har de brug for skriftligt samtykke fra denne person eller deres familie.

“Efter min mening er der ikke noget nyt ved denne teknologi, som vores samfund aldrig har set før,” siger Serdiuk. “Det er ikke anderledes end Photoshop, ikke?”

Underholdningsindustrien har endnu ikke reguleret deepfakes, men Serdiuk mener, at de regelsæt, hans team udviklede, burde være obligatoriske, da misinformation på nettet kan blive mere udbredt. Den nylige Emmy, hans team bidrog til, kan være et lille skridt i at øge bevidstheden om farerne ved deepfakes.

“Vi bruger meget tid på at uddanne, fortælle om hvad der er muligt, vise hvad der er muligt,” sagde han. “Og dette MIT -projekt med præsident Nixon er et godt eksempel på det.”

Innovation

2022 tech trends: generativ AI, autonome systemer, hyperautomation og mere Intels automatiske fejlfindingsværktøj ControlFlag er nu open source De bedste robotstøvsugere i 2021: Roomba er ikke din eneste mulighed Hvad er AI? Alt hvad du behøver at vide

Relaterede emner:

Kunstig intelligens CXO Digital Transformation Tech Industry Smart Cities Cloud  Andrada Fiscutean

Af Andrada Fiscutean | 21. oktober 2021 | Emne: Innovation