Facebook Oculus forskning håndværk mærkelige mashup af John Oliver og Stephen Colbert

0
87

Nul

En tråd af den seneste kunstig intelligens genoplivning er crafting forfalskninger, at se ud og lyde overbevisende fast, sådan som gengivelser af malerier af berømte kunstnere.

Forskere på Facebook er Oculus research lab, og kolleger på Carnegie Mellon, har udviklet neurale netværk, som skaber falske videoer, der viser, hvad det ville være ligesom hvis en person, der talte på den måde, af en anden person, eller videoer fra en overskyet dag på et sted, hvor der var faktisk klar himmel i virkeligheden.

Produktet af alle disse er videoer, der kan være foruroligende eller spændende, afhængigt af dit perspektiv: Komiker John Oliver ‘s oprindelige monolog kan gøres for at udforme en ny, falsk sekvens af video af kolleger komiker Stephen Colbert, oversætte Oliver’ s udtryk og manerer på den afbillede af Colbert.

Også: Se YouTube-videoer, en dag kan lade robotter kopiere mennesker

Det fænomen, der er kendt som “retargeting,” er blevet undersøgt for år, primært med still-billeder. Den nye forskning, der lover at forfine visuelle forfalskninger ved at ansætte flere af de spor, der er fastsat af det øjeblik-til-øjeblik, skift af billeder i en video.

Det papir, Recyle-GAN: uden opsyn Video Retargeting, der er bogført på arXiv pre-print server, og blev fremlagt ved 15th European Conference on Computer Vision i sidste måned. Det er forfattet af Aayush Bansal og Deva Ramanan af Carnegie Mellon, og Shugao Ma og Yaser Sheikh af Facebook ‘ s Oculus Forskning i Pittsburgh.

En webside for det arbejde, der har en masse eksempler på videoer, der er blevet omdannet til nye versioner, herunder Oliver-Colbert mash up, og dem med Barack Obama ‘s taler kontrol billeder i en video med Præsident Donald Trump’ s skikkelse, og vice versa. Hver politiker er lavet for at efterabe de andre øjet og bevægelser, mund bevægelser, blik, udtryk, etc. Der er også landskaber, hvor en brise er blevet kunstigt skabt i en scene af en rolig dag ved at kopiere vinden mønstre i en original video.

Forfatterne påpeger, at en sådan omlægning af bevægelser kunne være en fordel i avatarer for virtual reality: Eksisterende metoder har kæmpet for at opbygge avatarer, når funktioner af ansigter er tilstoppet, de bemærker, og de ekstra oplysninger i den tidsmæssige rækkefølge af billeder i en video kan få omkring disse hindringer. Der synes at, i hvert fald delvist forklare den forbindelse til Facebook ‘ s Oculus enhed.

Den dybe læring-netværket gør brug af såkaldte generative kontradiktorisk netværk, eller GANs, hvor et system af ligninger, der kaldes en generator, skal omdanne video rammer for at syntetisere nogle nye rammer, og endnu et system af ligninger, diskriminatoren, er at forsøge at fortælle om de falske fra de oprindelige. De to konkurrere med forfalskning og efterforskning, som falskmøntnere og politiet, indtil generatoren bliver så god til at snyde med video frames, at den forskel ikke kan skelne dem fra den virkelige ting.

facebook-recycle-gan.png

Forskere ved Carnegie Mellon og Facebook havde en machine learning neurale netværk tilpasse stil komiker John Oliver til at skabe en ny, falsk video af Stephen Colbert, der taler med fagter og manerer af Oliver.

Forskerne byggede på en August forskning papir fra UC Berkeley forskere kaldes Cyklus-GAN. At arbejde lige forvandlet billeder. Det centrale begreb, som en “cyklus” betyder, at det originale billede kan inddrives fra den falske, på samme måde som en oversættelse fra engelsk til fransk af en computer skal kunne derefter give den oprindelige sætning, når de bliver oversat tilbage fra fransk til engelsk. Dette papir tilføjer en viden om, hvordan et billede af et ansigt eller et landskab eller en blomst ændringer fra den ene ramme til den anden.

Forfatterne mener, de er bedre oversættelse fra den ene ting til den anden, ved at tilføje flere “begrænsninger” til problemet. Som de skriver, “der er mange naturlige visuelle signaler er i sig selv spatiotemporal i naturen, som giver en stærk tidsmæssige begrænsninger for gratis. Dette resulterer i en væsentligt bedre tilknytninger.”

Også: Google AI forskere finder mærkeligt ny grund til at spille Jeopardy!

Resultaterne af undersøgelsen tyder på, at de forfattere, der tilføjer, temporal data forbedrer fakery. De havde 15 forsøgspersoner kig på de videoer, de har skabt, og siger, om de var ægte eller falsk. Næsten en tredjedel af den tid, 28 procent, mennesker fejlagtigt dømt en falsk video, der er oprettet med denne nye tilgang som værende ægte, hvorimod det med videoer, der blev oprettet med den foregående Cyklus-GAN-teknologi, blev de først narre om 7,3 procent af tiden.

Et af resultaterne af sådanne blændværk kunne være meget mere falske ting. Som de raffinere den neurale net, bemærker forfatterne, at de bedre kan tilnærme den “stil” i en video i en ny falske video-ting, som cadence af en højttaler påtrykt på en anden. “Hjælp spatiotemporal generative modeller,” som de skriver, “vil gøre det muligt at lære selv hastigheden af genererede output. E. g. To mennesker kan have forskellige måder for levering af indhold, og at en person kan tage længere tid end andre til at sige den samme ting.”

Også: Facebook er virkeligheden-brikker tog AI til at opdage “dybt falske” videoer

De forfattere, med glæde, at præsentere en af deres fejl, altid en forfriskende ingrediens. De fandt en video af en fugl og kortlagt det til en video af en animeret fugl i origami-format. Den falske video mislykkes, når den ægte fugl flyver ud af sin aborre og ud af scenen. Den falske origami fugl, som oprindeligt gik derfra, men så er det uhensigtsmæssigt fløj tilbage. Forfatterne skriver, at deres neurale net er der problemer der beskæftiger sig med den fuldstændige mangel på fuglen. “Vores algoritme er ikke i stand til at gøre overgangen af foreningen, når den ægte fugl er helt usynlig, og så er det genereret en tilfældig flyvende origami,” de indgår.

Tidligere og relaterede dækning:

Hvad er AI? Alt, hvad du behøver at vide

En executive guide til kunstig intelligens, fra machine learning og generelt AI til neurale netværk.

Hvad er dyb læring? Alt, hvad du behøver at vide

Den lowdown på en dyb læring: fra hvordan det relaterer til det bredere felt af machine learning igennem til, hvordan du kommer i gang med det.

Hvad er machine learning? Alt, hvad du behøver at vide

Denne vejledning forklarer, hvad machine learning er, hvordan det er relateret til kunstig intelligens, hvordan det fungerer, og hvorfor det er vigtigt.

Hvad er cloud computing? Alt, hvad du behøver at vide om

En introduktion til cloud computing-lige fra det grundlæggende op til IaaS og PaaS, hybrid, offentlige og private cloud.

Relaterede historier:

Der er ingen rolle for AI eller data videnskab: dette er et team effortStartup Slægt bringer splint af håb for AI i roboticsAI: udsigt fra Chief Data Videnskab OfficeSalesforce introer Einstein Stemme, en AI stemme assistent for enterprisesIt er ikke er de job, AI er ødelæggende for at genere mig, det er dem, der er growingHow Facebook skalaer AIGoogle Duplex bekymrer mig, CNET, Hvordan Google Hjem er bedre end Amazon Echo CNET

Relaterede Emner:

Virtuel Virkelighed

Digital Transformation

CXO

Tingenes Internet

Innovation

Virksomhedens Software

0