Nvidia ‘ s fremragende forfalskninger pak black box af AI

0
67

Nul

Hvad er neurale netværk, der rent faktisk gør?

Det er spørgsmålet om den “black box” af AI, der har været meget debatteret i de seneste år. I denne uge, machine learning forskere på Nvidia rapport nogle fremskridt i forståelsen af, hvad der foregår.

I en bravour visning af falske facial billeder, forskerne hævder en ny måde at adskille de aspekter af billeder, at det neurale net “ser” på et højt niveau, såsom orientering af et objekt, og på et lavt niveau, såsom oplysninger om tekstur.

De resultater, der er vist i en video indsendt af holdet, er nogle af de mest fantastiske forfalskninger nogensinde har tryllet med den nu velkendte teknikker af “generativ kontradiktorisk netværk,” eller GANs, som er en nyskabelse først introduceret tilbage i 2014.

Også: Nvidia AI forskning peger på en udvikling af chip forretning

I papiret”, En Stil-Baseret Generator Arkitektur for Generativ Kontradiktorisk Netværk,” udgivet torsdag på arXiv pre-print-servere, Nvidia forskere Tero Karras, Samuli Laine, og Timo Aila bygge på det arbejde, de gjorde for et år tidligere, hvilket gør falske headshots med GANs.

Den motivation, der er udtrykt i front, er at få styr på, hvad GANs gør.

“Det generatorer fortsætte med at fungere som en “black box”,”, skriver de, “og på trods af den seneste indsats, forståelse af forskellige aspekter af billedet syntese processen […] mangler stadig.”

Som et resultat, at der er “ingen kvantitativ måde at sammenligne forskellige generatorer mod hinanden.”

3524fd21-91f5-4fe0-9da5-5fee7732f612.jpg

Falske ansigter langs den øverste række give “style” – funktioner, som kan kombineres med kilde forfalskninger i den venstre kolonne, at skabe en bred vifte af forfalskninger i midten af billedet.

Nvidia Inc.

Det centrale i deres løsning er at indsætte et ekstra stykke ind i deres neurale netværk, der adskiller sig, hvad de kalder “high-level” funktioner af ansigter, sådan som den vinkel på hovedet, fra lav-niveau funktioner, såsom hud tone.

Ved at gøre således forfattere var i stand til at træne netværket til at skabe sin nye billeder ved at justere disse funktioner eller egenskaber, uafhængigt af hinanden. De bygger tilgangen på noget, der hedder “style overførsel,” en måde at skabe billeder, der kan kopiere børste teknikker af Vincent Van Gogh, sige, og kort det på et foto af en gade scene for at oprette et nyt billede i stil med kunstneren.

Også: Facebook Oculus forskning håndværk mærkelige mashup af John Oliver og Stephen Colbert

Ved hjælp af en teknik kaldet “adaptive eksempel normalisering” eller “AdaIN”, der blev indført sidste år af Cornell University forskere Xun Huang Serge Belongie, det høje niveau og et lavt niveau funktioner, der kan udvindes fra hvert billede til at skabe en stil.

Nvidia team tilføjet et twist: de kan manipulere de forskellige niveauer af funktioner, høj-niveau til et lavt niveau frit, en meget mere smidig måde at mikse og matche egenskaberne af de ansigter, fra hoved størrelse på ned til fregner.

Ved at tune de billeder, på en sådan måde, at den teoretiske implikationer, det er tydeligere, hvad netværket gør i hvert enkelt tilfælde i sin proces, en slags vindue til sin drift.

Den praktiske virkning er evnen til hurtigt, ubesværet “morph” falske hovedskud ved at justere kontrol i software så nemt, som du vil ændre farven på et billede i Photoshop, hvor du kan se demonstreret i videoen.

Skal læse

“AI er meget, meget dum, “siger Google’ s AI-leder (CNET)Baidu skaber Kunlun silicium til AIUnified Google AI division et klart signal om, at AI ‘ s fremtid (TechRepublic

En slående yderligere opdagelse er, at GAN skabte de arbejder nu på at langt færre oplysninger end tidligere forfalskninger. Snarere end møjsommeligt “mapping” fra pixels i et billede til en anden for at overføre stilarter, det er at bruge kun den stil cues, som kommer fra AdaIN.

Som forfatterne skriver, “Vi finder det ganske bemærkelsesværdigt, at syntese-netværk er i stand til at producere meningsfulde resultater, selvom det modtager input kun gennem de typografier, der styrer AdaIN operationer.”

Tænk på det som Mr. Potato Head af headshots. Forfalskninger vil aldrig blive den samme igen.

Tidligere og relaterede dækning:

Hvad er AI? Alt, hvad du behøver at vide

En executive guide til kunstig intelligens, fra machine learning og generelt AI til neurale netværk.

Hvad er dyb læring? Alt, hvad du behøver at vide

Den lowdown på en dyb læring: fra hvordan det relaterer til det bredere felt af machine learning igennem til, hvordan du kommer i gang med det.

Hvad er machine learning? Alt, hvad du behøver at vide

Denne vejledning forklarer, hvad machine learning er, hvordan det er relateret til kunstig intelligens, hvordan det fungerer, og hvorfor det er vigtigt.

Hvad er cloud computing? Alt, hvad du behøver at vide om

En introduktion til cloud computing-lige fra det grundlæggende op til IaaS og PaaS, hybrid, offentlige og private cloud.

Relaterede Emner:

Udvikler

Digital Transformation

CXO

Tingenes Internet

Innovation

Virksomhedens Software

0