Nvidia ‘ s prachtige vervalsingen pak de zwarte doos van AI

0
101

Nul

Wat zijn neurale netwerken eigenlijk aan het doen?

Dat is de vraag van de “black box” van AI dat is veel besproken in de afgelopen jaren. Deze week, de machine learning wetenschappers van Nvidia rapport enige vooruitgang geboekt in het begrijpen van wat er gaande is.

In een bravoure tonen van valse afbeeldingen van het gezicht, de onderzoekers beweren een nieuwe manier om te scheiden van de aspecten van de foto ‘ s die de neurale net “ziet” op een hoog niveau, zoals de oriëntatie van een object, en op een laag niveau, zoals details van de structuur.

De resultaten, weergegeven in een video gepost door het team, zijn enkele van de meest prachtige vervalsingen ooit opgeroepen door de nu bekende technieken van de “generatieve tegenspraak netwerken,” of GANs, een innovatie voor het eerst geïntroduceerd terug in 2014.

Ook: Nvidia AI-onderzoek wijst op een evolutie van de chip business

In de papier -, “Een Stijl-Generator op Basis van Architectuur voor Generatieve Tegenspraak Netwerken,” gepost op donderdag op het arXiv pre-print servers, Nvidia onderzoekers Tero Karras, Samuli Laine, en Timo Aila bouwen op het werk dat ze deden een jaar eerder het maken van nep-headshots met GANs.

De motivatie, uitgedrukt, is om greep te krijgen op wat GANs het doen zijn.

“De generatoren blijven functioneren als “zwarte dozen”,” schrijven ze, “en ondanks de recente inspanningen, het begrip van de verschillende aspecten van de afbeelding synthese proces […] ontbreekt nog.”

Als een resultaat, er is “geen kwantitatieve manier te vergelijken van verschillende generatoren tegen elkaar.”

3524fd21-91f5-4fe0-9da5-5fee7732f612.jpg

Nep-gezichten langs de bovenste rij geven “stijl” – functies die gecombineerd kunnen worden met de bron van vervalsingen in de linker kolom, het creëren van een breed scala van namaakgoederen in het midden van de afbeelding.

Nvidia Inc.

De kern van hun oplossing is voor het invoegen van een extra stuk in hun neurale netwerk die scheidt uit wat zij noemen “hoog-niveau” – kenmerken van gezichten, zoals de hoek van het hoofd, van low-level functies, zoals huidskleur.

Door dit te doen, de auteurs waren in staat om te trainen van het netwerk te maken zijn nieuwe beelden door het aanpassen van deze functies of eigenschappen, onafhankelijk van elkaar. Zij baseren de aanpak van de zogenaamde “style transfer,” een manier van het genereren van beelden die kunt een kopie van de borstel technieken van Vincent Van Gogh, zeggen, en wijst op een foto van een straatbeeld te maken van een nieuwe foto in de stijl van de kunstenaar.

Ook op: Facebook Oculus onderzoek ambachten vreemde mashup van John Oliver en Stephen Colbert

Met behulp van een techniek genaamd “adaptive aanleg normalisatie,” of “AdaIN,” vorig jaar geïntroduceerd door de Cornell University onderzoekers Xun Huang Serge Belongie, de high-level en low-level functies kunnen gehaald worden uit elke afbeelding om een stijl te maken.

De Nvidia team toegevoegd een twist: ze kan manipuleren van de verschillende niveaus van functies op hoog niveau te laag niveau vrij, een veel flexibeler manier om de mix en overeenkomen met de eigenschappen van de gezichten van de grootte van het hoofd naar beneden naar de sproeten.

Door het afstemmen van de beelden op een zodanige manier dat de theoretische implicaties het is duidelijker wat het netwerk doet op elk exemplaar van het proces, een soort van venster in de bediening.

De praktische uitwerking is de mogelijkheid om snel, moeiteloos “morph” nep headshots door het aanpassen van besturingselementen in software zo gemakkelijk als je zou veranderen van de kleur van een foto in Photoshop, waarin je kunt zien gedemonstreerd in de video.

Moet lezen

‘AI is heel, heel stom,’ zegt Google AI leider (CNET)Baidu maakt Kunlun silicium voor AIUnified Google AI afdeling een duidelijk signaal van AI ‘ s toekomst (TechRepublic

Een opvallende extra ontdekking is, dat de GAN ze gemaakt, werkt nu aan een veel minder informatie dan in het verleden fakes. In plaats moeizaam “mapping” van pixels van een afbeelding naar een andere overbrengen stijlen, het gebruik van alleen de stijl signalen die hij krijgt van de AdaIN.

Als de auteurs schrijven, “We vinden het heel opvallend dat de synthese netwerk is in staat tot het produceren van zinvolle resultaten, zelfs al krijgt input alleen in de stijlen die de controle van de AdaIN operaties.”

Denk aan de Mr. Potato Head van headshots. Fakes zal nooit meer hetzelfde zijn.

Vorige en aanverwante dekking:

Wat is AI? Alles wat je moet weten

Een executive gids voor kunstmatige intelligentie, van machine learning en algemene AI-neurale netwerken.

Wat is diep leren? Alles wat je moet weten

De lowdown op diep leren: van hoe het zich verhoudt tot het bredere veld van machine-leren door te zien hoe aan de slag met het.

Wat is machine learning? Alles wat je moet weten

In deze gids wordt uitgelegd wat ‘machine learning’ is, hoe het is in verband met kunstmatige intelligentie, hoe het werkt en waarom het belangrijk is.

Wat is cloud computing? Alles wat u moet weten over

Een introductie van cloud computing recht vanaf de basis tot IaaS en PaaS -, hybride -, public en private cloud.

Verwante Onderwerpen:

Ontwikkelaar

Digitale Transformatie

CXO

Het Internet van Dingen

Innovatie

Enterprise Software

0