Nvidia GauGAN tar grova skisser och skapar foto-realistiska ” landskap bilder

0
215
nvidia-gaugan-scenes.png

(Bild: Nvidia)

Forskare vid Nvidia har skapat en ny generativ kontradiktoriska nätverk modell för att producera realistiska landskap bilder från en grov skiss eller segmentering karta, och även om det inte är perfekt, det är verkligen ett steg mot att tillåta människor att skapa sina egna syntetiska landskap.

Den GauGAN modellen är ursprungligen tippad som ett verktyg för att hjälpa stadsplanerare, game designers och arkitekter, och snabbt skapa syntetiska bilder. Modellen har tränat på över en miljon bilder, inklusive 41,000 från Flickr, med forskare och konstaterar att det fungerar som ett “smart pensel” som den fyller i detaljerna på en skiss.

“Det är som en målarbok bild som beskriver där ett träd, där solen är, där är himlen,” Nvidia vice president of applied djupt lärande forskning Bryan Catanzaro sagt. “Och då neurala nätverk är att kunna fylla i alla detaljer och struktur, och de reflektioner, skuggor och färger, baserat på vad den har lärt sig om verkliga bilder.”

I en demonstration till journalister på sin GTC konferens på måndag, den visade forskare GauGAN i aktion, och hur det kunde återge bilder i realtid, byta styling mellan olika årstider, och hur vattnet kommer till uttryck och samverkade med landskapet.

Maskinen som används för uppgiften innehöll en nyligen släppt Titan RTX, men Catanzaro sa att det kunde vara möjligt att köra samma program på en CPU om återgivning av bilden var begränsad till en gång i några sekunder, eller skapas on-demand.

Måste läsa

Nvidia tåg oskyldiga AI för att rengöra vattenstämplar av foton (CNET)Nya NVIDIA-chip kan göra det möjligt för AI och robotik i fler branscher (TechRepublic)

“Denna teknik är inte bara att sy ihop bitarna av andra bilder, eller klippa och klistra texturer,” Catanzaro sagt. “Det är faktiskt syntes av nya bilder, mycket likt hur en konstnär skulle rita något.”

I en forskningsrapport som presenteras som en muntlig presentation vid CVPR-konferensen i juni, forskarna sade att använda mänskliga testning via Mechanical Turk visade sina bilder var att föredra till de som genereras av CRN, pix2pixHD, och SIMS algoritmer, även om de i kategorin av stadsbilder, det knappt slå ut de två sistnämnda teknikerna. Jämfört med andra algoritmer, Catanzaro sade GauGAN hade ett bättre ordförråd, och det krävs färre parametrar.

I slutet av 2018, ett team av forskare, bland annat Catanzaro fram ett papper på att förutsäga framtiden bildrutor för syntetiskt stadens scener.

Nvidia också används för generativ kontradiktoriska nätverk för att skapa artificiell hjärna MRI-bilder, för att hjälpa till att övervinna bristen på hjärnans föreställningsförmåga till att nätverk tåg på.

Mångfald är avgörande för framgång när du tränar neurala nätverk, men medicinska data är vanligen obalanserad,” Hoo Chang Shin, senior forskare vid Nvidia, förklarade ZDNet i September. “Det finns så många mer normala fall än onormala fall, när onormala fall är vad vi bryr oss om, för att försöka upptäcka och diagnostisera.”

Upplysningar: Chris Duckett reste till GTC som en gäst av Nvidia.

Relaterade Täckning

Nvidia: s köp av Mellanox dyker upp värmen på Intel rivalitet, data center ambitioner

Nvidias sek 6,9 miljarder inköp av Mellanox belyser företagets satsning på att nästa generations datacenter arkitektur kommer att kretsa kring data och artificiell intelligens.

Dell EMC, Nvidia göra AI-referens arkitektur

AI är på väg att bli en kritisk belastning för företag och lagring jättar rullar ut byggstenar för att bygga ut maskinen lärande och AI arbetsbelastning.

Kinas AI-forskare undervisar ett neuralt nät för att utbilda sig

Forskare vid Kinas Sun Yat-Sen University, med hjälp från Kinesiska start SenseTime, förbättras deras egna försök att få en dator att urskilja mänskliga utgör i bilder genom att lägga till lite själv-övervakad träning. Arbetet föreslår fortsatta insatser för att begränsa beroendet av mänskliga etiketter och “ground truth” i AI.

CES 2019: Nvidia: s nya GeForce RTX 2060 är bara $349

Inför CES Nvidia tillkännagav även att 40 nya modeller av bärbara datorer från alla större OEM-kommer att innehålla RTX Grafikprocessorer.

NVIDIAS nya Turing arkitektur kan göra livet mycket lättare för video producenter (TechRepublic)

Den nya chipset har realtids-ray tracing kapacitet, vilket skulle kunna skära ner timmar av arbete för kreativa proffs.

Lathund: TensorFlow, ett open source-bibliotek för maskininlärning (TechRepublic)

TensorFlow är en programvara med öppen källkod bibliotek utvecklat av Google för numerisk beräkning med data flöde grafer. Detta TensorFlow guide täcker varför biblioteket frågor, hur man använder det, och mycket mer.

Varför det kan snart bli mycket lättare att få tag på NVIDIA GPUs (TechRepublic)

Den cryptocurrency efterfrågan håller på att dö ut, som NVIDIA föll under Wall Street mål.

Relaterade Ämnen:

Artificiell Intelligens

CXO

Digital Omvandling

Tech-Industrin

Smarta Städer

Cloud