MIT banebrydende i AI med ‘dybe’ at strikke, ja, strikning

0
109

MIT ‘ s Cheetah 3 robotten navigerer ujævnt terræn uden syn
Den nyeste version af MIT ‘ s Cheetah robot, the Cheetah 3, er designet til at bevæge sig over ujævnt terræn og gennem forhindringer uden at være afhængige af vision. Læs mere: https://zd.net/2MUnFiq

En hot tendens i kunstig intelligens i de seneste år har været stigende imponerende forfalskninger — falske headshots, falske videoer, falske tekst. Dybt at lære teknikker, en del af machine learning, har fået bedre og bedre til at tage virkelige data og bruge det til at gøre noget kunstigt, såsom et billede, virker utroligt overbevisende.

Forskere ved Massachusetts Institute of Technology mandag annoncerede en AI-tilgang, som går i den modsatte retning: det tager noget fast og gør det kunstige. Ansøgningen er noget overraskende, strikkede beklædningsgenstande, der skal gengives. Systemet undersøgelser et billede af en beklædningsgenstand og beregner en række af sting til at give en automatiseret strikkemaskine.

Under den besynderlige titel, “Neurale Inverse Strikning: Fra Billeder til Fremstilling af Vejledningen,” det papir, der beskriver, hvordan man kan tage billeder af strik og bruge convolutional neurale netværk, eller CNNs, og en generativ kontradiktorisk netværk, eller GAN, til at producere en plantegning eller blueprint, der angiver, på hvert enkelt punkt i en beklædningsgenstand, som sytten forskellige stingtyper, der skal anvendes. Det papir, der er forfattet af Alexandre Kaspar, Tae-Hyun Oh, Liane Makatura, Petr Kellnhofer, og Wojciech Matusik af MIT.

Den forskning, der er offentliggjort i forbindelse med en anden artikel, “Strikning Skeletter: En Computer-Aided Design Værktøj til at Forme og Mønster af Strikkede Beklædningsgenstande,” i, som Kaspar, Makatura, og Matusik indføre et program til nemt at lægge ud sømme til en klædning.

mit-neural-knitting-data-set-examples.png

Den dybe strikke-rørledningen, fra den virkelige verden, billeder af tøj og ground truth etiketter af masker, til venstre, til at udlede sømme, der er produceret af nettet, på højre.

MIT

Ideen med det andet papir, der er et software-værktøj, der gør det super nemt for en person, der har nogen erfaring med at strikke til at producere instruktioner for en automatiseret strikkemaskine. Automatiseret strikkemaskiner har spredt sig, så som systemer af Shima Seiki. Men de kræver typisk nogle domæne ekspertise til programmet, så Kaspar og kolleger ønskede at tilbyder en måde for nybegyndere at komme i gang ved at forenkle design pipeline. Det er lidt ligesom, hvad der er sket med “additiv fremstilling,” hvor folk kan uploade deres design til en 3-D printer i skyen. Her, MIT forfattere ønsker at fremme “strikning som en service”, som de kalder det.

Det hjælper til at undgå “maskine kodning” af de strikker, men det efterlader stadig masser af arbejde at specificere alle de sting i en beklædningsgenstand. Og det er her, det bliver interessant for machine learning. De kom op med en algoritme til automatisk at producere et mønster af maskine-forståelige sting.

Også: Nvidia ‘ s fremragende forfalskninger pak black box af AI

“I løbet af sin drift, en hel tøjet strikkemaskine udfører en brugerdefineret lavt niveau program til at fremstille hver tekstil-objekt,” forklarer i “Neurale Inverse at Strikke.”

“Typisk, at generere den kode, der svarer til hvert design er en vanskelig og langsommelig proces, der kræver ekspertviden.”

mit-the-deep-knitting-pipeline.png

Det neurale inverse strikke netværk, med et “- raffinaderi”, der kombinerer real fotos og syntetiske billeder af tøj, og en program-generator, der udgange maskinlæsbar sy anvisninger.

MIT

Der er derfor behov for at bruge machine learning til at udvikle en evne til at finde ud af en sådan maskine instruktioner, der automatisk starter fra en prøve tøjet, hvad man kunne kalde “computational at strikke.”

Som beskrevet i en artikel indeholdende supplerende materialer, neurale netværk til at beregne to forskellige ting: det er at beregne først en ideel repræsentation af tøjet i spørgsmålet, og så er det nødvendigt at beregne de sting, der er involveret.

For den første del, den neurale net er fodret to typer af prøver, reelle billeder af strikkede beklædningsgenstande, som forfatterne strikket fra bunden og derefter fotograferet, og syntetiseret billeder af tøj, der blev genereret af deres design og software. Sidstnævnte, den syntetiske billeder, er renere end den virkelige verden med billeder, og så de kommer til at blive brugt til at rydde op, i en vis forstand, real-world images.

Også: MIT ups ante i at få en AI til at undervise en anden

En “smelter” – modul, ved hjælp af en generativ kontradiktorisk netværk, eller GAN, sammensmelter den virkelige og syntetiseret billeder, og rydder op i den virkelige billeder ved at omdanne dem i henhold til den idealiserede, legaliseret syntetiske billeder af strik mønstre.

Som forfatterne beskriver det, de er at vende den typiske brug af GANs, som forsøger at “kort” noget falsk til noget reelt, for at producere en overbevisende faksimile. Her er, at de i stedet ønsker at forenkle og tydeliggøre messiness af den virkelige verden med noget, der simuleres.

“De tidligere metoder har undersøgt skabe realistiske billeder,” skriver de. “Vi i stedet lære at neutralisere den virkelige verden forstyrrelse af kortlægning af reelle data til syntetiske kigger data.” Gennem en ablation undersøgelsen, at de viser, at den blanding af ægte og syntetiske billeder er bedre, når design og de sting, der er involveret i forhold til bare at bruge rigtige billeder af strik elementer.

mit-making-knit-images-for-ground-truth.png

Forfatterne strikket nogle prøver fra bunden og strakte dem på metal stænger, så de kunne fotografere dem til at bygge et datasæt af den virkelige verden billeder til at træne det neurale netværk.

MIT

Den anden del, kaldet “Img2Prog,” er anvendt til at udlede de sting fra den blanding af ægte og syntetiske billeder. Begge sæt af billeder, der er mærket med et “ground truth” – tag, der angiver, hvilken af 17 stitch mønstre, der ses på billedet. Ved at optimere den “cross-entropi” tab mellem jorden sandheden etiketter og output af de neurale netværk neurale net beregner de statistiske mønster af 17 forskellige sømme, der er repræsenteret i tusindvis af eksempel billeder.

Relaterede Emner:

Udvikler

Digital Transformation

CXO

Tingenes Internet

Innovation

Virksomhedens Software