Nvidia forskere gør det lettere at træne robotter til at afhente ting

0
125

Nul

baxter.png

I stigende grad robotter arbejder sammen med mennesker. Disse robotter, dog ikke håndtere ændringer i deres miljø meget godt. Hvis et objekt er af sted, kan det blive svært for en robot til at identificere og manipulere det pågældende objekt.

At finde og afhente et objekt i den virkelige verden-også selvom det er malplaceret — en robot har brug for en computer vision algoritme, der kan identificere 3D position og orientering af et objekt i en scene — hvad der er kendt som ” 6-DoF (degrees of freedom) udgør.”

Forskere har arbejdet på i et stykke tid for at løse denne udfordring, men uddannelse af disse algoritmer er stadig svært. I denne uge på Konferencen om Robot Læring i Zürich, et team af Nvidia forskere er med til at præsentere en ny dyb læring-baseret system, der kan tilbyde en løsning.

Ved at træne deres computer vision algoritme med syntetiske billeder, de har formået at omgå den komplekse arbejdskrævende proces for udarbejdelsen af fotografiske billeder, der er for uddannelse. På toppen af det, ved hjælp af en unik kombination af syntetiske billeder, Nvidia team har trænet en algoritme, der kan faktisk bedre end et netværk, der er uddannet på rigtige billeder.

Det er første gang, at en algoritme er uddannet kun med syntetiske data, der har været i stand til at slå et netværk uddannet på rigtige billeder til objekt udgør skøn på flere objekter på en standard-benchmark. Dette vil gøre træning algoritmer for robotter meget nemmere.

“Med syntetiske data, kan vi generere en næsten uendelig mængde med etiketter, der kommer væsentlige for gratis,” Stan Birchfield, en ledende robotteknologi forsker ved Nvidia, forklarede til ZDNet.

“I sidste ende er, hvad vi forsøger at gøre, er at gøre det muligt for en person at lære en robot, en ny opgave i en kort periode,” Birchfield sagde. Dette vil frigøre potentialet for robotter til at hjælpe mennesker i en række indstillinger, herunder fabrikker, hjem eller sundhedspleje faciliteter.

Mere arbejde er nødvendigt i dette rum på grund af arten af computer vision forskning. Mens forskere har gjort betydelige fremskridt på dette område, de typisk teste deres algoritmer mod fast datasæt.

“Denne metode ikke altid udslag i den virkelige verden og den sammenhæng, af en robot system,” Birchfield sagde. “Vi viser et system, der ikke kun viser god kvantitative resultater på et bestemt datasæt, men virker også i forbindelse med robotteknologi system.”

Nvidia team kan montere en standard RGB-kamera til en robot, og brugt den algoritme, der gør det muligt for robotten at se, pick-up, til billeder og flytte billeder.

De forskere, der er uddannet netværket ved hjælp af Nvidia Tesla V100-Gpu ‘ er på en DGX-Station, med cuDNN-accelereret PyTorch dybt. De brugte en custom plugin, der er udviklet af Nvidia til Unreal-Motor til at generere de syntetiske data.

I fortiden, syntetiske data var for utilstrækkelige til træning computer vision algoritmer fordi computer-genererede billeder simpelthen ikke se virkelige.

“Den tendens, indtil for nylig, om et år eller så, var at forsøge at skabe billeder, der så mere og mere realistiske,” Birchfield forklaret. “Problemet er, at forskerne fandt ud af, var, at for at gøre billederne mere realistiske, at de var nødt til at ansætte kunstnere og var nødt til at tilbringe masser af tid, når du udformer scener til at se præcis som i den virkelige verden. Der har reduceret mængden af sort-du kunne modellen et bestemt rum, men ikke en bred vifte af værelser.”

Jo mere variation, jo bedre uddannet algoritmen er.

Sidste år, at forskere begyndte at ofre nogle fotorealisme til fordel for sort med “domæne randomiseret” sæt uddannelse billeder-dem, hvor de parametre, der anvendes til at generere de billeder, der er varieret. For eksempel, Birchfield sagde: “belysningen er randomiseret, — der er nogle lys, billeder, nogle mørke billeder… De objekter, der er placeret i nonrealistic måder, som objekter, der bare flyder i rummet.”

Nvidia holdet nåede deres gennembrud ved hjælp af en kombination af ikke-fotorealistiske domæne randomiserede data og fotorealistiske data til at udnytte styrkerne i både.

“Vores håb er, at andre forskere vil finde denne teknik nyttige for deres forskning,” Birchfield sagde.

Relaterede Emner:

Robotteknologi

Digital Transformation

CXO

Tingenes Internet

Innovation

Virksomhedens Software

0