Noll

Allt, robotar att arbeta tillsammans med människor. Dessa robotar emellertid inte hantera förändringar i sin omgivning mycket bra. Om ett objekt är på sin plats, kan det bli svårt för en robot att identifiera och manipulera objekt.
Att hitta och plocka upp ett objekt i den verkliga världen-även om det är felplacerat — en robot behöver en dator vision algoritm som kan identifiera 3D-position och orientering av ett objekt i en scen — vad som är känt som ” 6-DoF (frihetsgrader) pose.”
Forskare har arbetat ett tag för att möta denna utmaning, men träning dessa algoritmer är fortfarande svårt. Denna vecka på Konferensen på Robot Lärande i Zürich, ett team av Nvidia forskare presenterar ett nytt djupt lärande-baserat system som kan erbjuda en lösning.
Genom att utbilda sin dator vision algoritm med syntetiska bilder, de har lyckats kringgå den komplexa, arbetsintensiv process för att förbereda fotografiska bilder för utbildning. På toppen av det, genom att använda en unik kombination av syntetiska bilder, Nvidia laget har tränat en algoritm som faktiskt kan överträffa ett nätverk utbildad på riktiga bilder.
Detta är första gången en algoritm tränade bara med syntetiska data har kunnat slå ett nätverk utbildad på verkliga bilder för objekt utgör uppskattning på flera objekt av ett riktmärke. Detta kommer att göra utbildningen algoritmer för robotar mycket lättare.
“Med syntetiska data, vi kan skapa en nästan oändlig mängd med etiketter som kommer i huvudsak gratis,” Stan Birchfield, en leda robotics forskare vid Nvidia, förklarade ZDNet.
“Slutligen, vad vi försöker göra är att göra det möjligt för en person att lära en robot till en ny uppgift i en kort period av tid,” Birchfield sagt. Detta kommer att frigöra den potential som finns för att robotar för att hjälpa människor i en mängd olika inställningar, till exempel fabriker, i hemmet eller vård.
Mer arbete behövs inom detta område på grund av arten av datorseende forskning. Medan forskare som har gjort betydande framsteg på detta område, de brukar testa sina algoritmer mot fasta uppsättningar data.
“Att metoden inte alltid kan omsättas i den verkliga världen och inom ramen för ett system robotteknik,” Birchfield sagt. “Vi visar ett system som inte bara visar sig vara bra kvantitativa resultaten på en viss uppsättning data, men också verk i samband med robotteknik system.”
Nvidia team kan montera en standard RGB-kamera till en robot och används algoritmen för att möjliggöra för roboten att se, plocka upp och flytta bilder.
De forskare som utbildats i nätverket med hjälp av Nvidia Tesla V100 Grafikprocessorer på en DGX-Station, med cuDNN-accelererade PyTorch djupt. De använde en egen plugin utvecklad av Nvidia för Unreal Motor för att generera syntetiska data.
I det förflutna, syntetiska data var otillräckliga för utbildning datorseende algoritmer för dator-genererade bilder helt enkelt inte se riktigt.
“Trend fram till nyligen, om ett år eller så, var att försöka att producera bilder som såg mer och mer realistisk,” Birchfield förklaras. “Problemet som forskarna fann var att för att göra bilderna mer realistiska, de fick hyra konstnärer och var tvungen att spendera massor av tid åt att utforma scener att se ut exakt som den riktiga världen. Att minska mängden mängd — du kunde modell ett visst rum, men inte en mängd olika rum.”
Den mer variation, bättre utbildade algoritmen.
Förra året, forskare började offra några fotorealism till förmån för sort med “domän randomiserade” uppsättningar av utbildning images-på vilka parametrar som används för att generera bilder är varierad. Till exempel, Birchfield sade, “belysning är randomiserade — det är några ljusa bilder, lite mörka bilder… De föremål som är placerade i nonrealistic sätt, liksom föremål som svävar i rymden.”
Nvidia laget nådde sitt genombrott genom att använda en kombination av icke-fotorealistiska domän randomiserade data och fotorealistiska data för att utnyttja styrkan hos båda.
“Vår förhoppning är att andra forskare kommer att hitta den här tekniken är användbar för deras forskning,” Birchfield sagt.
Relaterade Ämnen:
Robotteknik
Digital Omvandling
CXO
Sakernas Internet
Innovation
Affärssystem
0