DeepMind AI är att lära sig parkour, och resultatet är bedårande

0
148

Att hålla sig uppdaterad med den senaste AI-forskning kan vara en udda upplevelse. Å ena sidan, är du medveten om att du tittar på banbrytande experiment, med nya papper som beskriver de idéer och metoder som förmodligen kommer (så småningom) snöboll i de största teknologiska revolution av hela tiden. Å andra sidan, ibland vad du tittar på är bara oundvikligen konstig och rolig.

Typexempel är ett nytt papper från Googles AI dotterbolag DeepMind med titeln “Framväxten av Förflyttning Beteenden i Rika Miljöer.” Den forskning som undersöker hur inlärning (eller RL) kan användas för att lära en dator att navigera i obekanta och komplexa miljöer. Det är den typen av grundläggande AI-forskning som vi nu testar i virtuella världar, men som en dag kommer att hjälpa till att programmera robotar som kan navigera i trappor i huset. Allvarligt, titta bara på DeepMind agent gå:

Allt stick figur gör i den här videon är självlärd. Hoppning, limboing, hoppa — alla dessa är beteenden som datorn har tänkt sig som det bästa sättet att ta sig från A till B. Alla DeepMind programmerare har gjort är att ge agenten en uppsättning av virtuella sensorer (så att det kan berätta om det är stående eller inte, till exempel) och sedan uppmuntra till att gå vidare. Datorn fungerar resten ut för sig själv, med hjälp av trial and error för att komma med olika sätt att röra sig.

Nyheten här är att forskare undersöker hur svåra miljöer kan lära en agent komplexa och kraftfulla rörelser (dvs, som använder sitt knä för att få köpa på toppen av en hög mur). Vanligtvis, inlärning ger ett beteende som är bräcklig, och som bryter ner i okända omständigheter, som ett barn som vet hur man ska tackla trappan hemma, men som inte kan förstå en rulltrappa. Denna forskning visar att det inte alltid är fallet, och att RL kan användas för att lära ut komplexa rörelser.