Tenere il passo con le ultime IA di ricerca può essere un’esperienza strana. Da un lato, sei consapevole che stai cercando avanguardia, sperimentazione, con le carte nuove che delinea le idee e i metodi che probabilmente (eventualmente) palla di neve nella più grande rivoluzione tecnologica di tutti i tempi. D’altra parte, a volte quello che stai guardando è inevitabilmente strano e divertente.
È il caso di una nuova carta da Google AI filiale di DeepMind dal titolo “Nascita di Locomozione Comportamenti in Ambienti Ricchi.” La ricerca esplora come il rafforzamento dell’apprendimento (o RL) può essere utilizzato per insegnare ad un computer per navigare familiari e in ambienti complessi. È il tipo di fondamentali AI ricerca che stiamo provando in mondi virtuali, ma che un giorno aiutare a programmare i robot in grado di navigare le scale di casa tua. Seriamente, basta guardare DeepMind agente andare:
Agenti di divertirsi nel Parkour! Fresco di carta da colleghi DeepMind https://t.co/X0PwKXrQ2M pic.twitter.com/yMT6XCNv45
— Oriol Vinyals (@OriolVinyalsML) 10 Luglio 2017
Tutto il bastone figura sta facendo in questo video è autodidatta. Il salto, il limboing, il salto — tutti questi sono comportamenti che il computer ha pensato a se stessa come il mezzo migliore per spostarsi da a a B. Tutti DeepMind l’hanno fatto i programmatori si conferisce all’agente una serie di sensori virtuali (quindi si può dire che sia in posizione verticale o non, per esempio) e quindi un incentivo a muoversi in avanti. Il computer funziona il resto per se stesso, utilizzando la prova e l’errore a venire con modi diversi di muoversi.
La novità qui è che i ricercatori stanno studiando come ambienti difficili e possono insegnare un agente complesso e robusto movimenti (cioè, usando il suo ginocchio per ottenere acquisto sulla cima di un alto muro di cinta). Di solito, il rafforzamento dell’apprendimento produce un comportamento che è fragile, e che si rompe in circostanze sconosciute, come un bambino che sa come affrontare le scale di casa, ma che non possono capire una scala mobile. Questa ricerca dimostra che non è sempre il caso, e che RL può essere utilizzato per insegnare i movimenti complessi.