Googles DeepMind AI: Nu är det kranar till drömmar för att lära sig ännu snabbare

0
261
google-deepmind-go.jpg

Google DeepMind nya agent använder samma djup inlärning metoder som det tidigare varit anställd för att bemästra spelet Gå.

Bild: Claire Reilly/CNET

Den senaste AI-skapelse från forskare vid Googles DeepMind lab är OVERKLIGT, en särskilt snabb agent som kan hantera mer komplexa uppgifter än bara spel.

DeepMind forskare som presenterar sina rön i en ny rapport som beskriver Oövervakad Förstärkning och Aux-Lärande eller OVERKLIGT, som i en del lånar från vägen djur dröm att påskynda inlärningen.

Testa medlet på Atari-spel och 3D-spel Labyrint, och de fann att det kunde lära sig 10 gånger snabbare än den tidigare algoritmer. Det är också i genomsnitt 87 procent expert på mänskliga prestationer på Labyrint.

Som DeepMind s London-baserade forskare förklara, agenten använder samma djup inlärning metoder som det tidigare varit anställd för att bemästra spelet Gå och flera Atari 2600 spel.

Men, vad gör OVERKLIGT speciell är att den har kompletterats med ytterligare två uppgifter, en som lånar från hur djur dröm och en annan som liknar hur barn utvecklar motoriska färdigheter.

“Precis som djur dröm om positivt eller negativt-givande evenemang oftare, för våra agenter företrädesvis replay sekvenser som innehåller givande evenemang”, skriver de i papper.

Forskarna använde sig av detta begrepp för att lära agent för att fokusera på visuella referenser från dess senare historia av erfarenheter, som signal genvägar till större belöningar.

“Agenten är utbildade för att förutsäga uppkomsten av omedelbara belöningar från en kort historisk bakgrund. För att bättre ta itu med det scenario där belöningen är sällsynta, vi presenterar agent med tidigare givande och icke-givande historia i lika proportioner,” de förklarade i ett inlägg.

“Genom att lära om givande historia mycket oftare, för att en agent kan upptäcka visuella funktioner för automatisk av belöning mycket snabbare.”

Den andra uppgiften gäller hur agenten kontroll pixlar på skärmen på ett sätt som är inriktad på lärande från åtgärder för att berätta vad som är nyttigt att spela bra och göra mål mer högt i ett givet spel.

Med hjälp av de tre tekniker kombineras, forskare testade agent på 57 Atari-spel och 13 nivåer av Labyrinten.

En del av framgången är inte bara att skapa en agent som utmärker sig i varje spel, men att agenten behöver inte vara anpassade för att lära sig varje spel.

Som forskare har påpekat, DeepMind främsta mål är att bryta ny mark i AI med program som “kan lära sig att lösa komplexa problem utan att behöva lära sig hur”. Så, nu har de en snabbare lärande agent och en som är också mer flexibla.

“Vi hoppas att detta arbete kommer att tillåta oss att skala upp våra agenter till allt mer komplexa miljöer,” forskarna säger.

CNET: AI är bara inte som i du-ännu