DeepMind AlphaGo Nul leert op zijn eigen, zonder meatbag interventie

0
189

Nul

alphago-zero.png
(Afbeelding: DeepMind)

DeepMind heeft gezegd dat het is gemaakt van de beste Go-speler in de wereld, omdat het in staat was om weg te doen met menselijke kennis en begin met een schone lei.

AlphaGo Nul begint met het spelen van “willekeurige” Gaan spelen tegen zichzelf, en in drie dagen kunnen verslaan met 100 games naar 0 de versie van AlphaGo die verslagen Lee Se-dol in Maart 2016, aldus het bedrijf in een blogpost.

Door de 21-dag mark, het is in staat om te verslaan AlphaGo Master — een online versie die verscheen in januari en won meer dan 60 rechte games tegen top spelers Gaan — en na 40 dagen is in staat om te verslaan alle andere versies van AlphaGo.

DeepMind mede-oprichter en CEO Demis Hassabis zei de opleiding voor het neurale netwerk onderliggende AlphaGo Nul werd gestript te verwijderen “met de hand ontworpen kenmerken” eerder hebt gebruikt, wordt gebruik gemaakt van één netwerk, in plaats van een paar van de netwerken, en deed afstand van Monte-Carlo roll-outs.

“Het systeem begint met een neuraal netwerk dat weet niets over het spel van Go. Hij speelt dan spelletjes tegen zichzelf, door het combineren van deze neurale netwerk met een krachtige zoek-algoritme,” Hassabis zei. “Deze bijgewerkte neurale netwerk wordt dan opnieuw gecombineerd met de zoek-algoritme voor het maken van een nieuwe, sterkere versie van AlphaGo Nul, en het proces begint opnieuw.”

“Deze techniek is krachtiger zijn dan de vorige versies van AlphaGo want het is niet meer beperkt door de grenzen van de menselijke kennis. In plaats daarvan is het kunnen leren van de tabula rasa van de sterkste speler in de wereld: AlphaGo zelf.”

Door het verwijderen van de noodzaak om te leren van de mens, DeepMind hoofdonderzoeker David Silver zei: het is mogelijk om gegeneraliseerde AI algoritmen.

“Het feit dat we hebben gezien van een programma het bereiken van een zeer hoog niveau van prestaties in een domein als ingewikkeld en uitdagend Gaan, zou moeten betekenen dat we kunnen nu beginnen met het aanpakken van een aantal van de meest uitdagende en impactvolle problemen voor de mensheid’, zei hij.

Hoewel DeepMind kreeg bekendheid door het verslaan van menselijke Go-spelers, heeft het bedrijf ook aandacht voor StarCraft II.

“We hebben nauw samengewerkt met de StarCraft II-team aan het ontwikkelen van een API die ondersteuning biedt voor iets wat lijkt op de vorige bots geschreven met een ‘scripted’ – interface, waardoor programmatische controle van de afzonderlijke eenheden en de toegang tot het volledige spel staat (met een aantal nieuwe opties als het goed is),” DeepMind zei in November 2016.

“Uiteindelijk agenten direct spelen vanaf pixels, dus we zijn er, we hebben een nieuwe afbeelding-gebaseerd interface dat de uitgangen van een vereenvoudigde met een lage resolutie RGB-beeld gegevens voor de kaart en de minimap, en de mogelijkheid om uit te breken functies in afzonderlijke ‘lagen’, zoals het terrein heightfield, type eenheid, eenheid, gezondheid, etc.”

Het Alfabet van de onderneming in handen zei hij koos voor StarCraft II, want het was een stap dichter bij de real-world omgeving dan elk ander spel heeft gebruikt voor het testen van zo verre, als het wordt gespeeld in real-time.

“De vaardigheden die nodig zijn voor een agent om de vooruitgang door middel van het milieu en de spelen van StarCraft en kon uiteindelijk de transfer naar real-world taken,” beweerde.

Verwante dekking

Er is een enorme kans in de robotica voor het begin van de loopbaan computer wetenschappers en serieuze software engineers

Maya Cakmak is een baanbrekende manieren voor niet-deskundigen programma robots. Haar werk is de opening van een nieuw veld dat u moet weten over.

AI, robotica, IoT, augmented en virtual reality voor het versterken van de ICT-uitgaven

Volgens IDC, zijn de uitgaven op nieuwe technologieën te versnellen in de komende vijf jaar en het vergroten van de uitgaven aan informatie-en communicatie-technologie in het algemeen.

De robot revolution is al gebeurd in een verrassend groot aantal van de industrie (en het heeft niets te maken met AI)

Betaalbare robot automatisering is nu beschikbaar voor pa en ma winkels, die als een gek groei in de robotica-industrie.

0