Eenheid, een toonaangevende fabrikant van game-development-tools, heeft vandaag aangekondigd dat het een nieuwe, ongekende type video-spel dat is ontworpen om niet te worden gespeeld door mensen, maar door de kunstmatige intelligentie. Het spel heet Obstakel Toren, en het is een stukje software dat is ontwikkeld om te beoordelen of de mate van geavanceerdheid van een AI agent door te meten hoe efficiënt het kan manoeuvreren tot 100 niveaus die verandering en schaal in moeilijkheden op onvoorspelbare manieren. Elk niveau is het procedureel gegenereerd, zodat het verandert elke keer dat de AI pogingen.
Met Belemmering Toren en een $100.000 zwembad van prijzen gereserveerd voor de deelnemers om te beweren dat als onderdeel van een wedstrijd, de Eenheid hoopt het kan zorgen voor een AI-onderzoekers met een nieuwe benchmarking tool voor het evalueren self-learning software. “We wilden de onderzoekers iets om echt te werken met dat zou in extreme mate uitdaging van de mogelijkheden van de AI-systemen die momenteel in onderzoek en ontwikkeling over de hele wereld,” Danny de Lange, Eenheid, vice-president van AI en machine learning, vertelde De Berm. “Wat we eigenlijk willen doen is het maken van een tool voor onderzoekers om hun werk te concentreren op en te verenigen rond en vergelijk de vooruitgang.”
De eenheid wil maken van een nieuwe benchmark opgezet om het AI-onderzoekers om te concurreren
Video games zijn een van de meest nuttige training tools voor AI-onderzoekers vanwege de grote omvang van het kritisch denken, het oplossen van problemen, en het pad van de planning die nodig zijn om te spelen en te slagen om zelfs simpele arcade titels. En voor de jaren, de ene spel dat bleek een bijzonder uitdagende obstakel voor AI agenten, en dus een solide benchmark voor een AI-capaciteiten, was in 1984 de Atari classic Montezuma ‘ s Revenge. Het spel, in tegenstelling tot de meeste anderen van zijn tijd, mits enkele concrete feedback mechanismen voor de spelers. In plaats daarvan wordt beloond exploratie en puzzels op te lossen in tegenstelling tot snelle reflexen en precisie. Dat maakte het bijzonder moeilijk voor onderzoekers om te trainen AI-software te leren als het het spel gespeeld.
Maar, AI agenten zijn snel te verbeteren dankzij nieuwe benaderingen om de machine te leren, die de Eenheid van de cites-als een motivator te maken Obstakel Toren. In November van vorig jaar, AI lab OpenAI gepubliceerd onderzoek laat zien hoe een unieke benadering van de techniek die bekend staat als reinforcement learning, waarin een AI krijgt een beloning mechanisme en fietste door middel van soms honderden jaren van versnelde spelen tijd, dat was afgestemd op de beloning nieuwsgierigheid opgeleverd record prestaties in Montezuma ‘ s Revenge.
Afbeelding: Eenheid
Reinforcement learning is hoe Google ‘ s DeepMind opgeleide software om te verslaan van de beste spelers ter wereld in Gaan en, als van vorige week, zelfs StarCraft II. Maar de techniek is alleen van oudsher effectief bij bepaalde games waar de parameters kunnen worden streng gecontroleerd en de doelstellingen voor de AI agenten zijn duidelijk, beknopt en vrij van potentiële afleiding. Voor Montezuma ‘ s Revenge, OpenAI …. haar algoritme voor het verkennen van het spel door in wezen geeft het een geheim te vinden in het spel van het eerste niveau, dat stimuleert de agent om snel traverse meer van de omgeving dan het anders zou hebben.
In het geval van een Belemmering Toren, de Eenheid is het nemen van een dergelijke benadering in het ontwerp, maar het is toe te voegen in de procedureel gegenereerde levels die ook verandering in het fysieke ontwerp als de AI vordert. Het spel is in wezen een moderne kijk op de Montezuma ‘ s Revenge. Het combineert platformactie en het oplossen van puzzels die spelers hebben die zoeken naar sleutels en het vermijden van vijanden en spike kuilen, dus Lange zegt dat het een effectieve test van AI expertise op het gebied van computer vision, virtuele locomotion, en planning. Het is ook in 3D en in de derde persoon, die zullen vereisen dat agenten AI oefening een meer verfijnd niveau van ruimtelijk inzicht als ze zich te verplaatsen in de levels.
“Er is een breed scala van controle problemen, visuele problemen, en de cognitieve problemen die je moet overwinnen om de voortgang van niveau naar niveau, en elk niveau wordt moeilijker,” Lange zegt. “We hebben menselijke spelers spelen en die ze kunnen krijgen om rond level 15.” Eenheid plannen te maken Obstakel Toren open source, dus game-ontwikkelaars en onderzoekers kunnen wijzigen als zij dat nodig achten. U zult ook in staat om het te downloaden en probeer het zelf, in het geval u geïnteresseerd bent in het testen van een spel dat was nooit bedoeld om te worden gespeeld door een mens.
‘Obstakel Tower’ is een modern-day ‘Montezuma’ s Revenge’ is ontworpen voor computers te spelen
Als onderdeel van de wedstrijd is het hosting rond het spel, Eenheid, zegt een deelnemer kan de trein een AI agent om de schaal van de eerste 25 verdiepingen van de toren tussen 11 februari en 31 Maart. Vanaf 15 April voor de volle 100-vloer spel beschikbaar zal zijn, met de winnaars bekend gemaakt op 14 juni. Eenheid zegt dat het zal geven cash prijzen als vouchers en credits voor Google ‘ s Cloud Platform. Het is onduidelijk hoe de wedstrijd zal belonen onderzoekers, worden door de algehele prestaties of het team dat als eerste het ontwikkelen van een agent die kan verslaan 100 verdiepingen, maar de Eenheid plannen om meer informatie over de wedstrijd in de komende weken.
Het uiteindelijke doel is dat deze vormen van nieuwe, speciaal op maat gemaakte stukken van de software zal helpen bij het maken van slimmere AI agents die kunnen meer leren van complexe vaardigheden in ooit-versnelt tarieven. Het leren spelen van een video spel niet van toepassing op de meeste real-world taken we hebben een robot presteren in de toekomst; de kansen, die we niet willen dat de robots proberen en falen te stofzuigen van uw tapijt of een ei bakken, duizenden keren op, totdat het gelijk goed. (Hoewel we heel goed mogelijk dat de robot software praktijk die taken met behulp van virtuele simulatie.) En alleen door het trainen van diepe neurale netwerken op grote gegevenssets gericht op een enkelvoud en smalle doel — zoals het herkennen van objecten in foto ‘ s — kunnen bedrijven als Google zet de vooruitgang in het AI-onderzoek naar de werkelijke functies die we kunnen gebruiken in de huidige commerciële producten.
Maar door het trainen van AI om te spelen video games zonder enige instructie dan ook, onderzoekers zijn het verwerven van een beter begrip van hoe de geest lost problemen op en, belangrijker nog, hoe hij leert op te lossen nieuwe het is nooit meegemaakt. Deze types van uitdagingen, zoals de Eenheid van de Hindernis Toren, konden onderzoekers nieuwe mogelijkheden om te blijven werken op die uitdagingen, met een eventuele mijlpaal van het creëren van wat de industrie verwijst als kunstmatige algemene intelligentie of AI software die het uitvoeren van elke taak die een mens kan.
“Veel mensen denken dat de AI is over het bouwen van een beter product aanbevelingen bij Amazon. Maar aan het eind van de dag, het is echt het oplossen van meer complexe problemen. Het gaat over het omgaan met visie -, controle -, en andere cognitieve uitdagingen,” Lange zegt. Voor de Eenheid als een bedrijf, voegt hij eraan toe dat dit soort werk is ook over het helpen van de oprichting van het spel ontwikkeling toolset als een plek waar cutting-edge onderzoek kan, langs de lijn, te vertalen naar de sector van de vooruitgang. “We hebben het als een missie om te democratiseren spel ontwikkeling, maar we willen ook democratiseren AI. We willen ervoor zorgen dat veel ontwikkelaars er hun handen krijgen.”