Sorry mensen, Microsoft ‘ s AI is de eerste om het bereiken van een perfecte Ms. Pac-Man score

0
145

Eindelijk, de perfecte score voor de arcade klassieker Ms. Pac-Man heeft bereikt, maar niet door een mens. Maluuba — een deep learning team overgenomen door Microsoft in januari — een AI systeem dat geleerd hoe te bereiken van het spel de maximale waarde van 999,900, met behulp van een unieke combinatie van reinforcement learning met een verdeel-en-heers methode.

AI-onderzoekers hebben een gedocumenteerd voorliefde voor het gebruik van video games te testen machine learning; ze beter nabootsen van de echte wereld, chaos in een gecontroleerde omgeving versus een meer statische spellen zoals schaken. In 2015, Google DeepMind AI was in staat om te leren hoe ze met 49 Atari games met behulp van reinforcement learning, die voorziet in positieve of negatieve feedback elke keer dat de AI probeert een probleem op te lossen.

Hoewel de AI veroverd heeft een schat aan retro games, Ms. Pac-Man bleef ongrijpbaar voor de jaren, door het spel van de opzettelijke gebrek aan voorspelbaarheid. Blijkt het een toughie voor de mens ook. Velen hebben geprobeerd te bereiken Ms. Pac-Man ‘ s top score, komen zo dicht als 921,360. Het spel van de ongrijpbare 999,900 nummer al, heeft tot nu toe alleen bereikt door mensen via cheats.

Maluuba was in staat om het gebruik van AI om het spel te verslaan door tasking uit verantwoordelijkheden, het indelen in hapklare taken toegewezen aan meer dan 150 agenten. Het team leerde de AI met wat ze noemen Hybride Beloning Architectuur — een combinatie van reinforcement learning met een verdeel-en-heers methode. Individuele agenten werden toegewezen versnipperde taken — zoals het vinden van een bepaalde korrel — die werkte in combinatie met andere middelen voor het bereiken van hogere doelen. Maluuba dan aangewezen een top agent (Microsoft vergelijkt dit naar een senior manager bij een bedrijf die suggesties van alle agenten in om de kennis van de beslissingen over waar te verplaatsen Ms. Pac-Man.