Machine learning gaat verder dan de theorie om te verslaan van menselijke poker champs

0
15

De kwaliteit van de Gegevens: De eerste mijl van machine learning
Voor de lancering van een effectieve machine learning initiative, bedrijven moeten om te beginnen met de kwaliteit van de gegevens — en onderhouden van een gestage stroom van gegevens om de modellen bijgewerkt, legt Dale Brown, Hoofd van de Operaties in Figuur Acht.

Onder de vele verwezenlijkingen van machine learning in de afgelopen jaren enkele van de meest opvallende zijn de overwinningen van de machine tegen menselijke spelers in de game, zoals Google ‘ s DeepMind groep verovering van Gaan in 2016. In dergelijke mijlpalen, onderzoekers worden vaak begeleid door theoretische wiskunde die zegt dat er een optimale strategie te vinden, gegeven een goed algoritme en genoeg berekenen.

Maar wat doe je als theorie breekt? Twee onderzoekers van de Carnegie Mellon University en Facebook ging terug naar de tekentafel te lossen “heads-up no-limit Texas hold’ em, de meest populaire vorm van poker voor meerdere spelers in de wereld.

Theorie is niet computable voor deze vorm van het spel, zodat ze ontwierp een aantal elegante zoekstrategieën voor hun computer programma, “Pluribus,” om te verslaan van de beste menselijke spelers op de 10.000 handen van poker. De auteurs zelfs in geslaagd om het te doen met een enkele, 64-core Intel-gebaseerde server, met slechts 512 gb RAM-geheugen, waarin zij wijzen op veel minder berekenen dan steeds gigantische machine learning modellen zoals DeepMind ‘ s “AlphaZero” die gebruik maken van ton van computing dingen op te lossen.

Eerder dan het berekenen van optimale oplossingen voor de spelers, de Pluribus programma zoekt naar goed genoeg oplossingen die blijken uit te voeren verrassend goed.

Primers: Wat is AI? | Wat is machine learning? | Wat is diep leren? | Wat is kunstmatige algemene intelligentie?

Het werk, “Bovenmenselijke AI voor multiplayer poker,” het beschrijven van de wedstrijd over twaalf dagen tegen top spelers in de wereld op poker, is vandaag gepubliceerd in Science magazine en is geschreven door Noam Bruin en Tuomas Sandholm. Bruin en Sandholm beide hebben banden met de Carnegie Mellon University; Brown is ook met Facebook AI-Onderzoek, en Sandholm heeft connecties met drie Pittsburgh bedrijven, Strategische Machine, Inc., Strategie Robot, Inc., en Geoptimaliseerd Markets, Inc.

Science magazine is uitgegroeid tot iets van een broeinest voor cutting-edge poker papier door de machine te leren typen, en dit is de tweede keer door Brown en Sandholm in iets meer dan een jaar. In januari van vorig jaar publiceerden ze een machine learning model genaamd “Libratus” dat zou kunnen bereiken “bovenmenselijke” mogelijkheid in de two-player versies van Texas hold ‘ em poker.

brown-and-standholm-2019-pluribus-poker-search-strategy.png

Bruin en Sandholm de real-time search strategie voor Pluribus in de dikke van Texas hold ‘ em.

Bruin en Sandholm

Met Pluribus de auteurs nemen aan een nieuw niveau van complexiteit die komt met meerdere tegenstanders, in dit geval vijf mensen tegen de Pluribus machine. In de meeste games is overgenomen door machine learning, waaronder Gaan en two-player poker, er is een theoretisch kader dat de basis vormt voor het vinden van de optimale spelstrategie. De “Nash-Evenwicht,” vernoemd naar de beroemde AMERIKAANSE wiskundige John Nash, zegt dat het optimaal afspelen van de strategieën kan worden gevonden voor elke speler gebaseerd op de aanname dat elke tegenstander in een spel even spelen hun beste strategie.

In een eenvoudig spel, zoals stenen, papier, schaar, gewoon spelen dezelfde keuze elke ronde, zoals stenen, kan de optimale strategie leidt tot evenwicht tussen de spelers.

Dus het maken van bots die games spelen kan in zekere zin worden gekookt tot het bouwen van een machine die berekent de Nash-Evenwicht.

Het probleem is, zoals games toename in complexiteit, het vinden van de Nash-Evenwicht wordt meer en meer rekenkracht is intens. Een aanpassing van dat evenwicht is de beste computers kunnen doen binnen de praktische beperkingen in de tijd. Het is goed werkte voor een aantal benaderingen, en in het bijzonder in de twee-speler heads-up poker, het was een aanpak die geserveerd Bruin en Sandholm goed met Libratus als een ander team, Moravčik en collega ‘ s aan de Universiteit van Alberta, die gepubliceerd hun “DeepStack” machine voor Texas hold ‘ em in de Wetenschap in 2017.

Verwante Onderwerpen:

Big Data Analytics

Digitale Transformatie

CXO

Het Internet van Dingen

Innovatie

Enterprise Software