Nul

Carnegie Mellon University
De beheersing van je gezichtsuitdrukkingen, te leren wanneer te bluffen en wanneer te verhogen — poker is een spel dat niet alleen van geluk, maar van techniek en tactiek.
In het gezicht van de kunstmatige intelligentie (AI), echter, zelfs de beste menselijke spelers kunnen hun strategieën te kort.
Onderzoekers aan de Carnegie Mellon University hebben laten zien hoe hun AI was in staat om te bereiken niveaus van “bovenmenselijke prestaties’ te verslaan, sommige van de beste menselijke spelers van no-limit Texas Hold ‘ em poker.
Eerder dit jaar, in een 20-daagse wedstrijd waarbij de 120.000 handen op Rivieren Casino in Pittsburgh, de Libratus AI was in staat om te verslaan van vier van de beste professionele poker spelers. Libratus beat spelers individueel en was in staat om het vergaren van meer dan $1.8 miljoen in chips.
Volgens Tuomas Sandholm, professor of computer science, en Noam Bruin, een Promovendus in de Vakgroep computerwetenschappen aan de Carnegie Mellon, de AI “gebruikt een drieledige benadering van de meester van het spel met “besluit meer punten dan atomen in het heelal.”
Het onderzoek is gepubliceerd in het tijdschrift Science.
Het probleem met poker in vergelijking met Schaken of Dammen, is dat bluffen is betrokken. Dan besluit de punten worden uitsluitend gemaakt op basis van voorspellingen van toekomstige bewegingen en zwart-wit stappen te nemen, wordt een meester poker speler ook gaat herkennen en begrijpen van tactieken, zoals bluffen.
Volgens het team was het mogelijk voor Libratus om verder te gaan dan andere spellen door het breken van poker in “de computer beheersbaar te delen en op basis van zijn tegenstanders’ gameplay, oplossen van potentiële zwakke punten in de strategie tijdens de wedstrijd.”
De AI heeft drie mobieltjes, de eerste van die zorgt voor een abstracte versie van het spel die is kleiner en “gemakkelijker op te lossen” dan standaard, mens-centrale spelen. Er zijn 10161 — de nummer één, gevolgd door 161 nullen — beslissing punten in het spel, en dus op basis van deze eenvoudigere versie, Libratus kunnen maken van een strategie voor de eerste ronden.
Deze “blauwdruk” strategie dan dient als een platform voor latere stadia van het spel, bijvoorbeeld het groeperen van soortgelijke handen in elkaar en ze te behandelen op dezelfde manier.
“Er is weinig verschil tussen een Koning-hoge flush en een Queen-hoge flush,” Brown zei. “De behandeling die handen als identiek vermindert de complexiteit van het spel en dus maakt het voor de computer makkelijker […] vergelijkbare inzet formaten kunnen ook worden gegroepeerd bij elkaar.”
Wanneer het poker spel gaat door naar de finale rondes, een tweede module in het spel komt, het creëren van een meer gedetailleerd plan-van-actie die gebaseerd is op het spel. Een strategie is ontwikkeld in real-time, tijdens het gebruik van de blauwdruk voor de begeleiding, is het mogelijk om te schakelen van de AI ‘ s tactiek afhankelijk van handen en bluffs.
Als de tegenstander een zet doet die niet is beschouwd in de abstractie, de mobile berekent een oplossing in de subgame wat voegt deze verplaatsen naar de mix.
De derde module richt zich op het verbeteren van de blauwdruk strategie naarmate het spel vordert. Volgens Sandholm, dit gedeelte van de AI detecteert fouten bij de tegenstander strategie om te profiteren van hen — maar dit kan ook “open de AI tot een exploitatie als de tegenstander verschuivingen strategie.”
“In plaats daarvan, Libratus’ self-verbeteraar module analyseert tegenstanders’ bet maten te detecteren van mogelijke gaten in Libratus’ blauwdruk strategie, de” het team zegt. “Libratus dan voegt deze ontbrekende besluit takken, berekent strategieën voor hen en voegt u ze toe aan de blauwdruk.”
Zie ook: ROBOT exploiteren van 1998 opstaan, bladeren top websites’ crypto kwetsbaar
De technologie is in licentie gegeven aan Sandholm de Strategische Machine, die ‘ van toepassing strategisch redeneren technologieën voor veel verschillende toepassingen.”
“De technieken die we ontwikkeld zijn grotendeels domein onafhankelijk en kan daardoor worden toegepast op andere strategische imperfect-informatie interactions, met inbegrip van niet-recreatieve toepassingen,” Sandholm en Brown zei. “Door de alomtegenwoordigheid van verborgen informatie in real-world strategische interactie, wij geloven dat het paradigma geïntroduceerd in Libratus zal cruciaal zijn voor de toekomstige groei en verspreiding van AI.”
Vorige en aanverwante dekking
De japanse stad kiest flying puppy drone als officiële mascotte van de japanse ruimtevaartorganisatie robot bal neemt ons mee door het leven off-planet San Francisco bans levering robots in de meeste van de stad
Verwante Onderwerpen:
Robotica
CXO
Digitale Transformatie
Tech Industrie
Smart Cities
Cloud
0