Forskare avslöjar hur du spelar poker AI slå de bästa mänskliga spelarna

0
115

Noll

screen-shot-2017-12-19-at-08-26-48.jpg
Carnegie Mellon University

Bemästra dina ansiktsuttryck, lära sig när man ska bluffa och när du ska höja, poker är ett spel inte bara om tur utan om teknik och taktik.

I ansiktet av artificiell intelligens (AI), men även de bästa mänskliga spelarna kan hitta sina strategier misslyckas.

Forskare vid Carnegie Mellon University har visat hur deras AI kunde nå nivåerna av det “övermänskliga prestation” för att slå några av de bästa mänskliga spelarna i no-limit Texas Hold ‘ em poker.

Tidigare i år, i en 20-dagars tävling där 120,000 händer på Rivers Casino i Pittsburgh, Libratus AI kunde besegra fyra av de bästa professionella pokerspelare. Libratus beat spelare individuellt och lyckades samla ihop över $1,8 miljoner i marker.

Enligt Tuomas Sandholm, professor i datavetenskap, och Noam Brun, Doktorand vid Institutionen för datavetenskap vid Carnegie Mellon, AI “som används för en tredelad strategi” för att bemästra spelet med “mer poäng beslut än atomer i universum.”

Forskningen publicerades i tidskriften Science.

Problemet med poker, i jämförelse med Schack eller Dam, är att bluffa är inblandade. Snarare än beslut punkter som gjorts enbart baserat på prognoser av framtida rörelser och svart-och-vit steg att ta, att bli en mästare pokerspelare innebär också att känna igen och förstå taktik som bluffar.

Enligt forskarna, var det möjligt för Libratus att gå längre än andra spel genom att bryta poker till “beräkningsmässigt hanterbara delar, och baserat på sina motståndares spel, åtgärda eventuella brister i sin strategi under tävlingen.”

AI har tre mobiler, är den första som skapar en abstrakt version av spelet som är mindre och enklare att lösa än standard, människa-central spel. Det är 10161 — nummer ett följt av 161 nollor — beslut punkter i spelet, och så baserat på denna enklare version, Libratus kan skapa en strategi för de tidiga omgångarna.

Denna “plan strategi” och sedan fungerar som en plattform för senare stadierna av spelet, ett exempel är att gruppera liknande händer tillsammans och behandla dem på samma sätt.

“Det är lite skillnad mellan en Kung-hög flush och en Queen-high flush,” sade Brown. “Att behandla dessa händer som identiska minskar komplexiteten i spelet och därmed gör det mycket lättare […] en liknande satsning storlekar också kan grupperas tillsammans.”

När poker spel fortsätter till sista omgångarna, en andra modul kommer in, vilket skapar en mer detaljerad plan-of-action baserad på spelet. En strategi är också utvecklade i realtid där man med en plan för vägledning, är att kunna växla AI: s taktik beroende på händer och bluffar.

Om motståndaren gör ett drag som inte har beaktats i den abstraktion, mobil beräknar en lösning i subgame som lägger detta gå till mixen.

Den tredje modulen fokuserar på att förbättra plan strategi som spelet fortsätter. Enligt Sandholm, i detta avsnitt av AI upptäcker misstag i motståndarens strategi för att utnyttja dem — men detta skulle också kunna “öppna AI för exploatering om motståndaren skift strategi.”

“I stället, Libratus’ self-improver-modul analyserar motståndarens satsning storlekar för att upptäcka eventuella hål i Libratus strategi strategi,” teamet säger. “Libratus sedan lägger dessa saknas beslut grenar, beräknar strategier för dem, och lägger till dem i en plan.”

Se även: ROBOT utnyttja från 1998 uppståndne, inte lämnar bästa webbplatser’ crypto utsatta

Det teknik har licensierats till Sandholm är företagets Strategiska Maskinen, som “gäller strategiska resonemang teknik till många olika applikationer.”

“De tekniker som vi utvecklat är till stor del domän oberoende och kan således tillämpas på andra strategiska ofullständig information interaktioner, inklusive icke-fritids-program,” Sandholm och sade Brown. “På grund av den gränslösa dold information i verkliga strategiska interaktioner, vi tror att det paradigm som infördes i Libratus kommer att vara avgörande för den framtida tillväxten och utbredd tillämpning av AI.”

Tidigare och relaterade täckning

Japansk stad väljer att flyga valp drone som officiell maskot japanska rymdorganisationen robot bollen tar oss genom livet off-planet San Francisco förbud leverans robotar i de flesta av staden

Relaterade Ämnen:

Robotteknik

CXO

Digital Omvandling

Tech-Industrin

Smarta Städer

Cloud

0