Machine learning går ud over teori til at slå menneskelige poker champs

0
18

Kvaliteten af Data: De første km af machine learning
Til at iværksætte en effektiv machine learning initiativ, virksomhederne er nødt til at starte med data af høj kvalitet — og opretholde en stabil strøm af data til at holde modeller, opdateret, forklarer Dale Brown, Leder af Operationer i Figur af Otte.

Blandt de mange resultater af machine learning i de seneste år, er nogle af de mest slående er de sejre af maskinen mod menneskelige spillere i spil, såsom Google ‘s DeepMind group’ s erobring af at Gå i 2016. I sådanne milepæle, forskere, er ofte styret af teoretisk matematik, der siger, at der kan være en optimal strategi at blive fundet, givet en god algoritme og nok beregne.

Men hvad gør du, når teori bryder sammen? To forskere ved Carnegie Mellon University og Facebook gik tilbage til tegnebordet for at løse “heads-up no-limit Texas hold’ em,” den mest populære form af poker med flere spillere i verden.

Teori er ikke beregnelige for denne form for kortspil, så har de designet nogle elegante søg strategier til deres edb-program, “Pluribus,” for at slå de bedste spillere i 10.000 hænder af poker. Forfatterne selv har formået at gøre det med en enkelt, 64-core Intel-baseret server, med kun 512 gigabyte RAM, som de påpeger, er langt mindre beregne end stigende grad gigantisk machine learning-modeller, som DeepMind ‘ s “AlphaZero”, der bruger tonsvis af computere til at løse tingene.

Snarere end design og optimale løsninger på tværs af de spillere, Pluribus programmet søger efter god nok-løsninger, der viser sig at udføre overraskende godt.

Primere: Hvad er AI? | Hvad er machine learning? | Hvad er dyb læring? | Hvad er kunstig generelle intelligens?

Det arbejde, “Overmenneskelige AI for multiplayer poker,” beskriver konkurrence i løbet af tolv dage mod top verden spillere i poker, er i dag offentliggjort i tidsskriftet Science, og er skrevet af Noam Brun og Tuomas Sandholm. Brun og Sandholm begge har tilhørsforhold med Carnegie Mellon University, Brun er også med Facebook AI Forskning, og Sandholm har tilhørsforhold med tre Pittsburgh virksomheder, Strategiske Machine, Inc., Strategi Robot, Inc., og Optimeret Markeder, Inc.

Science magazine er blevet noget af et centrum for avanceret poker papirer af machine learning-typer, og dette er den anden udseende ved at Brune og Sandholm i lidt over et år. I januar sidste år, offentliggjorde de en machine learning model kaldet “Libratus” at kunne opnå “overmenneskelige” evne i to-player versioner af Texas hold ‘ em poker.

brown-and-standholm-2019-pluribus-poker-search-strategy.png

Brun og Sandholm ‘s real-time søgning strategi for Pluribus i den tykke af Texas hold’ em.

Brun og Sandholm

Med Pluribus, forfatterne tager på et nyt niveau af kompleksitet, der kommer med flere modstandere, i dette tilfælde de fem mennesker mod Pluribus maskine. I de fleste spil, som machine learning, herunder Go og to-player poker, der er en teoretisk ramme, der danner grundlag for at finde den optimale spille strategier. “Nash Ligevægt”, opkaldt efter den berømte AMERIKANSKE matematiker John Nash, der fortæller, at den optimale spille strategier kan findes for hver spiller, der er baseret på den antagelse, at hver modstander i et spil, er lige at spille deres bedste strategi.

I et simpelt spil som sten, papir, saks, bare at spille de samme valgmuligheder, hver runde, såsom sten, kan være den optimale strategi, som fører til ligevægt mellem spillere.

Så for at gøre robotter, der spiller spil kan i en vis forstand være kogt ned til at bygge en maskine, der beregner Nash Ligevægt.

Problemet er, som spil stigning i kompleksitet, at finde en Nash Ligevægt bliver mere og mere beregningsmæssigt intens. Tilnærmelse, at ligevægt er den bedste computere kan gøre i det praktiske frister. Det fungerede godt for en lang række strategier, og, i særdeleshed, i to-spiller heads up poker, var det en tilgang, der serveres Brune og Sandholm godt med Libratus, som det gjorde for et andet hold, Moravčik og kolleger ved University of Alberta, som har udgivet deres “DeepStack” maskine til Texas hold ‘ em i Science i 2017.

Relaterede Emner:

Big Data Analytics

Digital Transformation

CXO

Tingenes Internet

Innovation

Virksomhedens Software