Hvor godt maskinerne gør mod mennesker i konkurrence situationer måske ikke den typiske ting, du ville forvente, såsom svartid, men snarere evnen til at maksimere godt valg gennem en lang erfaring.
Det er en af de grillbarer fra Dec. 19 match-up i real-time strategi computerspillet StarCraft II mellem en computer, AlphaStar, der er udviklet af Google, mod en menneskelig mester, Polens Grzegorz Komincz, der er kendt af hans gamer håndtere MaNa.
Et blog-indlæg af AlphaStar holdet torsdag afslører nogle spændende indsigter om, hvordan at December triumf blev skabt. (Forsknings-papir er i processen.)
AlphaStar kom tilbage fra mange tab i 2017 kontant trounce MaNa ved fem spil til nul i December match. “Det første system til at slå et top [menneskelige] pro”, som AlphaStar skabere tweeted på torsdag.
Også: Kina ‘ s AI-forskere underviser i et neuralt net til at uddanne sig

Screent fange af AlphaStar at spille mod den menneskelige Team Flydende.
(Billede: Google DeepMind/Blizzard Entertainment)
Den afgørende forskel kan være en strategi for uddannelse AlphaStar, at der er ansat nye “meta-game” – teknikker til at dyrke en mester-afspiller.
Maskinen er ikke hurtigere end mennesker på at tage handlinger. I virkeligheden, sin gennemsnitlige antal foranstaltninger i StarCraft II 280 per minut, “betydeligt lavere end de professionelle [menneskelige] spillere.”
I stedet sin styrke ser ud til at komme op med nye strategier eller usædvanlige drejninger på eksisterende strategier ved at samle viden over mange spil. Google ‘ s DeepMind holdet brugte en roman “meta-game” – tilgang til at uddanne deres netværk, til at opbygge en liga af spillere over tusinder og atter tusinder af samtidige træningskampe, og derefter vælge den optimale spiller fra resultaterne af hver.
Også: MIT lader AI “syntetisere” computer programmer til at hjælpe data forskere
StarCraft II, den nyeste i StarCraft franchise fra Santa Monica-baseret video game maker Activision-Blizzard, kræver spillere til at martial arbejdstagere, der bevæger sig gennem en to-dimensionelle terræn, indsamle ressourcer såsom mineraler, opførelse af bygninger, og samle hære, for at opnå dominans mod andre spillere. Spillet først kom ud i 1998, og der har været en turnering spillet lige siden.
Det har været et arnested for AI innovation, fordi Google og andre ser i spillet er flere faktorer, der gør det meget mere udfordrende end andre video-spil og klassisk strategi spil såsom Skak eller Gå. Disse omfatter det faktum, at StarCraft er en “fog of war” aspekt i og med, at de enkelte spillere, herunder AI “agenter”, der er udviklet, har begrænsede oplysninger, fordi de ikke kan se aspekter af det terræn, hvor deres modstandere kan have gjort fremskridt.
I 2017, når Google ‘ s DeepMind enhed, og programers på Blizzard udgav deres første arbejde, skrev de, at de var i stand til at få deres algoritmer til at spille spillet “tæt på ekspert menneskelige play”, men de kunne ikke engang lære, at det at slå den indbyggede-i AI, at skibe med StarCraft.
Et skærmbillede af, hvordan AlphaStar model er at reflektere over de spil, som dele af det neurale netværk er at skyde på tidspunkter, strategier, man overvejer.
(Billede: Google DeepMind/Blizzard Entertainment)
Holdet slikkede deres sår og kom tilbage med flere nyskabelser denne gang. Et papir, der kommer til at blive offentliggjort snart, ifølge DeepMind grundlægger og CEO Demis Hassabis.
I sin kerne, AlphaStar, ligesom 2017 version, der stadig er baseret på en dyb tilgang til læring af, hvad der er kendt som tilbagevendende neurale netværk, eller RNNs, som har en form for hukommelse af tidligere input, som giver dem mulighed for at bygge videre på viden, der er indhøstet i løbet af oplæring af neurale netværk.
Forfatterne dog, augmented den typiske “lang og kort sigt hukommelse,” eller LSTM, neurale netværk med noget, der kaldes en “transformer”, udviklet af Google ‘ s Ashish Vaswani og kolleger i 2017. Det er i stand til at flytte en “læs hoved” over forskellige dele af et neuralt netværk til at hente før data selektivt. Der er en hel masse nye ting som dette.
Men en af de mest provokerende måder, spillet planen har ændret sig, er at indarbejde en metode til at slå de bedste spillere, de såkaldte “Nash gennemsnit”, der blev indført sidste år af David Balduzzi og kolleger på DeepMind. Forfatterne bemærkede, at neurale netværk har en masse “redundans”, der betyder “forskellige agenter, netværk, algoritmer, miljøer og opgaver, der gør stort set det samme arbejde.” På grund af, at Nash gennemsnit er i stand til at slags selektivt at udelukke, eller “ablate,” afskedigelser for at afsløre de grundlæggende underliggende fordele ved en bestemt AI “agent”, der spiller et video spil (eller er der nogen opgave).
En grafisk illustration af Nash i gennemsnit proces, hvor den ideelle spiller er konstrueret. “Den endelige AlphaStar agent består af komponenter af Nash distribution-med andre ord, den mest effektive blanding af strategier, der er blevet opdaget.”
(Billede: Google DeepMind/Blizzard Entertainment)
Som Balduzzi og kolleger skrev i deres artikel, “Nash evaluering beregner en fordeling på aktører (agenter eller ansatte og opgaver), som automatisk justerer til overflødige data. Det giver således et invariant tilgang til måling af agent-agent og agent-miljø interaktioner.”
Nash i gennemsnit blev anvendt til at udvælge den bedste af AlphaStar ‘ s spillere over spændvidden af mange spil. Som AlphaStar team skriver, “En kontinuerlig league blev oprettet, med agenter af premier league – konkurrenterne – spille spil mod hinanden […] Mens nogle nye konkurrenter udføre en strategi, som blot er en videreudvikling af en tidligere strategi, andre med at finde drastisk nye strategier.”
Men det er ikke bare at vælge en spiller, der skinner, Nash proces er effektivt skabelsen af en enkelt spiller, der sammensmelter alle de af den læring og indsigt i de andre. Den endelige AlphaStar agent består af komponenter af Nash distribution-med andre ord, den mest effektive blanding af strategier, der er blevet opdaget.”
Skal læse
“AI er meget, meget dum, “siger Google’ s AI-leder (CNET)Baidu skaber Kunlun silicium til AIUnified Google AI division et klart signal om, at AI ‘ s fremtid (TechRepublic)
Nøglen er, at træning af alle disse konkurrenter giver hver AI-agent unikke mål og målsætninger, således at antallet af mulige løsninger på de spil udforsket udvider støt. Det er en slags survival of the fittest af videospil med spillere, der går op imod mennesker, der har gavn af den hurtige udvikling i de måneder, der er på spil.
I ekkoer af, hvad der skete med hen, hvor DeepMind er AlphaGo var i stand til at opfinde helt nye strategier, champ MaNa er citeret for at sige, “jeg var imponeret over at se AlphaStar pull off avancerede bevægelser og forskellige strategier på tværs af næsten alle spil, ved hjælp af en meget menneskelig stil gameplay, jeg ikke ville have forventet.”
Det vil være interessant at se, hvor papiret kommer ud, om det så er Hassabis og kolleger løfte, dette mash up af forskellige machine learning teknikker producerer udbytte i andre områder af forskning. Som de skriver i indlægget, “Vi mener, at denne avancerede model, der vil hjælpe med mange andre udfordringer i machine learning forskning, der involverer lang sigt sekvens modellering og stort output-rum, såsom oversættelse, sprog modellering og visuelle repræsentationer.”
Tidligere og relaterede dækning:
Hvad er AI? Alt, hvad du behøver at vide
En executive guide til kunstig intelligens, fra machine learning og generelt AI til neurale netværk.
Hvad er dyb læring? Alt, hvad du behøver at vide
Den lowdown på en dyb læring: fra hvordan det relaterer til det bredere felt af machine learning igennem til, hvordan du kommer i gang med det.
Hvad er machine learning? Alt, hvad du behøver at vide
Denne vejledning forklarer, hvad machine learning er, hvordan det er relateret til kunstig intelligens, hvordan det fungerer, og hvorfor det er vigtigt.
Hvad er cloud computing? Alt, hvad du behøver at vide om
En introduktion til cloud computing-lige fra det grundlæggende op til IaaS og PaaS, hybrid, offentlige og private cloud.
Relaterede Emner:
Digital Transformation
CXO
Tingenes Internet
Innovation
Virksomhedens Software