Rättvisa i AI, StarCraft Edition

0
145

En intressant debatt är att växa över Googles uttalande i förra veckan av vissa detaljer i sina försök att slåss människor i StarCraft II, en debatt om vad “AI” är och vad “rättvisa” kan innebära för området.

Också: Google funderar brister av maskininlärning

ArsTechnica är Timothy B. Lee publicerade en artikel igår att analysera face-off mellan Googles DeepMind enhet AlphaStar datorprogram mot en av de dominerande mänskliga champs på StarCraft II, Polen, Grzegorz Komincz, känd genom sitt gamer hantera MaNa.

Lee menar Google vinna över MaNa var “inte en rättvis kamp,” med hänvisning till det faktum att AlphaStar s neural network configuration hade en fördel i att ha tillgång till “raw” data spel under loppet av lek, uppgifter som mänskliga spelare inte har. När DeepMind forskare tvingas AlphaStar att spela genom att bara titta igenom en “kamera”, så som människor ser spelet, det förlorade.

Användning av extra information genom att AlphaStar väcker två sammanflätade frågor: Bör machine learning begränsas av mänskliga begränsningar, för att vara rättvis, och om det inte är, kan det verkligen göra några anspråk på att vara att utveckla något som kallas intelligens, åtminstone i den meningen att de flesta människor använder termen?

Också: Googles AI surfar “gamescape” att erövra spelteori

Lee erbjuder utsikt att AI bör vara bunden av rättvisa regler: “Det ultimata sättet att skapa lika konkurrensvillkor skulle vara att göra AlphaStar använda exakt samma användargränssnitt som mänskliga spelare”, skriver han.

148 kommentarer som svar på Lee ‘ s artikel, som på torsdag eftermiddag, erbjuder en livlig debatt om frågan. Vissa hävdar att AlphaStar tillgång till rådata för att ge det en möjlighet att bättre planera sina handlingar och därför att göra handlingar som en människa aldrig skulle kunna. Andra påpekar att de rörelser som AlphaStar kom upp med svar på dessa uppgifter har sina fördelar, men att de är enkla knep för att inte verka som sofistikerade strategizing, i motsats till vad Google: s forskare antyder om sin prestation. Några, med motsatt uppfattning, tyder på att om en maskin kan manipulera ett tv-spel, det är ingen överraskning, en maskin ska kunna manipulera en annan maskin hur som helst kan det.

screenshot-width-1500.png

Screent fånga AlphaStar att spela mot de mänskliga Team Liquid.

(Bild: Google DeepMind/Blizzard Entertainment)

New York University professor i psykologi Gary Marcus, som har varit en flitig kritiker av den djupa lärande förhållningssätt till AI, skrev på Twitter att AlphaStar tillkännagivandet var “DeepMind senaste pr-trick.”

deepmind senaste pr-trick, dissekeras. https://t.co/piLnejQXUs

— Gary Marcus (@GaryMarcus) Januari 30, 2019

Han följde upp med att säga att StarCraft II bör inte ens vara en “stor utmaning” för AI, som DeepMind hävdar.

Jag tror inte ens Starcraft är en “stor utmaning”; det är också bara en del av PR-spelet. Men ja ström AI är användbar, även om det egentligen inte är någonstans i närheten av AGI. Som misstycker?

— Gary Marcus (@GaryMarcus) Januari 30, 2019

Också: Google: s StarCraft II seger visar AI förbättrar via mångfald, uppfinning, inte reflexer

Eftersom det är ingen akademisk uppsats men från DeepMind, många detaljer i arbetet är vaga. Till exempel, Marcus påpekar att det inte är tydligt från DeepMind beskrivning om AlphaStar s fi ingår “raw pixlar” eller “pre-analyserad API” samtal till StarCraft, och att skillnaden frågor.

tack! men det betyder inte säga om särskild programvara som vann mot experter används pixlar eller preparsed APi saker, som är både tillgänglig, men mycket olika

— Gary Marcus (@GaryMarcus) Den 31 Januari 2019

DeepMind säger tillgång till extra information är inte nyckeln till seger. I koncernens blogginlägg förra veckan, skriver forskarna att även när AlphaStar var begränsad till kameran läser av spelet, programmet var “nästan lika stark som raw-interface.” Från att forskarna drar därför slutsatsen att “dessa resultat tyder på att AlphaStar framgång mot MaNa och TLO [de två mänskliga spelare] var i själva verket på grund av överlägsen makro-och mikro-strategiska beslutsfattande, snarare än superior-click-rate, snabbare reaktionstider, eller raw-gränssnitt.”

Oavsett hur just denna fråga är löst genom att framtida forskning att mycket av de kommentarer de senaste 24 timmarna sannolikt är felaktig om prioriteringar och avsikter AlphaStar arbete. Begreppen rättvisa och intelligens är grumling frågan. Det lilla som finns tillgängliga i inlägget, och i arbetet, gör det tydligt att prioriteringar av DeepMind forskare skiljer sig från vad som Lee och Marcus och andra anser att det ska vara.

Också: Kinas AI-forskare undervisar ett neuralt nät för att utbilda sig

google-deepmind-alphastar-training-jan-2019.png

DeepMind utbildning av en elit spelare-till skillnad från något som en människa och idrottsman någonsin har upplevt.

Google DeepMind

För en sak, blogginlägg gör klart att med sin insiderinformation, AlphaStar fortfarande har att brottas med “fog of war”, som det kallas, vilket innebär att den inte har tillgång till resurser av motståndare som inte är synliga på spelplanen, antingen genom kameran, genom rå pixlar, eller via API. Sådan privat information betecknar det som ett spel för “ofullständig information, vilket är ett avgörande begrepp inom spelteori.

Arbetar med fog of war är självklart, att DeepMind, en viktig aspekt av vad forskarna försöker ingenjör. I 2017 papper på StarCraft II produceras av DeepMind, StarCraft II: EN Ny Utmaning för Inlärning, uttryckligen separat fog of war som en separat begränsning från kameran — de två är inte samma sak.

Dessutom fokus på extra information och kameran är konstigt med tanke på att vägen AlphaStar förbättrar uppenbarligen inte är något mänskligt. Blogginlägg tyder på att AlphaStar bygger på DeepMind David Balduzzi och kollegor om något som kallas Nash i genomsnitt, där flera spelare är undersökta av neurala nätverk över flera spel, för att skapa en sorts ideal spelare som byggts från styrkor av olika aktörer i de flera spel. Som involverade några av de enskilda aktörerna upplever “upp till 200 år i real-tid StarCraft spela.” Mer information som kan vara relevanta erbjöds upp i ett nytt papper av Balduzzi och kollegor på fredag.

Också: MIT låter AI “syntetisera” computer program till stöd för data forskare

Den DeepMind strategi för Nash i genomsnitt och resten kan bli bättre på att spela mot människor i år, med och utan mänskliga-liknande begränsningar såsom kamera-vyn. Men det är uppenbarligen inte en form av utbildning som en enda mänskliga spelare skulle känna igen. Precis som med AlphaGo Noll, vilket 2017 erövrade mänskliga spelare av det klassiska strategispelet Go, AlphaStar går genom som är något roman, något som inte kan jämföras direkt till mänsklig erfarenhet.

Måste läsa

‘AI är mycket, mycket dumt”, säger Googles AI ledare (CNET)Hur man får alla Google Assistant nya röster just nu (CNET)Enhetlig Google AI division en tydlig signal om att AI: s framtid (TechRepublic)Topp 5: Saker att veta om AI (TechRepublic)

Inget av detta talar egentligen för rättvisa, per se, men det är inte heller klart vad rättvisa är tänkt att ske i samband med ett tv-spel. StarCraft är en simulerad miljö med vissa regler, men det var alltid möjligt att utnyttja spelet genom smart teknik. Därför, rop på rättvisa är något bredvid punkten.

En stor del av vad Balduzzi och andra på DeepMind försöker uppnå är inte att hitta den mänskliga intelligensen, men att hitta ett bättre sätt att ingenjör djupt “reinforcement learning” att skapa system som kan få någon form av arbete, och också för att hitta vad som händer med klassisk spelteori när det är testat på en ny skala.

Av skäl som dessa människor är benägna att hamna finna att deras förutsättningar om AlphaStar, och om djupt lärande i allmänhet, är inte riktigt i fokus för djupt lärande. Utveckla intelligens av något slag är förvisso ett fokus för DeepMind och andra i området. Och förhoppningsvis så är rättvisa. Men vid denna tidpunkt, varken intelligens eller rättvisa som de är formulerade i djupt lärande stämmer överens med de föreställningar som Lee och Marcus och andra är att främja lika självklart. Vad som är fram är något annat, och förväntningar kan ha för att anpassas till den tekniska verkligheten.

Tidigare och relaterade täckning:

Vad är AI? Allt du behöver veta

En verkställande guide till artificiell intelligens, från maskininlärning och allmänna AI att neurala nätverk.

Vad är djupt lärande? Allt du behöver veta

Lowdown på djupt lärande: från hur det förhåller sig till de bredare fält av maskinen lärande genom hur man kommer igång med det.

Vad är lärande? Allt du behöver veta

Denna guide förklarar vad lärande är, hur den är relaterad till artificiell intelligens, hur det fungerar och varför det är viktigt.

Vad är cloud computing? Allt du behöver veta om

En introduktion till cloud computing rätt från grunderna upp till IaaS och PaaS, hybrid, offentliga och privata moln.

Relaterade artiklar:

Googles AI surfar “gamescape” att erövra spelteori
Detta är vad AI ser ut (som skissat av AI)
Googles DeepMind lag med ledande 3D-spel dev plattform
DeepMind AI fläckar tidiga tecken på ögonsjukdom

Relaterade Ämnen:

Google

Digital Omvandling

CXO

Sakernas Internet

Innovation

Affärssystem