NORSK

Eerlijkheid, in AI, StarCraft Edition

135

Een interessante discussie ontstaan is over Google ‘ s aankondiging vorige week van een aantal details van zijn poging om de strijd van de mens bij de video game StarCraft II, een debat over wat de “AI” is en wat “eerlijk” kunnen betekenen voor het gebied.

Ook: Google overdenkt de tekortkomingen van machine learning

ArsTechnica is Timothy B. Lee een artikel publiceerde gisteren het analyseren van de face-off tussen Google DeepMind eenheid AlphaStar computer programma tegen één van de dominante menselijke champs in StarCraft II, Polen Grzegorz Komincz, bekend door zijn gamer handvat MaNa.

Lee stelt de Google winnen over MaNa “geen eerlijke strijd,” gezien het feit dat AlphaStar het neurale netwerk configuratie had een voordeel in het hebben van toegang tot de “raw” data voor het spel in de loop van het spel, gegevens die de menselijke spelers niet hebben. Wanneer DeepMind onderzoekers gedwongen AlphaStar te spelen door alleen te kijken door middel van een “camera” de wijze mens ziet het spel verloren.

Het gebruik van extra informatie door AlphaStar roept twee verstrengeld vragen: Moeten ‘machine learning’ worden beperkt door de menselijke beperkingen, om fair te zijn, en als het niet zo is, kan het echt geen beweert te zijn het ontwikkelen van iets genaamd intelligence, althans in de zin de meeste mensen gebruiken die term?

Ook: Google AI surft op het “gamescape” te veroveren spel theorie

Lee biedt het standpunt dat de AI moet worden gebonden door eerlijke regels: “De ultieme manier om het speelveld te maken AlphaStar gebruik exact dezelfde user interface als de menselijke spelers,” schrijft hij.

De 148 opmerkingen in reactie op Lee ‘ s artikel, van donderdag middag, bieden een levendig debat over de kwestie. Sommigen beweren dat AlphaStar de toegang tot de ruwe data geven een mogelijkheid om beter te plannen acties en dus om handelingen die een mens nooit zou kunnen. Anderen wijzen op de bewegingen die AlphaStar kwam met in antwoord op die informatie hebben voordelen, maar dat ze eenvoudige trucs die niet lijkt geavanceerde strategizing, in tegenstelling tot wat Google onderzoekers impliceren over hun prestatie. Sommigen nemen van de tegenstander te bekijken, suggereren dat als je een machine kunt manipuleren van een video game, dat is geen verrassing, een machine moet in staat zijn om het manipuleren van andere machine toch het kan.

New York Universiteit psychologie professor Gary Marcus, die regelmatig criticus van de diepe leren benadering van AI, schreef op Twitter dat de AlphaStar aankondiging werd “DeepMind de nieuwste stunt.”

deepmind de laatste stunt, ontleed. https://t.co/piLnejQXUs

— Gary Marcus (@GaryMarcus) 30 Januari 2019

Hij opgevolgd door te zeggen dat StarCraft II moet zelfs niet worden beschouwd als een “grand challenge” voor AI, als DeepMind stelt.

Ik weet niet eens dat Starcraft is een “grand challenge”; ook dat is slechts een deel van het PR-spel. Maar ja, de AI is nuttig, zelfs als het niet echt ergens in de buurt AGI. Wie het niet eens is?

— Gary Marcus (@GaryMarcus) 30 Januari 2019

Ook: Google StarCraft II overwinning toont AI verbetert via diversiteit, uitvinding, geen reflexen

Want er is geen academische paper nog van DeepMind, veel details van het werk zijn vaag. Bijvoorbeeld, Marcus wijst erop dat het niet duidelijk uit DeepMind de beschrijving of AlphaStar is inclusief toegang tot de “raw pixels” of “pre-parsed API” gesprekken met StarCraft, en dat het verschil zaken.

bedankt! maar dat wil niet zeggen of het bepaalde software die gewonnen tegen deskundigen gebruikt pixels of preparsed APi dingen, die beide beschikbaar zijn, maar heel anders

— Gary Marcus (@GaryMarcus) 31 Januari 2019

DeepMind zegt dat de toegang tot de extra informatie is niet de sleutel tot de overwinning. In de blog post van vorige week, de onderzoekers schrijven dat zelfs wanneer AlphaStar beperkt was tot de camera van het spel, het programma was “bijna net zo sterk als de raw-interface.” De onderzoekers concluderen dat “deze resultaten suggereren dat AlphaStar succes tegen MaNa en TLO [de twee menselijke spelers] was in feite als gevolg van een superieure macro-en micro-strategische besluitvorming, eerder dan de superior klik-tarief, met snellere reactietijden, of de raw-interface.”

Ongeacht de manier waarop dit specifieke punt is opgelost door toekomstig onderzoek, veel van het commentaar van de afgelopen 24 uur waarschijnlijk vergist zich over de prioriteiten en de bedoelingen van de AlphaStar werk. De begrippen eerlijkheid en intelligentie zijn vertroebeling van de zaak. Wat weinig is beschikbaar in de post, en in de daarmee verband houdende werkzaamheden, maakt duidelijk dat de prioriteiten van de DeepMind onderzoekers verschillen van wat Lee en Marcus en anderen geloven dat het aan.

Ook: China ‘ s AI-wetenschappers leren een neuraal net naar de trein zelf

Voor een ding, de blog post maakt duidelijk dat met haar bevoorrechte toegang, AlphaStar heeft nog steeds te kampen met de “fog of war”, zoals het heet, dat betekent, hij heeft geen toegang tot de middelen van de tegenstanders, die niet zichtbaar zijn op het bord, of door middel van camera bekijken, door ruwe pixels, of via de API. Dergelijke privé-informatie, geeft het spel een spel van “onvolledige informatie”, dat is een cruciaal concept in de speltheorie.

Het omgaan met de mist van de oorlog is uiteraard DeepMind, een belangrijk aspect van wat de onderzoekers proberen op te lossen. In 2017 papier op StarCraft II geproduceerd door DeepMind, StarCraft II: EEN Nieuwe Uitdaging voor Reinforcement Learning, de auteurs expliciet aparte mist van de oorlog als een aparte beperking van de camera te bekijken — de twee zijn niet hetzelfde.

Bovendien, de focus op extra informatie en bekijk de camera is vreemd gezien het feit dat de manier AlphaStar verbetert is duidelijk niet iets menselijk. De blog post suggereert dat AlphaStar bouwt voort op het werk van DeepMind David Balduzzi en collega ‘ s over de naam iets Nash gemiddeld, waar meerdere spelers zijn onderzocht door het neurale netwerk in meerdere games, maken een soort van ideale speler opgebouwd uit sterke punten van de verschillende agenten in de diverse games. Dat sommige van de individuele agenten ervaren van “200 jaar van real-time StarCraft spelen.” Meer details die relevant lijken werden aangeboden in een nieuw papier door Balduzzi en collega ‘ s op vrijdag.

Ook: MIT kunt AI “synthetiseren” computer programma ‘ s om de steun van wetenschappers gegevens

De DeepMind aanpak van Nash gemiddeld en de rest kan beter worden in het spelen tegen mensen dit jaar, met en zonder menselijke beperkingen, zoals de camera bekijken. Maar het is duidelijk niet een vorm van training die een menselijke speler zou herkennen. Net als met AlphaGo Nul, die in 2017 veroverd menselijke spelers van de klassieke strategie spel Gaat, AlphaStar verloopt door middel die iets nieuws, iets niet rechtstreeks vergeleken worden aan de menselijke ervaring.

Moet lezen

‘AI is heel, heel stom,’ zegt Google AI leider (CNET)Hoe krijg je al die Google Assistent van de nieuwe stemmen nu (CNET)Unified Google AI afdeling een duidelijk signaal van AI ‘ s toekomst (TechRepublic)Top 5: Dingen om te weten over AI (TechRepublic)

Niets van dit spreekt voor eerlijkheid, per se, maar het is ook niet duidelijk wat eerlijkheid is de bedoeling om in het kader van een video game. StarCraft is een gesimuleerde omgeving met bepaalde regels, maar het was altijd mogelijk misbruik te maken van het spel door middel van slimme techniek. Vandaar, kreten voor eerlijkheid zijn enigszins naast het punt.

Een groot deel van wat Balduzzi en anderen op DeepMind probeert te bereiken is niet het vinden van menselijke intelligentie, maar een betere manier vinden om te engineer diep “reinforcement learning” te maken van systemen die kunnen een soort van werk, en ook om te vinden wat er gebeurt op de klassieke speltheorie wanneer het wordt getest met een nieuwe schaal.

Om redenen zoals deze mensen zijn waarschijnlijk vinden dat hun vooronderstellingen over AlphaStar, en over de diepe leren in het algemeen, zijn niet echt de focus van diep leren. De ontwikkeling van intelligentie van een soort is zeker een focus van DeepMind en anderen in het veld. En hopelijk, zo is eerlijkheid. Maar op dit punt in de tijd, noch intelligentie noch billijkheid zoals geformuleerd in de diepe leren van akkoorden met de begrippen die Lee en Marcus en anderen zijn het bevorderen van self-evident. Wat in opkomst is, is iets anders, en de verwachtingen kunnen aangepast moeten worden aan de technische realiteit.

Vorige en aanverwante dekking:

Wat is AI? Alles wat je moet weten

Een executive gids voor kunstmatige intelligentie, van machine learning en algemene AI-neurale netwerken.

Wat is diep leren? Alles wat je moet weten

De lowdown op diep leren: van hoe het zich verhoudt tot het bredere veld van machine-leren door te zien hoe aan de slag met het.

Wat is machine learning? Alles wat je moet weten

In deze gids wordt uitgelegd wat ‘machine learning’ is, hoe het is in verband met kunstmatige intelligentie, hoe het werkt en waarom het belangrijk is.

Wat is cloud computing? Alles wat u moet weten over

Een introductie van cloud computing recht vanaf de basis tot IaaS en PaaS -, hybride -, public en private cloud.

Verwante artikelen:

Google AI surft op het “gamescape” te veroveren spel theorie
Dit is wat AI eruit ziet (zoals geschetst door AI)
Google DeepMind teams met toonaangevende 3D-game dev platform
DeepMind AI plekken vroege tekenen van de ziekte van het oog

Verwante Onderwerpen:

Google

Digitale Transformatie

CXO

Het Internet van Dingen

Innovatie

Enterprise Software