Retfærdighed i AI, StarCraft Udgave

0
110

En interessant debat er på vej over Googles annoncering sidste uge af nogle detaljer om sit forsøg på at slaget mennesker på video-spil StarCraft II, en debat om, hvad der “AI” er og hvad “retfærdighed” kan betyde for området.

Også: Google funderer den mangler af machine learning

ArsTechnica ‘s Timothy B. Lee offentliggjorde en artikel i går analysere face-off mellem Google’ s DeepMind enhed AlphaStar edb-program mod en af de dominerende menneskelige champs på StarCraft II, Polens Grzegorz Komincz, der er kendt af hans gamer håndtere MaNa.

Lee argumenterer Google vinde over MaNa var “ikke en fair kamp,” med henvisning til det faktum, at AlphaStar ‘ s neurale netværk konfiguration havde en fordel i at have adgang til “rå” data spil i løbet af spillet, data, at den menneskelige spillere ikke har. Når DeepMind forskere tvunget AlphaStar til at spille med kun at kigge gennem et “kamera”, den måde, mennesker ser spillet, er det tabt.

Brugen af ekstra oplysninger ved at AlphaStar rejser to sammenslyngede spørgsmål: Bør machine learning være begrænset af menneskelige begrænsninger, for at være fair, og hvis det ikke er tilfældet, kan det virkelig gøre nogen krav til at udvikle noget, der kaldes intelligens, i det mindste i den forstand, at de fleste mennesker bruger dette begreb?

Også: Google ‘ s AI surfer “gamescape” for at erobre game theory

Lee har den opfattelse, at AI skal være bundet af fair regler: “Den ultimative måde at level playing field, ville være at gøre AlphaStar bruge den nøjagtige samme brugergrænseflade som menneskelige spillere,” skriver han.

148 kommentarer som svar til Lee ‘ s artikel, som torsdag eftermiddag, tilbyder en livlig debat om emnet. Nogle hævder, at AlphaStar er adgang til de rå data, giver det en mulighed for at bedre at planlægge sine handlinger og derfor at foretage handlinger, som et menneske aldrig kunne. Andre peger ud af de bevægelser, der AlphaStar kom op med i reaktion til, at information har fordele, men at de er simple tricks, der ikke synes ligesom sofistikeret strategiplanlægning, i modsætning til hvad Google ‘ s forskere antyde, om deres præstation. Nogle, der tager det modsatte synspunkt, tyder på, at hvis en maskine, der kan manipulere en video spil, det er ingen overraskelse, en maskine, bør være i stand til at manipulere en anden maskine alligevel kan det.

screenshot-width-1500.png

Screent fange af AlphaStar at spille mod den menneskelige Team Flydende.

(Billede: Google DeepMind/Blizzard Entertainment)

New York University psykologi professor Gary Marcus, der har været en hyppig kritik af den dybe læring tilgang til AI, skrev på Twitter, at den AlphaStar meddelelse var “DeepMind’ s seneste pr-stunt.”

deepmind ‘ s seneste pr-stunt, dissekeret. https://t.co/piLnejQXUs

— Gary Marcus (@GaryMarcus) 30 Januar 2019

Han fulgte op med at sige, at StarCraft II ikke skal endda være betragtes som en “stor udfordring” for AI, som DeepMind hævder.

Jeg tror ikke engang Starcraft er en “stor udfordring”; det er også bare en del af PR-spil. Men ja aktuelle AI er nyttigt, selv om det ikke er virkelig, helst i nærheden af AGI. Der er uenig?

— Gary Marcus (@GaryMarcus) 30 Januar 2019

Også: Google ‘ s StarCraft II sejr viser AI forbedrer via mangfoldighed, opfindsomhed, der ikke er reflekser

Fordi der ikke er nogen akademisk papir, men fra DeepMind, mange detaljer om det arbejde, der er vage. For eksempel, Marcus påpeger, at det er ikke klart fra DeepMind beskrivelse om AlphaStar ‘ s er inkluderet i prisen “rå pixels” eller “pre-parsede API” opkald til StarCraft, og at den forskel, der betyder noget.

tak! men det betyder ikke sige, om den særlige software, der vandt mod eksperter, der bruges pixels eller preparsed APi ting, som begge er til rådighed, men meget forskellige

— Gary Marcus (@GaryMarcus) 31 Januar 2019

DeepMind siger den adgang til yderligere oplysninger, er ikke nøglen til sejr. I gruppens blog indlæg i sidste uge, forskerne skriver, at selv når AlphaStar var begrænset til kameraet opfattelse af spillet, programmet var “næsten lige så stærk som den rå interface.” Fra, at forskerne konkluderer, at “disse resultater tyder på, at AlphaStar succes mod MaNa og TLO [de to spillere] var faktisk på grund af overlegen makro-og mikro-den strategiske beslutningsproces, snarere end superior-klik-rate, hurtigere reaktionstider, eller den rå interface.”

Uanset hvor dette særlige punkt er løst ved fremtidig forskning, at meget af uddybningen af de sidste 24 timer sandsynligt er fejl om prioriteringer og intentioner i AlphaStar arbejde. Begreberne retfærdighed og intelligens er uklarhed sagen. Hvad lille er til rådighed i stillingen, og i relaterede arbejde, gør det klart, at prioriteringer af DeepMind forskere er forskellige fra, hvad Lee og Marcus, og andre mener, at det at være.

Også: Kina ‘ s AI-forskere underviser i et neuralt net til at uddanne sig

google-deepmind-alphastar-training-jan-2019.png

DeepMind træning af en elite spiller-i modsætning til alt, et menneske atlet nogensinde har oplevet.

Google DeepMind

For én ting, blog-indlæg, gør det klart, at med sin privilegerede adgang, AlphaStar stadig har at slås med “fog of war”, som det hedder, hvilket betyder, at det ikke har adgang til ressourcer af modstandere, der ikke er synlige på brættet, enten gennem kameraet, gennem raw-pixels, eller en gennem API. Sådanne private oplysninger udpeger spillet som et spil af “ufuldstændig information”, som er et afgørende begreb i spil teori.

Beskæftiger sig med fog of war er naturligvis, at DeepMind, et vigtigt aspekt af, hvad forskere forsøger at ingeniør. I 2017 papir på StarCraft II, der produceres af DeepMind, StarCraft II: EN Ny Udfordring for at Styrke Læring, forfatterne eksplicit separat fog of war som et separat begrænsning fra kameraet — de to er ikke det samme.

Endvidere fokuserer på ekstra oplysninger, og kameraet er mærkeligt i betragtning af, at den måde, AlphaStar forbedrer det er helt klart ikke noget menneske. Blog-indlæg tyder på, at AlphaStar bygger på arbejde med DeepMind David Balduzzi og kolleger på noget, der hedder Nash gennemsnit, hvor flere spillere er i undersøgelsen af det neurale netværk på tværs af flere spil, for at skabe en slags ideal-afspiller indbygget fra fordelene ved de forskellige agenter i de flere spil. Der involverede nogle af de enkelte agenter oplever “op til 200 år i real-tid StarCraft spiller.” Mere detaljer, der synes er relevante, blev tilbudt op i et nyt papir af Balduzzi og kolleger på fredag.

Også: MIT lader AI “syntetisere” computer programmer til at hjælpe data forskere

Den DeepMind tilgang til Nash gennemsnit og resten kan blive bedre til at spille mod mennesker dette år, med og uden menneske-lignende begrænsninger, som kameraet. Men det er helt klart ikke en form for træning, at et enkelt menneske spiller ville genkende. Ligesom med AlphaGo Nul, hvilket i 2017 erobret menneskelige spillere af den klassiske strategi spil Gå, AlphaStar skrider frem, som betyder, at der er noget nyt, noget der ikke sammenlignes direkte til menneskelig erfaring.

Skal læse

“AI er meget, meget dum, “siger Google’ s AI-leder (CNET), Hvordan man får alle Google Assistant ‘s nye stemmer lige nu (CNET)Samlet Google AI division et klart signal om, at AI’ s fremtid (TechRepublic)Top 5: Ting at vide om AI (TechRepublic)

Intet af dette virkelig taler til retfærdighed, per se, men det er heller ikke klart, hvad retfærdighed er, formodes at være i forbindelse med et video spil. StarCraft er et simuleret miljø med visse regler, men det var altid muligt at udnytte spillet gennem en smart teknik. Derfor råb om retfærdighed er noget ved siden af det punkt.

En stor del af, hvad Balduzzi og andre på DeepMind forsøger at opnå, er ikke til at finde menneskers intelligens, men at finde en bedre måde at ingeniør dybt “reinforcement learning” for at skabe systemer, der kan få en form for arbejde, der er udført, og også at finde ud af, hvad der sker med klassiske spil teori, når det er testet på en ny skala.

Af grunde som disse, at mennesker er tilbøjelige til at ende op finde at deres forudsætninger om AlphaStar, og om dyb læring i almindelighed, er ikke virkelig i fokus i dyb læring. Udvikling af intelligens, af en eller anden slags er helt sikkert et fokus på DeepMind og andre i området. Og forhåbentlig er, så er retfærdighed. Men på dette tidspunkt, hverken intelligens eller retfærdighed, som er formuleret i dyb læring er i overensstemmelse med forestillinger om, at Lee og Marcus, og andre er fremme som selvindlysende. Hvad der er på vej er noget andet, og forventninger kan blive nødt til at blive justeret til den tekniske virkelighed.

Tidligere og relaterede dækning:

Hvad er AI? Alt, hvad du behøver at vide

En executive guide til kunstig intelligens, fra machine learning og generelt AI til neurale netværk.

Hvad er dyb læring? Alt, hvad du behøver at vide

Den lowdown på en dyb læring: fra hvordan det relaterer til det bredere felt af machine learning igennem til, hvordan du kommer i gang med det.

Hvad er machine learning? Alt, hvad du behøver at vide

Denne vejledning forklarer, hvad machine learning er, hvordan det er relateret til kunstig intelligens, hvordan det fungerer, og hvorfor det er vigtigt.

Hvad er cloud computing? Alt, hvad du behøver at vide om

En introduktion til cloud computing-lige fra det grundlæggende op til IaaS og PaaS, hybrid, offentlige og private cloud.

Relaterede historier:

Google ‘ s AI surfer “gamescape” for at erobre game theory
Dette er, hvad AI ligner (som skitseret ved AI)
Google ‘ s DeepMind hold med førende 3D spil dev platform
DeepMind ‘ s AI pletter tidlige tegn på øjensygdom

Relaterede Emner:

Google

Digital Transformation

CXO

Tingenes Internet

Innovation

Virksomhedens Software