Nul

(Billede: DeepMind)
DeepMind har sagt, at det har skabt de bedste Go-spiller i verden, fordi det var i stand til at gøre op med den menneskelige viden og starte med en blank tavle.
AlphaGo Nul begynder med at spille “helt tilfældigt” Go spil mod sig selv, og i tre dage er i stand til at besejre af 100 spil til 0 den version af AlphaGo, der besejrede Lee Se-dol i Marts 2016, siger virksomheden i et blog-indlæg.
Ved 21-dages mærke, at det er i stand til at besejre AlphaGo Master — en online version, der udkom i januar og vandt over 60 lige spil mod de bedste Go-spillere-og efter 40 dage, er i stand til at slå alle andre versioner af AlphaGo.
DeepMind medstifter og CEO Demis Hassabis sagde træning processen for det underliggende neurale netværk AlphaGo Nul blev fjernet igen for at fjerne nogle “hånd-manipuleret funktioner”, der tidligere er brugt, har gjort brug af en enkelt netværk snarere end et par netværk, og gjorde op med Monte-Carlo rollouts.
“Systemet starter med et neuralt netværk, der kender intet om spillet Go. Det så spiller spil mod sig selv, ved at kombinere dette neurale netværk med en kraftfuld søge-algoritme,” Hassabis sagde. “Denne opdaterede neurale netværk er så recombined søge-algoritme til at skabe en ny, stærkere version af AlphaGo Nul, og processen begynder forfra.”
“Denne teknik er mere kraftfuld end tidligere versioner af AlphaGo, fordi det ikke længere er begrænset af grænserne for menneskelig viden. I stedet, det er i stand til at lære tabula rasa fra den stærkeste spiller i verden: AlphaGo sig selv.”
Ved at fjerne behovet for at lære af mennesker, DeepMind ledende forsker David Silver sagde, at det er muligt at få generelle AI algoritmer.
“Det faktum, at vi har set et program opnå et meget højt præstationsniveau i et domæne, som kompliceret og udfordrende som at Gå, bør det betyde, at vi nu kan begynde at tackle nogle af de mest udfordrende og slagkraftige problemer for menneskeheden,” sagde han.
Selv om DeepMind vundet berømmelse ved at besejre menneskelige Gå spillere, virksomheden har også rettet sin opmærksomhed til StarCraft II.
“Vi har arbejdet tæt sammen med StarCraft II team til at udvikle en API, der støtter noget der ligner tidligere bots skrevet med et ‘manuskript’ – interface, så programmerbar kontrol over de enkelte enheder og adgang til det fulde spil tilstand (med nogle nye muligheder, som godt),” DeepMind sagde i November 2016.
“I sidste ende, agenter vil spille direkte fra pixels, så for at få os der, vi har udviklet et nyt billede-baseret brugergrænseflade, der giver en forenklet lav opløsning RGB image data for kort og minimap, og mulighed for at bryde ud har i separate ‘lag’, som terræn heightfield, enhed type, enhed, sundhed osv.”
Alfabet-ejet selskab, som sagde, at det valgte StarCraft II, fordi det var tættere på den virkelige verden, miljøet end nogen andre spil til den, der er brugt til afprøvning, så langt, som det spilles i real-time.
“De færdigheder, der kræves for en agent for at fremskridt gennem miljø og spille StarCraft godt i sidste ende kunne overføre til den virkelige verden opgaver,” det hævdede.
Relaterede dækning
Der er en enorm mulighed for inden for robotteknologi for tidlige karriere dataloger og alvorlige software ingeniører
Maya Cakmak er banebrydende måder for ikke-eksperter at programmere robotter. Hendes arbejde er at åbne et nyt felt, du bør vide om.
AI, robotteknologi, IoT, augmented og virtual reality til at styrke IKT-udgifter
Ifølge IDC, udgifter til nye teknologier, der vil tage fart over de næste fem år, og øge udgifter til informations-og kommunikations teknologi generelt.
Den robot revolution er allerede sket i et overraskende antal af industrier (og det har intet at gøre med AI)
Overkommelige robot-automation er nu tilgængelig for mom and pop-shops, som er kørsel skøre vækst i robotteknologi industrien.
0