Come fanno le macchine contro gli esseri umani in situazioni di competizione, non può essere il tipico cose che ci si aspetta, come tempo di risposta, ma piuttosto la capacità di massimizzare buone scelte attraverso una lunga esperienza.
Questo è uno dei takeaway dal Dec. 19 match-up in tempo reale strategia di computer di gioco di StarCraft II tra un computer, AlphaStar, sviluppato da Google, contro un uomo champion, Polonia Grzegorz Komincz, conosciuto con il suo giocatore di gestire il MaNa.
Un post sul blog dal AlphaStar team di giovedì rivela alcuni interessanti spunti su come dicembre trionfo è stato creato. (Documento di ricerca è in corso.)
AlphaStar tornato da molte perdite nel 2017 per sonoramente sbizzarrire con MaNa di cinque giochi a zero nel dicembre del match. “Il primo sistema di battere un top [umano] pro”, come AlphaStar creatori di twitter nella giornata di giovedì.
Anche: Cina AI scienziati insegnare una rete neurale di treno stesso

Screent acquisizione di AlphaStar giocando contro la Squadra di umani Liquido.
(Immagine: Google DeepMind/Blizzard Entertainment)
La differenza può essere una strategia di formazione AlphaStar che ha impiegato nuova “meta-gioco” tecniche per la coltivazione di un giocatore di master.
La macchina non è più veloce di esseri umani a prendere azioni. Infatti, il suo numero medio di azioni in StarCraft II è di 280 al minuto, “significativamente inferiore rispetto al professional [umano] i giocatori.”
Invece, la sua forza sembra essere in arrivo con nuove strategie o insoliti colpi di scena esistenti strategie di accumulare conoscenze su molti giochi. Google DeepMind team ha utilizzato un romanzo “meta-gioco” approccio per la formazione dei loro rete, la costituzione di una lega di giocatori nel corso di migliaia e migliaia di simultanea le partite di allenamento, e quindi, la scelta ottimale da giocatore, risultati di ciascuno.
Anche: MIT consente AI “sintetizzare” i programmi per computer per gli aiuti dati scienziati
StarCraft II, ultimo in StarCraft franchising da Santa Monica basato su video game maker Activision-Blizzard, richiede ai giocatori di marziale lavoratori che si spostano attraverso le due dimensioni del terreno, la raccolta di risorse come i minerali, costruzione di edifici, e l’assemblaggio di eserciti, per ottenere il dominio contro altri giocatori. Il gioco uscì nel 1998 ed è stato un torneo di gioco di sempre.
È stato un focolaio di AI innovazione, perché Google e gli altri vedono in gioco diversi fattori che lo rendono molto più impegnativo rispetto ad altre video giochi classici giochi di strategia come gli Scacchi o Andare. Questi includono il fatto StarCraft è una “nebbia di guerra” aspetto, che ogni giocatori, tra cui l’IA di “agenti” in fase di sviluppo, hanno informazioni limitate perché non riesce a vedere gli aspetti di un terreno dove i loro avversari possono aver fatto dei progressi.
Nel 2017, quando Google DeepMind unità, e i programmatori Blizzard pubblicato il loro primo lavoro, hanno scritto che erano in grado di ottenere i loro algoritmi per il gioco “in prossimità umane di giocare”, ma che non riusciva nemmeno a insegnare a battere il built-in AI, che viene fornito con StarCraft.
La cattura di una schermata di come il AlphaStar modello che si riflette sul gioco, che parti della rete neurale sono la cottura a momenti nel tempo, le strategie si sta considerando.
(Immagine: Google DeepMind/Blizzard Entertainment)
La squadra leccato le ferite, ed è tornato con una serie di innovazioni, questa volta. Una carta sta per essere pubblicato presto, secondo DeepMind, fondatore e CEO di Demis Hassabis.
Al suo interno, AlphaStar, come il 2017 versione, ancora è basato su un apprendimento profondo approccio di che cosa sono conosciuti come reti neurali ricorrenti, o RNNs, per mantenere una sorta di memoria di precedenti ingressi, che permette loro di costruire le conoscenze accumulate nel corso di addestramento della rete neurale.
Gli autori, tuttavia, aumentata la tipica “lungo la memoria a breve termine,” o LSTM, rete neurale con qualcosa chiamato un “trasformatore”, sviluppato da Google Ashish Vaswani e colleghi nel 2017. È in grado di spostare una “testa di lettura” in diversi punti di una rete neurale per recuperare prima i dati in modo selettivo. Ci sono un sacco di nuove cose, come questo.
Ma uno dei più provocatori modi il piano di gioco è cambiato è l’integrazione di un approccio all’abbattimento migliori giocatori, chiamato “Nash media”, ha introdotto lo scorso anno da David Balduzzi e i suoi colleghi DeepMind. Gli autori hanno osservato che le reti neurali sono un sacco di “ridondanza”, che significa “diversi agenti, reti, algoritmi, gli ambienti e le attività che fanno sostanzialmente lo stesso lavoro.” A causa di ciò, il Nash media è in grado di tipo selettivo, regola, o “l’ablazione,” i licenziamenti per rivelare fondamentale sottostante vantaggi di un particolare AI “agente”, che la riproduzione di un video gioco (o qualsiasi attività).
Un grafico della Nash media processo mediante il quale il lettore ideale è in costruzione. “La finale AlphaStar agente è costituita da componenti di Nash distribuzione — in altre parole, il più efficace mix di strategie che sono stati scoperti.”
(Immagine: Google DeepMind/Blizzard Entertainment)
Come Balduzzi e colleghi hanno scritto nel loro articolo, “Nash valutazione calcola una distribuzione giocatori (agenti, agenti e compiti) che regola automaticamente per i dati ridondanti. Si prevede quindi un invariante approccio alla misurazione dell’agente-agente e agente-ambiente interazioni”.
Nash in media è stato utilizzato per scegliere il meglio di AlphaStar i giocatori nell’arco di molti giochi. Come AlphaStar team di scrittura, “Un continuo league è stato creato, con gli agenti della lega – concorrenti – giocare a giochi contro gli altri […] Mentre alcuni nuovi concorrenti eseguire una strategia che è solo un affinamento di una strategia precedente, gli altri a scoprire drasticamente nuove strategie.”
Ma non è solo l’elezione di un giocatore che splende, il Nash processo è effettivamente confezionare un singolo giocatore che fonde tutto l’apprendimento e comprensione degli altri. Il finale AlphaStar agente è costituita da componenti di Nash distribuzione — in altre parole, il più efficace mix di strategie che sono stati scoperti.”
Deve leggere
‘IA è molto, molto stupido”, dice Google AI leader (CNET)Baidu crea Kunlun di silicio per AIUnified Google IA divisione di un chiaro segnale di AI del futuro (TechRepublic)
La chiave è che la formazione di tutti questi concorrenti offre ogni IA agente unico, gli obiettivi e gli obiettivi, in modo che il numero di possibili soluzioni per il gioco esplorato espande costantemente. È una sorta di sopravvivenza del più forte dei videogiochi, con i giocatori che andare contro gli esseri umani, beneficiando di una rapida evoluzione nei mesi di gioco.
Echi di ciò che è accaduto con i Go, dove DeepMind è AlphaGo è stato in grado di inventare totalmente nuove strategie, champ MaNa è citato come dicendo, “mi ha colpito vedere AlphaStar tirare fuori avanzate mosse e strategie diverse in quasi ogni gioco, per mezzo di un umano lo stile di gioco non mi aspettavo.”
Sarà interessante vedere, quando la carta viene fuori, se, come Hassabis e colleghi promessa, questo mash up di varie tecniche di machine learning produce dividendi in altri campi di ricerca. Come scrivono nel post, “crediamo che questo modello avanzato di aiuto a molte altre sfide di apprendimento automatico di ricerca che coinvolgono a lungo termine della sequenza di modellazione e di output di grandi spazi come la traduzione di un linguaggio di modellazione e rappresentazione visiva.”
Precedente e relativa copertura:
Che cosa è l’IA? Tutto quello che devi sapere
Un esecutivo a guida di intelligenza artificiale, machine learning e generale AI alle reti neurali.
Cos’è il deep learning? Tutto quello che devi sapere
Il lowdown su deep learning: da come si relaziona con il più ampio campo di machine learning a come iniziare con esso.
Che cosa è macchina di apprendimento? Tutto quello che devi sapere
Questa guida spiega in cosa consiste la macchina di apprendimento, di come esso è legato all’intelligenza artificiale, come funziona e perché è importante.
Che cos’è il cloud computing? Tutto quello che devi sapere su
Un’introduzione al cloud computing destra, dalle nozioni di base fino a IaaS e PaaS, ibrido, public e private cloud.
Argomenti Correlati:
La Trasformazione Digitale
CXO
Internet delle Cose
L’innovazione
Enterprise Software