Nul
Du har måske hørt, at machine learning teknologi har været i stand til at slå alle verdens største spillere af det gamle spil af Gå.
Men det er det, book en flybillet på Nettet?
Det er interessant rejst af den nyeste forskning fra Google AI efterforskere.
I et nyt papir fra holdet, de har uddannet et neuralt netværk til at forstå strukturen af Web-sider, og de valg, det kan gøre, når de udfylder formularer på en flybillet booker, eller interagerer med sociale media site.
Det arbejde, der stort set anvender de samme kategori af machine learning, som Google ‘ s Gå-vindende AlphaZero software, hvad der er kendt som “reinforcement learning.” I RL, en neurale netværk, udvikler strategier for skridt at tage på hvert trin for at forsøge at løse et problem, som det modtager belønninger for gode valg.
Også: Google foreslår, at alle software kunne bruge en lille robot, AI
Forskerne har fundet ud af en måde at træne et neuralt netværk, uden at være givne menneskelige eksempler på hvordan du navigerer en online booking-formularen. Den tilgang gør opgaven med at lære websider og sociale medier, netværk, mere “skalerbar,” de skriver, hvor de mulige kombinationer af stater og handlinger kan nå ud til millioner af mennesker.
Pointen er ikke, nødvendigvis, at der faktisk er bogen en flyvning; det er mere en øvelse i, hvordan et neuralt netværk kan finde løsninger på et problem med en lang række variabler, hvor menneskelig vejledning, eller “supervision”, i uddannelse, er umuligt.
Forskning papir, “at Lære At Navigere på Internettet,” indsendt 21 December på arXiv pre-print server, er forfattet af Izzeddin Gur, Ulrich Rueckert, Aleksandra Faust, Dilek Hakkani-Tur, kollektivt forbundet med Google AI. Papiret vil være en poster session på den kommende Internationale Konference om Læring Repræsentationer, der finder sted i Maj næste år i New Orleans.
Også: Google AI forskere finder mærkeligt ny grund til at spille Jeopardy!

Google ‘ s forskere kom op med to nye neurale netværk ved hjælp af styrkelse læring, kaldet QWeb, som lærer at tage museklik og type ting på en webside, og en anden, INET, instruktør, der tal ud af, hvilke instruktioner til at give den QWeb på hvert trin.
Google AI
Dette er mere end blot bots til at gennemgå Web. Forfatterne beskriver problemet som værende vanskelige, når “læring fra store sæt af instruktioner”, der kan indeholde felter, af en Web-formular, der skal udfyldes, og lange lister af ting, i form af drop-down menuen vælger en person vil opleve på en flyrejse site.
“Som et eksempel, i det fly-booking miljø antallet af mulige vejledning/opgaver, der kan vokse til mere end 14 millioner, med mere end 1700 gloser og cirka 100 Web-elementer i hver episode.”
Arbejdet tager over, hvor den anden slap, sidste års “Verden af Bits,” ved Tianlin Shi og kolleger på Stanford University. At papir afprøvet muligheden for en computer til at lære at udføre klik med musen og tastaturet slag til at udføre opgaver på Nettet, baseret på demonstrationer fastsat af mennesker.
Også: Google funderer den mangler af machine learning
Ligesom forfatterne til det papir, Google ansætte folk forstærkning for at lære, i dette tilfælde den “Dybe Q-Netværk” – tilgang, hvor det neurale netværk, der justerer sin estimering af fremtidige belønninger, da det skridt gennem problem opgaver, vi træffer et valg.
Men Google forskere ikke kunne bruge human demonstrationer, som i Verden af Bits sagen, så de kom op med, hvad de hævder, er to “nye neurale netværk arkitekturer.”
Den første, “QWeb,” er en Dybt Q-Netværk, der er forstærket ved at bryde op websiden til belønninger for de enkelte trin i en rejse booking motion, såsom indtastning af datoen for en flyvning. Der har tendens til at øge de fordele, at det neurale net modtager det hen ad vejen.
Den anden, kaldet “INET,” er endnu en Dyb Q-Netværk, der får belønninger, som det korrekt genererer instruktioner til QWeb til følge. Det er INET ‘ s opgave at fordøje den Web-side, i form af en “document-objekt-model”, eller “DOM”, og komme op med de trin, QWeb bør tage for at træffe valg i Web-form, så som at tage en lufthavn kode fra en drop-down liste over “destinationer” i form.
Også: Google Hjernen, Microsoft lod de mysterier af netværk med AI
Der er mange andre detaljer, hvor forfatterne har forsøgt tingene en lille smule anderledes fra tidligere tilgange. For eksempel brugte de en teknik, der kaldes “pensum læring,” at nedbryde store opgaver i mindre virksomheder, for at hjælpe den neurale net få gennem flere trin af en Web-formular.
De brugte også, hvad der er kendt som “lille kodninger,” at forbedre den neurale net ‘ s forståelse af websiden. På den måde, at det ikke bare se en omfattende liste over lufthavn navne, er det også får en fornemmelse af strukturen af den webside, det er på.
Forfatterne rapporterer, at når de sammenlignede deres resultater mod dem, Stanford gruppe, de kunne matche sin menneske-drevet eksempler lige så godt uden menneskelig demonstrationer på simple opgaver som at klikke på en dialog-boks, eller logge på en bruger i en form.
Skal læse
“AI er meget, meget dum, “siger Google’ s AI-leder (CNET)Baidu skaber Kunlun silicium til AIUnified Google AI division et klart signal om, at AI ‘ s fremtid (TechRepublic)
I mere komplekse opgaver, tests, der er udviklet af Stanford-gruppen som en benchmark, der omtales som “sociale-medier-alle,” computeren skal gøre ting som at blokere for en given bruger på Twitter. Google forskere fortæller, at deres forbedrede neurale netværk var i stand til at lykkes “, hvor tidligere tilgange undladt at generere en vellykket episoder.”
I den udfordring, booking en flyvning, de små tricks, de rapporterer, såsom lavt kodning, hjalp det neurale netværk, opnå succes hver gang. Uden de små tricks, som de bemærker, at deres netværk opførte sig på en måde, der lyder som en træt websurfer: “QWeb starter med at klikke på send-knappen på første gang trin til at få den mindst negative belønning.” Lyder bare som en egentlig menneskelig erfaring i booking en flyvning online.
Forfatterne skriver, at de planlægger i fremtiden arbejde for at afprøve deres netværk i mere komplekse miljøer med stadig flere trin.
Måske kan de lære det at regne ud, hvordan at løse captcha ‘ er, som de fleste mennesker synes ofte flummoxed af dem.
Tidligere og relaterede dækning:
Hvad er AI? Alt, hvad du behøver at vide
En executive guide til kunstig intelligens, fra machine learning og generelt AI til neurale netværk.
Hvad er dyb læring? Alt, hvad du behøver at vide
Den lowdown på en dyb læring: fra hvordan det relaterer til det bredere felt af machine learning igennem til, hvordan du kommer i gang med det.
Hvad er machine learning? Alt, hvad du behøver at vide
Denne vejledning forklarer, hvad machine learning er, hvordan det er relateret til kunstig intelligens, hvordan det fungerer, og hvorfor det er vigtigt.
Hvad er cloud computing? Alt, hvad du behøver at vide om
En introduktion til cloud computing-lige fra det grundlæggende op til IaaS og PaaS, hybrid, offentlige og private cloud.
Relaterede Emner:
Udvikler
Digital Transformation
CXO
Tingenes Internet
Innovation
Virksomhedens Software
0