Nul
Hoewel het waar is dat de diepe neurale netwerken moeite met het uitvoeren van zelfs de meest elementaire robotica taken, onderzoekers bij Google Google Hersenen eenheid denk dat robotics heeft een aantal belangrijke lessen voor de ontwikkeling van software.
In het onderzoek stak woensdag wetenschappers in Google Hersenen, samen met onderzoekers van de Sandia National Labs en de Universiteit van New Mexico computer science department, geherinterpreteerd software programma ‘ s als waren zij robots die hun weg zoeken door onzekere terrein, met behulp van een vorm van machine learning genoemd reinforcement learning.
Het resultaat kan zijn veerkrachtiger software die inherent omgaat met onzekerheid.
Ook: Top 5: Dingen om te weten over AI TechRepublic
Het papier, “Veerkrachtige Computing met Versterking van het Leren op een Dynamische Systeem: Case-Study bij het Sorteren,” is geplaatst op de pre-print archief arxiv door Google Hersenen Aleksandra Faust, samen met collega ‘ s van Sandia en UNM. Een abstracte verschijnt ook op de Google-AI research site. Faust en collega ‘ s zijn het werk te tonen in de 57e IEEE-Conferentie over het Besluit en de Controle, het nemen van plaats 17 December door middel van de 19de in Miami Beach, Florida.
Het papier is gebaseerd op eerder werk Faust en collega ‘ s van eerder dit jaar met robots en onbemande luchtvaartuigen. In dat werk, robots werden getraind met reinforcement learning te navigeren onzeker terrein op de grond en in de lucht.
De belangrijkste zorg van de huidige, op papier is dat de meeste software heeft klassiek niet ontwikkeld worden veerkrachtig, wat betekent dat, om te overleven onvoorspelbare situaties die kunnen ontstaan, zoals beschadigingen van het geheugen chips.
In plaats daarvan, de software is ontwikkeld met wat David Ackley van UNM heeft de bijnaam de “CEO” obsessie – “Juistheid en Efficiëntie Alleen,” laten hardware omgaan met de last van de betrouwbaarheid.
Ook: het Opstarten van Verwanten brengt glimp van hoop voor AI-robotica
Die CEO houding veronderstelt een programma met de juiste algoritme zal voltooien van een taak correct en vervolgens te beëindigen en de inzet is om het omgaan met onvoorziene fouten. “Het is alsof er een contract tussen de computer ingenieurs en informatici: hardware verstrekt betrouwbaarheid… software is de taak van de te nemen logica en zet hem in functies die waardevol zijn,” is hoe Ackley mooie samenvatting van de afgelopen 70 jaar van de software. Ackley ontvangt een dank je wel van Faust & Co. in het papier.
(Ackley heeft een geweldige video over de kwestie, het begeleiden van het papier stak hij dit jaar, dat is de moeite waard.)
De Software van best practices zijn geëvolueerd in de tijd, opmerking Faust en collega ‘ s, met inbegrip van dingen zoals design patterns en de juistheid bewijzen. Maar deze maatregelen zijn bedoeld om te verzachten programmeur fout, ze zijn niet bedoeld om te gaan met wat er kan gebeuren in de loop van een programma, wanneer er een fout staat of een defect ontstaat, zoals een “bit flip” in een memory cel.
Faust en collega ‘ s voorstellen om een wijziging van de aanpak te ontwikkelen door het volgen van het voorbeeld van robots, die regelmatig het streven naar een “doel op basis van de taak” in het gezicht van de fout. “Robots routinematig rekenen op metingen die fouten bevatten, nog steeds gericht op het verstrekken van veerkrachtige besluitvorming,” schrijven ze.
Voor het testen van de aanpak, de onderzoekers maakten een nieuwe versie van een programma dat sorteert de items in een matrix – achtige re-arrangeren van een set van verstoord letters, zodat ze in alfabetische volgorde, of het plaatsen van een onsamenhangende lijst van het tellen getallen in de juiste volgorde van kleinste naar grootste. Het sorteren van taken zoals die zijn een klassiek ruimte voor exploratie in de wetenschap van de computer, dus het is een leuk probleem op dat het testen van nieuwe software benaderingen.
Hun programma “RL soort,” maakt gebruik van de AI benadering van het werken aan het maximaliseren van een beloning door te kiezen tussen de mogelijke zetten, zoiets als een “Markov decision process.” Gezien op deze manier is de berekening in het programma wordt een traject in de variabele ruimte,” zoals zij het uitdrukte. Elke tik van de klok, het programma zoeken door middel van “de staat”, het programma variabelen, op zoek naar een pad naar de goed gesorteerde lijst van items.
Faust en collega ‘ s getest RL soort tegen twee populaire aanpak voor het sorteren van de software, de “Quick sort” en “Bubblesort.” Zij vonden dat wanneer de storingen van zelfs 5% werden ingevoerd, de andere twee snel liep in situaties waar ze niet tot een soort items bijna de hele tijd, terwijl RL soort was nog steeds in staat om te leveren in dergelijke omstandigheden.
“Over het algemeen, RL soort is meer kans om te sorteren van een array, en wanneer het niet lukt om te sorteren, de matrix produceert zal dichter bij een volledig gesorteerd array, dan andere vergelijkende methoden,” schrijven ze.
Als een bonus, RL soort komt als efficiënter is dan de andere twee, want het vergt minder manipulaties van de array van items.
Vorige en aanverwante dekking
Wat is AI? Alles wat je moet weten
Een executive gids voor kunstmatige intelligentie, van machine learning en algemene AI-neurale netwerken.
Wat is diep leren? Alles wat je moet weten
De lowdown op diep leren: van hoe het zich verhoudt tot het bredere veld van machine-leren door te zien hoe aan de slag met het.
Wat is machine learning? Alles wat je moet weten
In deze gids wordt uitgelegd wat ‘machine learning’ is, hoe het is in verband met kunstmatige intelligentie, hoe het werkt en waarom het belangrijk is.
Wat is cloud computing? Alles wat u moet weten over
Een introductie van cloud computing recht vanaf de basis tot IaaS en PaaS -, hybride -, public en private cloud.
Verwante Onderwerpen:
Robotica
Digitale Transformatie
CXO
Het Internet van Dingen
Innovatie
Enterprise Software
0