Skrevet af Tiernan Ray, medvirkende skribent Tiernan Ray bidragende skribent
Tiernan Ray har dækket teknologi og forretning i 27 år. Han var senest teknologiredaktør for Barron's, hvor han skrev daglig markedsdækning for Tech Trader-bloggen og skrev den ugentlige trykspalte med det navn.
Fuld bio den 24. februar 2022 | Emne: AI & Robotics
Robotter og selvkørende biler har én meget stor udfordring til fælles, nemlig hvordan man navigerer i verden. Typisk er det, at opgaver tilgås af kunstig intelligens som et problem med, hvordan man kortlægger omgivelserne, for at konstruere et præcist overblik over en scenes geometri, før en robot eller en bil bevæger sig hen over det terræn.
Der kan være en enklere måde.
I et papir offentliggjort på arXiv onsdag af forskere ved University of California i Berkeley, er en robot på hjul i stand til at rejse kilometer over forstadsterræn.
Droiden holder sig til stier og undviger hidtil usete forhindringer. Væsentligt er, at det ikke kortlægger sit miljø, som nogle andre tilgange har gjort, såsom i AI-programmer for autonom kørsel.
I stedet er den afhængig af heuristik opsamlet fra tredive timers video af tidligere løb, og nogle overliggende kort over terrænet, for at skabe en forbedret skematisk over, hvordan mellemstationer undervejs forholder sig til hinanden, uden et fuldt kort.
Forskningen, med titlen “ViKiNG: Vision-Based Kilometer-Scale Navigation with Geographic Hints,” er forfattet af ph.d.-kandidat Dhruv Shah og UC Berkeley assisterende professor Sergey Levine.
Levine har i årevis arbejdet på at bringe kunstig intelligens til robotteknologi i samarbejde med Google. Mange af de vigtigste opdagelser af dette arbejde blev relateret af Levine sidste år i et papir med titlen “Sådan træner du din robot.” Denne artikel fokuserede på opdagelser i det, der kaldes “forstærkende læring”, en form for dyb læring AI, hvor neurale netværk trænes til at avancere i stadier mod et mål.
Det seneste værk af Shah og Levine, kaldet ViKiNG, har vigtige forbindelser til RL.
ViKiNG bygger på et tidligere system, kaldet “RECON”, der står for “Rapid Exploration Controllers for Outcome-driven Navigation”, introduceret af Shah og Levine sidste år.
Også: Way hinsides AlphaZero: Berkeley og Googles arbejde viser, at robotteknologi kan være den dybeste maskinlæring af alle
RECON blev trænet ved at lade robotten med hjul, et sjakals ubemandet landkøretøj, lavet af Clearpath Robotics, rejse på “tilfældige ture” gennem flere miljøer såsom parkeringspladser og marker i løbet af 18 måneder, og indsamle timers video via monteret RGB kameraer, LiDAR og GPS.
RECON lærte det, der kaldes “navigationsprioriteter”, ved hjælp af et foldningsnetværk, der komprimerede og ukomprimerede billeddataene, som det, der kaldes en “informationsflaskehals”, en tilgang til håndtering af signaler introduceret i 2000 af Naftali Tishby og kolleger.
Denne tilgang for RECON udvikler softwarens evne til at have en god repræsentation af visuelle omgivelser ved at komprimere billeder ned og derefter genkalde, hvad der er iøjnefaldende. I testfasen får RECON vist et billede af et mål, en bestemt bygning, f.eks., og skal hurtigt finde ud af, hvordan man navigerer til det nye sted.
RECON konstruerer en graf af trin langs en vej til det mål, en slags improviseret kort. Ved at bruge disse teknikker var Jackal-robotten i stand til at navigere op til 80 meter mod et mål i nye omgivelser, den aldrig havde mødt før, og den var i stand til at gøre det i tilfælde, hvor enhver anden eksisterende tilgang til robotnavigation ikke nåede et mål.
I ViKiNG udvider Shah og Levine RECON på én specifik måde: hints. De giver Sjakalens software alternativt overliggende satellitbilleder af det nye terræn eller overliggende kort.
Som Shah og Levine skriver: “I modsætning til RECON, som udfører en uoplyst søgning, inkorporerer ViKiNG geografiske hints i form af omtrentlige GPS-koordinater og overheadkort.
“Dette gør det muligt ViKing for at nå fjerne mål, op til 25× længere væk end det fjerneste mål rapporteret af RECON, og at nå mål op til 15× hurtigere end RECON, når du udforsker et nyt miljø.”
ViKiNG-programmet har øget sine træningsdata for kameraobservationer fra den tilfældige gåtur med yderligere 12 timers video, der var fra “teleopererede” ture, hvor et menneske guidede sjakalen til at forfølge stier, såsom fortove eller vandrestier, for at bygge op disse tidligere eksempler. Det neurale netværk, der bruges til at knuse alle de træningsdata, er ret ensformigt, det velkendte MobileNet-konvolutionelle neurale netværk.
Udstyret med ViKiNG går Jackal denne gang langt ud over RECON's 80 meter og rejser næsten fra start til destination 3 kilometer væk, eller næsten to miles.
I videoer på en blog-side for projektet viser Shah og Levine, hvordan Sjakalen med ViKiNG kan finde ud af, hvordan man ruter rundt om hidtil ukendte forhindringer, såsom et parkeret køretøj, der blokerer dens vej. En ledsagende video forklarer arbejdet, som du kan se nederst i dette indlæg.
RECON brugte eksplicit elementer af forstærkende læring. ViKiNG låner ligeledes på en eller anden måde. Adspurgt om forbindelsen til RL sagde Levine til ZDNet i en e-mail: “Jeg vil karakterisere ViKiNG som en slags forstærkende læringsmetode med en planlægger på et højere niveau, der sidder ovenpå det.”
Nøglen, forklarede Levine , er kombinationen af indlærte kontroltilgange på lavt niveau, til øjeblik-for-øjeblik-navigation og planlægning på højere niveau, som er beslægtet med RL.
Som Levine beskrev det,
Den eksplicitte planlægning på højt niveau giver mulighed for at håndtere meget lange horisonter, så en god måde at se på metoden er at bruge modelfrie [RL] teknikker til at håndtere lavniveauproblemet med lokal navigation (f.eks. hvordan man kører rundt et træ) med planlægning af problemet på højt niveau, hvordan man plotter en vej til et fjernt mål. Jeg tror, at det faktisk er en rigtig naturlig pasform – ligesom en person, der kører bil, måske ikke tænker særlig nøje over hver eneste sving, de foretager, men ville lave en eksplicit planlægning i deres sind for at bestemme, hvilken rute de skal tage til deres destination, måske ræsonnement om vartegn som “knudepunkterne” i planen.
Levine mener, at der er høj relevans for mere kompleks navigation såsom autonomt drevne køretøjer. ViKiNG, sagde han, er en begyndelse mod en “fortovsleveringsrobot.”
“Men autonom kørsel eller andre opgaver med højere indsatser (eller endda reel fortovslevering, der skal håndtere tæt trafik) skal have yderligere mekanismer til at håndtere sikkerhed og begrænsninger, som den nuværende tilgang ikke direkte håndterer lige endnu,” sagde Levine.
Levine tilbød, at yderligere arbejde med ting såsom sikkerhed kan omfatte både eksplicit instruktion fra mennesker som “co-piloter” om at dirigere robotter væk fra skade. Det kan også omfatte efterligning af eksisterende politikker, der ville indgyde nogle sikkerhedsforanstaltninger.
Men det vil kræve meget mere forskning at håndtere et køretøj, der bevæger sig med høj hastighed og med usete elementer såsom jay-walking fodgængere, sagde Levine.
“Selvfølgelig er det at give strenge sikkerhedsgarantier for sådanne systemer et stort åbent problem, og jeg tror, der kræves meget mere arbejde der for at gøre dette sikkert og sikkert nok til fuldskala autonom køretøjer,” sagde Levine til ZDNet.
Udvikler