DANSK

Facebook ‘ s Yann LeCunn afspejler den vedvarende appel af vindinger

121

For tredive år siden, Yann LeCun pioner inden for brugen af en bestemt form for machine learning, kaldet convolutional neurale netværk, eller CNN, mens der ved University of Toronto. Denne tilgang, der flytter et filter over et sæt af pixels til at opdage mønstre på billeder, der viste lovende i revner problemer, såsom at få computeren til at genkende håndskrevne tal med minimal menneskelig vejledning.

År senere, LeCun, så ved NYU, har lanceret en “sammensværgelse”, som han kalder det, til at bringe machine learning tilbage til rampelyset efter en lang vinter for disciplin. Nøglen var LeCun er CNN, der havde fortsat med at udvikle sig i raffinement til det punkt, hvor det kunne give resultater i computer vision, der bedøvet området.

Det nye gennembrud med CNNs, sammen med fornyelser af jævnaldrende, såsom navn som egentlig betyder yoshua Bengio, af Montreal ‘ s MILA gruppe for machine learning, og Geoffrey Hinton af Google Hjernen, lykkedes at skabe et nyt forår for AI forskning, i form af dyb læring.

I dag, den appel af vindinger viser ingen tegn på køling, som den teknik, der breder sig som ukrudt ud til alle hjørner af machine learning. Nyere forskning har vist, at forekomsten af CNNs blandt neurale netværk modeller i brug. En undersøgelse af Microsoft, offentliggjort i November, der kiggede på den slags dybt netværk, der kører på Android mobile enheder, har fundet, at næsten 90% af de netværk, der inddrives fra mobile apps var en slags CNN.

På den Internationale ssd-Kredsløb-Konferencen i San Francisco i denne uge, LeCun afspejles på, hvorfor denne simple teknik har trivedes, og hvorfor dets indflydelse vil kun vokse, i hans opfattelse.

Også: Facebook ‘ s Yann LeCun siger ‘indre aktivitet” provenu på AI chips

“En masse af de signaler, der systemer der vil nødt til at beskæftige sig med, er naturlige signaler, der kommer fra array sensorer”, sagde LeCun i et interview med ZDNet efter sin keynote-tale på mandag.

“Noget, der kommer fra et kamera, herunder panorama kameraer og osv. Lyd, enten i form af rå lyd-eller i form af tids-frekvens-repræsentationer.” Videoer er også nødt til at blive behandlet via vindinger, LeCun sagde, herunder især 3-D billeddannelse fra dybde sensorer, såsom LIDAR.

Faktisk, mange af de demonstrationer af forskellige chips på den vis denne uge bød på den velkendte “segmentering kort,” et billede på skærmen af ting, set gennem et kamera, om en bil på vejen, eller en opfattelse af mennesker i rummet. Hvert objekt er højdepunktet af en farvet omrids med en label, som angiver den type ting, det er — en person, en hund, en gade lampe, etc. Vindinger er en del af den nuværende alder, og det tydeligste udtryk for AI ‘ s evne til i en vis forstand forstå verden omkring det.

“Så, for alt dette, de fleste af dine cykler er kommer til at være der bruges på behandling af de low-level signal” sagde LeCun, hvilket betyder, cyklusser af compute vil blive brugt til at plukke ud af, hvad hver pixel af milliarder af pixels i et billede eller en video viser. “Og hvad andet, men vindinger er, at du kommer til at bruge? Lige nu, er der ikke noget alternativ. Så, de fleste cykler vil blive brugt gør vindinger, er der ingen tvivl om.”

Også: Google ‘ s image anerkendelse AI narre af nye tricks

På konferencen, der var masser af chip innovationer, der afsættes til bedre behandling af snoninger. For eksempel, forskere ved University of Michigan viste et design for automotive applikationer, der kan fortrænge nogle af de funktioner, LIDAR ved i stedet at analysere mange billeder i en video fra en bil on-board kamera. Forskerne sagde, at de havde gjort et gennembrud i hvordan man kan udvikle en chip, der er dedikeret til CNNs, der vil køre netværket model med høj hastighed, mens du bruger mindre strøm.

Der er nogle alvorlige tekniske udfordringer, som CNNs spredt sig til applikationer ud over billed-genkendelse, sagde LeCun. I tilfælde af 3-D billeddannelse, med dybde sensorer, såsom LIDAR, hvor data kommer i form af “point clouds” bemærkede LeCun, “de fleste af de 3-D-domæner, at de neurale netværk bliver nødt til at processen vil være tom — det er meget sparsomme i form af aktiveringer.”

Hvad man ikke ønsker, er vindinger, at spilde en masse tid på at arbejde på at multiplicere nuller af en for det meste tom, vektor eller matrix. “Så, vil du gerne vide, hvor data er, og så være smart om, hvordan du følger dette”, sagde LeCun. Han bemærkede, at der er blevet arbejdet på sagen på Facebook, ved hjælp af “sparsomme convnets,” der kører på Gpu ‘ er, “Men det kan kræve lidt mere low-level support,” i hardware, observeret LeCun.

Det er, hvor hardware innovatorer er nødt til at komme på arbejde, foreslog han.

Samsung forskere på tirsdag præsenterede deres design til en mobil-system-on-a-chip, der kan “beskære” indgange netop for at undgå behandling af nuller i sparsomme input prøver. LeCun givet udtryk for sin godkendelse efter at have hørt den tale, tweete et par specs af Samsung arbejde.

“De mest ofte udtalte ord på ISSCC denne morgen: foldning,” tweeted the godfather af CNNs.

Relaterede Emner:

Big Data Analytics

Digital Transformation

CXO

Tingenes Internet

Innovation

Virksomhedens Software