Automatisering automation: en ramme for udvikling og markedsføring af dyb læring modeller

0
212
screen-shot-2017-04-20-at-5-03-12-pm.png

Vedtagelse af AI bliver mere og mere vigtigt. Billede: IBM

Dyb læring (DL), machine learning (ML) og kunstig intelligens (AI) er at få en masse af trækkraft og med god grund, som vi har udforsket. Ifølge de seneste undersøgelser, at det ser ud til, at der nu er de fleste udviklere og ledere har indset vigtigheden af AI, og de er mindst eksperimentere med det.

Der er ét problem, men: AI er svært. AI sidder på den fjerneste ende af et spektrum af data-drevet analytics-applikationer. Så hvis data videnskab færdigheder er så svært at komme med, AI færdigheder, der er endnu sværere. DimensionalMechanics netop annonceret sin tilgang til at lukke AI færdigheder, kaldet NeoPulse AI Studio (NAI’). NAI ‘ er en del af NeoPulse Ramme (NPF), som kombinerer en række interessante tilgange og kan vise vejen for andre til at følge.

Klassificering modeller

Lad os forestille sig, at denne simple scenarie: da, som vi alle ved, at internettet er dybest set om katte, hver organisation vil på et tidspunkt ønsker at udvikle en applikation til at scanne gennem billeder og finde ud af, hvilke af dem indeholder katte til fremtidig brug. Der er faktisk en entry level opgave, noget, der DL excellerer i.

Entry level kan det være, men nemt er det ikke: du er nødt til at vælge en DL ramme til at bruge,forstå dens indre funktioner, og API, med at finde eller udvikle en model, der er egnet til den opgave, tog det ved at fodre den prøve data, og derefter integrere det i din eksisterende stak og implementere den. Men så da der på et tidspunkt alle vil være i stand til at gøre dette, til at holde et skridt foran, du er nødt til også at klassificere billeder af hunde. Hvordan ville NPF hjælpe dig med der?

For det første, ved at lade dig søge efter en model, der gør det for dig i NeoPulse AI Butik. Ja, det lyder svarende til en app store, bortset fra at du vil være i stand til at shop for DL modeller i stedet for apps. At have en AI model markedsplads lyder godt, men for at gøre nogen markedsplads arbejde, en masse ting er nødt til at klikke.

Rajeev Dutt, DimensionalMechanics CEO og grundlægger, siger, at butikken i første omgang kun vil være vært for modeller, der er bygget ved hjælp af NAI ‘ for til at kontrollere deres interne struktur og har en standard måde at repræsentere dem. Butikken vil være indledte med modeller, der er udviklet af DimensionalMechanics, og priser vil blive baseret på model specifikke oplysninger – størrelse, beregningsmæssige effekt, der er nødvendig osv. Målet er at gøre markedet overkommelige og giver udviklere en måde at tjene penge på deres modeller hurtigt.

Dutt siger, at mens DimensionalMechanics har tilpasset modeller for at gøre billedet klassificering, deres fokus er på tilpassede modeller: “Ud af boksen, vi har en klassificering model, der kan identificere objekter i videoer. Det kan bruges på to måder: på præmissen, i hvilket tilfælde vi ville licens ud af det faktiske AI model, eller i skyen, i hvilket tilfælde de ville ringe til en cloud API. Vores core value-add er i oprettelse af tilpassede modeller”.

Så hvis du finder en model, der kan identificere både katte og hunde i butikken, alt fungerer i et snuptag. Men hvad nu, hvis du ikke? Du har to muligheder. En, hvis du finder en model, der gør noget lignende, hvad du ønsker, kan du re-træne det. Så hvis der er en model, der kan identificere katte, kan du re-tog er det for at identificere hunde også. To, hvis du ikke kan finde en model, der er tæt nok på, hvad du ønsker at gøre, er du nødt til at udvikle en fra bunden..

Fodring modeller med data

Dutt siger, at “nai’ er giver dig mulighed for at bruge eksisterende billede klassificering modeller og “fine tune” dem, så du ikke er nødt til at omskole den model helt fra bunden. Du kan tage en generisk billede klassificering model og omskole den til at genkende hunde – under forudsætning af, at den oprindelige model blev bygget ved hjælp af NAI’. Det eneste, du har brug for, er uddannelse af data”.

Begge disse antagelser er faktisk lidt af en big deal, men lad os holde os til data for nu. Der giver uddannelsen data og gør uddannelsen? Hvad hvis jeg ikke har uddannelse data, eller er det ikke mærket?

ai-dm-b6d1211d.png

DimensionalMechanics er ude på at pus kunstig intelligens inden for rækkevidde for flere organisationer, og åbne en række fronter, mens på det. Billede: DimensionalMechanics

Levering af træningsdata (og mærkning) skal være udført af brugeren. Dutt siger, at NAI ‘ bruger måder til at reducere mængden af data, der er nødvendige for at træne – for eksempel når du finjustere en eksisterende model, du ikke har brug for nær så mange billeder. Han tilføjer, at NAI ‘ udnytter den seneste i ML forskning for at reducere krav til data, der gør det muligt at bruge det selv i nogle tilfælde, hvor data ikke er mærket:

“For eksempel, hvis du har en log af TCP/IP-data, kan du bruge dette som raw-data, til at uddanne en model til at genkende “normal adfærd”. Når modellen er blevet uddannet, så modellen kan fortælle dig, hvis trafikken signatur betragtes som normal, eller er der sket noget. Tage et netværk indtrængen begivenhed. Hvis brugeren ikke har nogen uddannelse data overhovedet, så brugeren bliver nødt til at bruge en af vores “off-the-shelf” modeller”.

Samme gælder for funktion udvælgelse: “For mange problemer, det neurale netværk vil automatisk vælge funktioner eller reducere dimensioner (ex. Billedet klassificering, lyd-analyse, etc.). I nogle tilfælde, men det er nødvendigt for et menneske at træde til. For mange af de problemer, der nai ‘er er designet til at løse, har udvalg varetages af de neurale netværk, der bruges”.

Og hvad hvis din træning data ikke kan forlade din virksomhed, enten på grund af politiske begrænsninger, eller fordi det bare er for stor? Dutt siger, at der er mulighed for at køre modellen på-prem, men hvilken slags miljø, vil der kræver at køre i realistiske tidsrammer?

“Typisk er det et krav commodity hardware – en maskine med en CUDA 8-kompatibelt grafikkort, der kører på Linux Ubuntu. Vi har et udvalg af hardware, lige fra Nvidia GeForce 1080s (~$550) at høje ende K80s (~$3000). De fleste af vores udviklere tog på lavere spec hardware. Vores K80s er vant til at træne meget store modeller”.

At lade modeller ud i naturen

Men hvad nu, hvis der på trods af alle dine anstrengelser, som du har stadig ikke lykkedes mig at finde eller genoptræne en model, der gør, hvad du vil? Dette er, hvor nai ‘ erne kommer i spil, vil du nødt til at bruge det til at bygge din egen model. Og lære et nyt sprog kaldet NML (NeoPulse Modeling Language), mens på det. Men ikke at bekymre sig, siger Dutt, oracle er der for at hjælpe dig med at:

“NAI’ bruger noget, der hedder “oracle”, som er en AI, der ved, hvordan man opfører AI modeller. NML er et sprog, som vi har designet til ingeniør AI modeller. NML udsætter et søgeord auto, som instruerer kompileren til at spørge oraklet til at finde ud af et passende svar på et specifikt spørgsmål. For eksempel, auto kan bruges til at finde ud af den rigtige DL arkitektur.

I dette tilfælde oracle høres om, hvad der er den rigtige arkitektur til at bruge i betragtning af tippene leveres af bygherren. Bygherren behøver ikke at vide noget om machine learning. Det er så simpelt som x -> auto -> y, hvor x er input og y er output. Auto tal ud af den rigtige arkitektur at gøre kortlægning.

De ting om oracle er, at det i sig selv lærer – over tid og det bliver bedre på sit job. Der er en læresætning, der siger, at DL netværk er “universal approximators”. Groft set, hvad dette betyder er, at hvis du har to variabler, der er relateret på nogen måde, at du ikke forstår, så der er garanteret til at være et neuralt netværk, der kan tilknytte én variabel på den anden. Som et resultat, ved at fokusere på DL vi kan løse et meget stort sæt af problemer”.

NML blev udviklet in-house af DimensionalMechanics og er “det eneste sprog, som vi kender til, der er designet til DL. I 30 linjer af kode, kan du gøre hvad det tager 600 linjer af kode ved hjælp af TensorFlow med python.

dm-screen-shot.png

NeoPulse Modeling Language er et nyt sprog, der er designet for dyb læring, som DimensionalMetrics krav er “konstrueret således, at en gymnasieelev med en kodning baggrund kan kode det”. Billede: DimensionalMetrics

Nøglen til NML er, at det automatiserer store bidder af AI model generation, hvilket betyder, at bygherren ikke har at gøre dette. NML strukturer dybt læring, skabelse ved hjælp af en elegant “blok” – tilgang, der bryder ned problemet i intuitiv bidder, der hver kan være fuldt automatiseret”.

At have en oracle ved din side og skære ned på mængden af kode, som bruges lyder fantastisk, men siden vi taler om noget, der hedder AI Studiet efter alt, er spørgsmålet om, hver udvikler sind sikkert, er, om dette er faktisk en IDE:

“I øjeblikket, AI studio udsætter sig selv et REST-interface, der giver mulighed for nem integration med alle integrerede udviklingsmiljø, men vi er ikke fokus på en visuel UI endnu. Det er i vid udstrækning kommandolinje-drevet. Vi kan se på integration med almindeligt anvendte IDEs såsom Atom eller Visual Studio, i den nærmeste fremtid”, siger Dutt.

Og nej, henvisning til TensorFlow var ikke en tilfældighed. Dutt siger, at i fremtiden DimensionalMechanics kan åbne døren til andre biblioteker, eller lad brugeren vælge deres eget bibliotek, men for tiden er dette er, hvad NAI ‘ bruger under kølerhjelmen.

I alle tilfælde, når en model er opbygget og uddannet, NAI ‘ konstruerer en pakke med en tynd indpakning for at anvende neurale netværk. For at få adgang til det, du skal bruge NeoPulse Forespørgsel Runtime (NPQR). NPQR giver folk mulighed for at afhøre de neurale netværk ved hjælp af en simpel REST-interface, som er automatisk genereret.

Dutt siger, at i øjeblikket NPQR sidder på en Linux-baseret maskine med et CUDA 8-kompatibelt grafikkort, og det er muligt at få adgang til NPQR via en web-service-opkald fra enhver enhed (f.eks. Bærbar computer, telefon osv.).

Katte og hunde

Så hvad du skal gøre med alt dette? Afhængigt af hvordan du ser på det, du kan sige, det er den måde, at fremtiden eller alt for ambitiøs, og du vil sandsynligvis være ret til enten måde.

På den ene side, automatisering automatisering kan være uden imponerende, det kan være meget praktisk og giver et enormt boost i produktivitet. Andre som Viv, Alpine Data eller BeyondCore har allerede forsøgt det med en hel del succes. Forskellen er, at DimensionalMechanics synes at målrette mod en bredere målgruppe.

“Der, hvor vi adskiller os, er, at vi har en AI kraftoverførsel nai’ er, der ved, hvordan til at bygge DL modeller og bliver klogere med tiden. Hjælp nai ‘ er, er vi ikke begrænset til en lodret industri -, vi kan løse problemer over hele linjen – vi er ubegrænsede i form af ML problemer, vi kan løse.

Et andet springende punkt er, at med NAI ‘ de modeller, som oracle genererer, er generelt på eller i nærheden af “state-of-the-art” – så en udvikler med ingen ML færdigheder kan skabe modeller, der konkurrere med dem, der er oprettet af ML eksperter” siger Dutt.

neopulseframework.png

Udviklere med ingen tidligere Machine Learning oplevelse at være produktive i 2 uger? Det er, hvad DimensionalMechanics løfter. Billede: DimensionalMechanics

Dutt hævder også, NML er meget enkel at lære, da det er designet til at være intuitiv, ved at bryde koden i blokke, der beskriver deres brug: arkitektur, kilde, input, output, tog og køre: “Vi har designet det således, at en gymnasieelev med en kodning baggrund kan kode det. En udvikler uden AI ekspertise nemt kan bygge ved hjælp af NML. En virksomhed bruger sandsynligvis ikke vil være i stand til at bruge det, medmindre han/hun kan skrive scripts”.

Det er klart, et visuelt udviklingsmiljø ville hjælpe der, så hvorfor skulle DimensionalMechanics dispensere alle denne indsats i opbygningen af orakler og ikke gøre noget ved det? Et plausibelt svar, kunne være det faktum, at i et rum, der bevæger sig med stormskridt, der er kun så meget en 11-folk start kan gøre for at tage på Motorbriller af verden.

Hvilket bringer et andet interessant spørgsmål: hvad er DimensionalMechanics forsøger at være? Det er en bygning på toppen af Google ‘ s TensorFlow, den førende DL ramme på dette tidspunkt (i mindshare mindst). Så man kan sige, det er at forsøge at være noget i retning af, hvad en række IDE leverandører til Android har været – en facilitator.

Men det ser også ud DimensionalMechanics forsøger at slå Google til punch ved at indlede en DL model markedsplads, som bygger på Googles eget bibliotek. Giver det mening, og gør DimensionalMechanics har vægten for at gøre dette arbejde? Og hvis dette er dens primære mål, hvorfor så ikke gå for en ikke-Google-specifikke DL bro bibliotek, ligesom Keras?

På samme tid, DimensionalMechanics er også annoncere en Serie B-finansiering runde, og et partnerskab med GrayMeta, som Dutt siger indebærer at give AI service i mange forskellige former og er spændende, fordi GrayMeta har adgang til en rig og varieret sæt af globale medier kunder. DimensionalMechanics og GrayMeta er allerede samarbejder om en række tilpassede projekter.

Der er sikkert, er ikke mangel på ambitioner eller aktivitet der. Hvor mange af disse påstande er dokumenteret i praksis, og hvordan disse indsatser betale sig fortsat at blive set, men om det er DimensionalMechanics eller en anden, der gør det til at ske, det er fællesskabet, der vil stå til gavn.

Who really owns your Internet of Things data?

Hvem der egentlig ejer din Internet af Ting, data?

I en verden, hvor flere og flere objekter kommer online og leverandører er ved at blive involveret i forsyningskæden, hvordan kan du holde styr på, hvad der er dit og hvad er ikke?