Het automatiseren van de automatisering: een kader voor de ontwikkeling en marketing van diep leren modellen

0
180
screen-shot-2017-04-20-at-5-03-12-pm.png

De vaststelling van AI wordt steeds belangrijker. Afbeelding: IBM

Diep leren (DL), machine learning (ML) en artificial intelligence (AI) krijgen veel tractie en voor een goede reden, maar we zijn het verkennen. Volgens recente onderzoeken, het lijkt erop dat nu de meeste ontwikkelaars en managers hebben gerealiseerd op het belang van AI en ten minste het experimenteren met het.

Er is één probleempje: de AI is hard. AI zit op het uiteinde van een spectrum van data-gedreven analytics-toepassingen. Dus als data science vaardigheden zijn dus moeilijk aan te komen, AI vaardigheden zijn moeilijker. DimensionalMechanics zojuist aangekondigd dat de benadering van het sluiten van de AI vaardigheden kloof, genaamd NeoPulse AI Studio (NLIS). NLIS is een onderdeel van NeoPulse Kader (NPF) een combinatie van een aantal interessante benaderingen en kunnen de weg voor anderen om te volgen.

Het indelen van modellen

Laat de foto van dit eenvoudige scenario: omdat, zoals we allemaal weten, het internet is in principe over katten, die elke organisatie zou op een gegeven moment wilt het ontwikkelen van een applicatie voor het scannen door middel van beelden en uitzoeken welke bevatten katten voor toekomstig gebruik. Dat is eigenlijk een entry level classificatie taak, iets dat DL uitblinkt in.

Instap kan worden, maar eenvoudig is het niet: je hebt om te kiezen voor een DL kader te gebruiken,juist de innerlijke werking en API vinden of ontwikkelen van een model dat geschikt is voor de taak, de trein is het door het voeren van het sample data en vervolgens te integreren in uw bestaande stapel en implementeren. Maar sindsdien op een gegeven moment iedereen in staat zou zijn om dit te doen, een stap voor te blijven zou u ook classificeren beelden van honden. Hoe zou NPF helpen u daar?

Ten eerste, door u te laten zoeken naar een model dat voor u in NeoPulse AI te Slaan. Ja, dat klinkt analoog aan een app store, met uitzondering van u in staat zullen zijn om te winkelen voor DL-modellen in plaats van apps. Het hebben van een AI-model marktplaats klinkt geweldig, maar om een markt werkt veel dingen moet klikken.

Tiny Dutt, DimensionalMechanics CEO en oprichter, zegt dat de winkel zal in eerste instantie alleen host-modellen gebouwd met behulp van NLIS om controle te hebben over hun interne structuur en hebben een standaard manier om hen te vertegenwoordigen. De winkel zal worden opgestart met modellen ontwikkeld door DimensionalMechanics en tarieven in rekening gebracht zal worden gebaseerd op het model specifieke kenmerken – de grootte, de rekenkracht die nodig is etc. Het doel is om de markt voor betaalbare en ontwikkelaars een manier om geld te verdienen met hun modellen snel.

Dutt, zegt dat hoewel DimensionalMechanics aangepaste modellen te doen afbeelding indeling, met de focus op maat gemaakte modellen: “Out of the box, we hebben een classificatie model dat kunnen identificeren van objecten in video’ s. Het kan op twee manieren worden gebruikt: on premise, in welk geval we de licentie uit de werkelijke AI-model, of in de cloud, in welk geval ze zou noemen een cloud API. De kern van onze toegevoegde waarde ligt in het maken van aangepaste modellen”.

Dus als je een model dat kan identificeren zowel honden en katten in de winkel, alles werkt in een handomdraai. Maar wat als je het niet? Heb je twee opties. Een, als je een model dat is iets wat lijkt op wat u wilt, kunt u opnieuw de trein. Dus als er een model dat kan identificeren katten, kan je opnieuw trainen tot de identificatie van honden. Twee, als je niet kunt vinden van een model dat is dicht genoeg bij wat u wilt doen, moet je jezelf uit het niets..

Het voeden van modellen met gegevens

Dutt zegt dat “NLIS kunt u gebruik maken van de bestaande afbeelding classificatie modellen en “fine-tunen” zodat u don ‘ t hebben om te scholen het model van de grond af. Kunt u een algemeen beeld classificatie model en omscholen het te herkennen honden – in de veronderstelling dat het oorspronkelijke model werd gebouwd met behulp van NLIS. Het enige wat je nodig hebt is het trainen van gegevens”.

Beide veronderstellingen zijn eigenlijk soort van een big deal, maar laten we vasthouden aan gegevens voor nu. Wie geeft de training data en gaat de opleiding door? Wat als ik geen trainingsgegevens, of het is niet gelabeld?

ai-dm-b6d1211d.png

DimensionalMechanics is uit te pus kunstmatige intelligentie binnen handbereik voor meer organisaties, en het openen van een aantal fronten, terwijl op. Afbeelding: DimensionalMechanics

De bepaling van de training data (en etikettering) moet worden uitgevoerd door de gebruiker. Dutt zegt dat NLIS gebruikt manieren voor het verminderen van de hoeveelheid gegevens die nodig zijn om te trainen, bijvoorbeeld wanneer u fine-tunen van een bestaand model, je hoeft niet zo veel afbeeldingen. Hij voegt eraan toe dat het NLIS maakt gebruik van de nieuwste ML onderzoek naar het verminderen van de gegevens eisen, waardoor het mogelijk is om het te gebruiken, zelfs in de enkele gevallen waar de data is niet voorzien van een etiket:

“Bijvoorbeeld, als u een logbestand van het TCP/IP-gegevens, kunt u deze gebruiken als ruwe data om te trainen een model te erkennen “normaal gedrag”. Zodra het model is opgeleid, dan is het model kan u vertellen of het verkeer handtekening als normaal wordt beschouwd of er iets is gebeurd. Neem een network intrusion evenement. Als de gebruiker geen training gegevens dan ook, dan kan de gebruiker gebruik maken van één van onze ‘off-the-shelf” modellen”.

Hetzelfde geldt voor de functie selectie: “Voor veel problemen in het neurale netwerk selecteert automatisch functies of verminderen afmetingen (ex. Afbeelding indeling, audio-analyse, etc.). In sommige gevallen, echter, is het noodzakelijk voor de mens om in te stappen. Voor veel van de problemen die NLIS is ontworpen om op te lossen, voorzien van selectie is behandeld door het neurale netwerk dat wordt gebruikt”.

En wat als uw trainingsgegevens niet laat uw pand, hetzij als gevolg van de beleidsmatige beperkingen of omdat het gewoon te groot? Dutt zegt is er de optie van het runnen van het model op prem, maar wat voor soort omgeving die nodig zijn om te draaien in realistische termijnen?

“Meestal is de vereiste hardware – een machine met een CUDA 8 compatibele grafische kaart draait op Linux Ubuntu. We hebben een scala van hardware, variërend van de Nvidia GeForce 1080s (~$550) tot high-end K80s (~$3000). De meeste van onze ontwikkelaars trein op de lagere spec hardware. Onze K80s worden gebruikt voor de opleiding van zeer grote modellen”.

Verhuur modellen in het wild

Maar wat als het ondanks alle inspanningen die u hebt nog steeds niet weten te vinden of omscholing een model dat doet wat u wilt? Dit is waar NLIS in het spel komt – je zal moeten gebruiken om te bouwen uw eigen model. En een nieuwe taal te leren genoemd NML (NeoPulse Modeling Language), terwijl op. Maar niet zorgen te maken, zegt Dutt, de oracle is er om u te helpen:

“NLIS gebruik maakt van iets genaamd “the oracle”, dat is een AI die weet hoe te bouwen AI modellen. NML is een taal die wij hebben ontworpen om technicus AI modellen. NML heeft een trefwoord automatisch dat geeft de compiler raadpleeg de oracle uitzoeken van een passend antwoord op een specifieke vraag. Bijvoorbeeld, de auto kan worden gebruikt voor het achterhalen van de juiste DL architectuur.

In dit geval is de oracle wordt geraadpleegd met betrekking tot wat is de juiste architectuur te gebruiken gezien de hints van de ontwikkelaar. De ontwikkelaar hoeft niet te weten iets over machine learning. Het is zo simpel als x -> auto -> y, waar x de input en y is de output. Auto cijfers uit de juiste architectuur te maken van de mapping.

Het ding over het oracle is dat het leert zelf – in de tijd en het wordt steeds beter in zijn werk. Er is een stelling die zegt dat DL netwerken zijn “universele approximators”. Ongeveer, wat dit betekent is dat als je twee variabelen die betrekking hebben op een manier die je niet begrijpt, dan is er gegarandeerd een neuraal netwerk kaart ene variabele op de andere. Als een resultaat, door te focussen op DL wij het kunnen oplossen van een zeer grote set van problemen”.

NML is in-house ontwikkeld door DimensionalMechanics en is “de enige taal die we kennen, dat is ontworpen voor DL. In 30 regels code, kunt u doen wat kost 600 lijnen van de code met behulp van TensorFlow met python.

dm-screen-shot.png

NeoPulse Modeling Language is een nieuwe taal die is ontworpen voor het diepe te leren, die DimensionalMetrics vorderingen is “ontworpen zodat een student van de middelbare school met een codering achtergrond, kan de code”. Afbeelding: DimensionalMetrics

De sleutel tot NML is dat het automatiseert grote stukken van het AI-model generatie, wat betekent dat de ontwikkelaar niet om dit te doen. NML structuren diep leren creëren door het gebruik van een elegante “blok” – benadering dat breekt het probleem in intuïtieve stukken, die elk een volledig kan worden geautomatiseerd”.

Het hebben van een oracle aan uw zijde en het kappen van de hoeveelheid code die nodig is klinkt geweldig, maar aangezien we praten over iets genaamd AI Studio immers, de vraag op elke ontwikkelaar in gedachten waarschijnlijk is of dit daadwerkelijk een IDE:

“Op dit moment, AI studio zelf beschrijft een REST interface die het mogelijk maakt eenvoudige integratie met een geïntegreerde ontwikkelomgeving maar we zijn niet gericht op een visuele UI nog. Het is grotendeels opdrachtregel gedreven. Kunnen We kijken naar de integratie met veelgebruikte IDEs zoals Atom of Visual Studio in de nabije toekomst”, zegt Dutt.

En nee, de verwijzing naar TensorFlow toeval was of niet. Dutt zegt dat er in de toekomst DimensionalMechanics kan de deur openen naar andere bibliotheken of laat de gebruiker kiezen hun eigen bibliotheek, maar dit is wat NLIS toepassingen onder de motorkap.

In elk geval, na het een model is gebouwd en getraind, NLIS bouwt een pakket met een dunne wrapper voor het implementeren van het neurale netwerk. Om toegang te krijgen moet u de NeoPulse Query Runtime (NPQR). NPQR staat mensen te ondervragen van de neurale netwerk met behulp van een eenvoudige REST interface die automatisch wordt gegenereerd.

Dutt zegt dat momenteel NPQR zit op een Linux-machine met een CUDA 8 compatibele grafische kaart, en het is mogelijk om toegang te krijgen tot de NPQR via een web service bellen vanaf elk apparaat (bijv. Laptop, telefoon, etc).

Katten en honden

Dus wat te maken van dit alles? Afhankelijk van hoe je het bekijkt, zou je kunnen zeggen het is de weg naar de toekomst of overdreven ambitieus, en u zou wel eens gelijk in beide richtingen.

Aan de ene kant, het automatiseren van de automatisering kunnen worden dan indrukwekkend – het kan heel praktisch en bieden een enorme boost in productiviteit. Anderen, zoals Viv, Alpine Gegevens of BeyondCore al probeert het met behoorlijk wat succes. Het verschil is dat DimensionalMechanics lijkt te richten op een bredere doelgroep.

“Waar we verschillen is dat we een AI-voeding van NLIS die weet hoe te bouwen DL modellen en wordt steeds slimmer de loop van de tijd. Met behulp van NLIS, we zijn niet beperkt tot een bepaalde branche – we kunnen het oplossen van problemen in de raad – we zijn onbegrensd zijn, in termen van de ML problemen die we kunnen aanpakken.

Een andere opvallende punt is dat met NLIS de modellen die de oracle genereert zijn over het algemeen op of in de buurt van “state-of-the-art” – dus een developer met geen ML vaardigheden kunnen maken van modellen die rivaal die zijn gemaakt door ML-experts”, zegt Dutt.

neopulseframework.png

Ontwikkelaars met geen vorige Machine Learning ervaring productiever te maken in 2 weken tijd? Dat is wat DimensionalMechanics beloften. Afbeelding: DimensionalMechanics

Dutt beweert ook NML is zeer eenvoudig te leren als het is ontworpen om intuïtief door het breken van de code in blokken die beschrijven hun gebruik: architectuur, bron -, input -, output -, trein-en uitgevoerd: “We hebben het zo ontworpen dat een student van de middelbare school met een codering achtergrond, kan de code. Een ontwikkelaar met geen AI expertise gemakkelijk te bouwen met behulp van NML. Een zakelijke gebruiker zal waarschijnlijk niet in staat om het te gebruiken, tenzij hij/zij kan het schrijven van scripts”.

Het is duidelijk dat een visuele ontwikkelomgeving zou helpen, dus waarom zou DimensionalMechanics spuit al deze inspanning in de bouw woorden en niet iets doen? Een plausibel antwoord op die vraag is het feit dat in een ruimte die zich beweegt in sprongen en grenzen, er is alleen zo veel van een 11-mensen kan het opstarten van doen te nemen op de Googles van de wereld.

Dat brengt een andere interessante vraag: wat is DimensionalMechanics probeert te zijn? Is het gebouw op de top van Google ‘ s TensorFlow, de toonaangevende DL kader op dit punt (in mindshare tenminste). Dus je zou kunnen zeggen dat het probeert te worden iets wat een aantal IDE-leveranciers voor Android zijn – een facilitator.

Maar het ziet er ook DimensionalMechanics is proberen te winnen van Google om de punch door het initiëren van een DL model marktplaats gebouw op Google ‘ s eigen bibliotheek. Is dit logisch, en doet DimensionalMechanics het gewicht om dit te laten werken? En als dit is het primaire doel, waarom niet gaan voor een niet specifieke Google-DL brug bibliotheek als Keras?

Op hetzelfde moment, DimensionalMechanics is ook de aankondiging van een Serie B financiering rond is en een partnerschap met GrayMeta, die Dutt zegt omvat het leveren van AI diensten in veel verschillende vormen en is spannend, omdat GrayMeta heeft toegang tot een rijke en gevarieerde set van globale media klanten. DimensionalMechanics en GrayMeta al meegewerkt aan een aantal projecten op maat.

Er is zeker geen gebrek aan ambitie of activiteit. Hoe veel van die claims zijn bewezen in de praktijk en hoe goed die weddenschappen af te betalen valt nog te bezien, maar of het is DimensionalMechanics of iemand anders, dat maakt het gebeuren, het is de gemeenschap die voordeel kunnen halen.

Who really owns your Internet of Things data?

Wie echt de eigenaar van uw Internet der Dingen gegevens?

In een wereld waar meer en meer objecten komen online en leveranciers zijn betrokken te raken in de supply chain, hoe kan je houden van wat van jou is en wat niet?