Microsoft har været seriøs omkring at hjælpe data forskere at spore og administrere deres machine learning eksperimenter i et stykke tid nu. For eksempel virksomhedens Azure Machine Learning (Azure ML) cloud-tjeneste har støttet logning af eksperimenter, herunder iterativ kører med forskellige algoritmer, hyperparameter værdier, eller begge dele.
Mens Azure ML har haft sin egen ramme for et sådant eksperiment overvågning og tracking, på sidste års Gnist+AI-Topmødet, sin partner Databricks lanceret open source MLflow projekt til håndtering af lignende opgaver. MLflow er designet til at arbejde fra de fleste helst miljø, herunder kommando-linje, bærbare computere og meget mere, og dens popularitet er vokset voldsomt over de sidste år, angiveligt som følge af, at open orientering.
Læs også: Apache Gnist skabere sat sig for at standardisere fordelt machine learning uddannelse, udførelse og implementering
At forbinde prikker
Microsoft og Databricks er nære samarbejdspartnere, og MLflow er indbygget understøttes i Azure Databricks. Men i dag, på årets Gnist+AI-Topmøde om to virksomheder, der annoncerer, at Microsoft vil nu være en aktiv bidragyder til MLflow projektet, og som vil støtte det indbygget fra Azure ML.
Tilfældet ville, at jeg er på Visual Studio Live! konference i New Orleans i denne uge, og jeg kommer til at præsentere på Azure Databricks i dag. Som en del af denne præsentation, jeg har arbejdet på en demo af MLflow bare i denne uge, så denne nyhed er ganske rettidig.
En lille kode vil gøre ya
Mens mange facetter af at gøre machine learning kan være ganske komplekse, og endda en smule Rube Goldberg i naturen, MLflow er forfriskende enkel. Blot ved at tilføje et par linjer af kode i funktionen eller script, der tog deres model, data kan forskerne log parametre, målinger, artefakter (plots, diverse filer, osv.) og et deployerbart emballering af ML-model. Hver gang denne funktion eller scriptet er kørt, vil resultaterne blive logget automatisk som et biprodukt af disse linjer af kode, der er tilføjet, selv om den part, der gør uddannelsen køre, gør ikke nogen særlig indsats for at registrere resultaterne.
MLflow application programming interfaces (Api ‘ er) er til rådighed for Python, R og Java programmeringssprog, og MLflow sport en sprog-agnostisk REST API, så godt. Databricks siger, at projektet har næsten 500.000 månedlige overførsler, over 80 kode bidragydere og 40 bidragende organisationer.
Microsoft vil nu være en aktiv bidragyder til projektet, også. Der bør hjælpe med at standardisere DevOps af AI, på tværs af sprog, skyer og machine learning rammer. Og, hvis du spørger mig, er, at standardisering kan ikke komme hurtigt nok.
Relaterede Emner:
Cloud
Digital Transformation
CXO
Tingenes Internet
Innovation
Virksomhedens Software