Nul
Met de groeiende nadruk op alle dingen AI — in combinatie met de geschiedenis als een instrument leverancier — het is niet verwonderlijk dat Microsoft werkt aan tools niet alleen voor de traditionele programmeurs, maar ook gegevens wetenschappers.

Credit: Het Lopen Van De Kat
Volgens een Microsoft Research presentatie van eerder dit jaar, gegevens wetenschappers momenteel besteden 80% van hun tijd aan het uitpakken en schoonmaken van gegevens — AKA “gegevens ruzie.” Microsoft wil om dit op te lossen.
Voer “Project Pendleton.”
Een jaar geleden heb ik voor het eerst hoorde van een contact van mij over een nieuwe machine-learning gerelateerde tool in ontwikkeling door Microsoft, dat was de codenaam “Pendleton.” Maar het was niet tot Het Lopen van de Kat (@h0x0d op Twitter) opgegraven meer informatie en de documenten die ik had genoeg informatie om over te schrijven Pendleton.
Van een “Getting Started” – document op Pendleton van De Kat, hier is Microsoft ‘ s uitleg van wat Pendleton is:
“Pendleton biedt een set van flexibele en schaalbare tools om u te helpen verkennen, te ontdekken, te begrijpen ad oplossen van problemen in uw gegevens. Hiermee kunt u verbruikt gegevens in vele vormen en te transformeren dat de gegevens naar nieuwe vormen die beter geschikt zijn voor uw gebruik.”
Pendleton is een client app die werkt op Windows, OS X/macOS. Het ontwerp runtime gebruik van Python en hangt af van verschillende Python bibliotheken.
Als één van mijn contacten beschreven, Pendleton is een instrument gericht op data-wetenschappers, die is ontworpen voor data voorbereiding en reiniging. De tool kan dingen doen, zoals het verwijderen van onjuiste kolommen, wijzigt u de opmaak in kolommen, ontbreken verwerken van gegevens en dergelijke. Het bevat ook analytics tools om te helpen gegevens de wetenschappers erachter te komen wat is er opgenomen in een dataset. Pendleton gegevens kan lezen van SQL Server, Azure blob ‘ s en Gegevens Meren. Het kan ook bestanden lezen vanaf een lokale PC-bestanden, mijn contactpersoon gezegd.
Microsoft heeft getest particulier Pendleton voor bijna een jaar, misschien langer. Ik heb nog niet gehoord hoe het bedrijf plannen om de tool, maar het lijkt erop dat dat nog steeds het plan.
Ik denk dat Microsoft Research PROZA (Programma Synthese aan de hand van Voorbeelden) onderzoeksteam dat “ontwikkelt programma synthese technologieën voor data-stoei-en geïncorporeerd in echte producten” waarschijnlijk achter Pendleton, tenminste tot op zekere hoogte.
Ondertussen spreken van data science en grote datasets, Microsoft en Facebook heeft vandaag aangekondigd een nieuwe standaard ontwikkeld voor het representeren van diep-leren-modellen waarmee deze modellen worden overgedragen tussen kaders.
Die nieuwe standaard, Open Neurale Netwerk Exchange (ONNX), kunnen ontwikkelaars om te schakelen tussen AI kaders zoals Microsoft ‘s Cognitieve Toolkit, Facebook’ s Caffe2, PyTorch en meer. De eerste versie van ONNX code en documentatie zijn nu beschikbaar als open source op GitHub.
0