0

AI landskabet ændrer sig fra dag til dag. (Billede: Shivon Zilis og James Cham, der er designet af Heidi Skinner. En større udgave kan findes på Shivon Zilis’ hjemmeside.)
Det er svært at undgå AI buzz derude. Ud over den hype, der er ingen tvivl om, at fremskridtene sker i spring og fremskridt. Vi er i midten af 2017, og allerede billedet af maskinen intelligens som malet til 2016 har oplevet bemærkelsesværdige nye poster.
Bare holde i teknologi-stakken, vi har set indførelsen af Caffe2 fra Facebook, Core ML bare ud fra Apple, som har angivet spillet, og lad os ikke glemme den meget ambitiøse NeoPulse.
En ting alle disse har det til fælles, Dyb læring. Caffe2 og NeoPulse er udelukkende DL rammer, og DL er også centralt i forhold til Core ML. Mens DL er bestemt positivt, at der er mere til ML. Og der er også flere spillere i spillet end de sædvanlige mistænkte.
Mød CatBoost, en ny ML bibliotek baseret på gradient fremme af (GB) og med henblik på at finde sin egen sweet spot i AI landskab.
CatBoost, din venlige kvarter feline
Udgivelsen af CatBoost som open source blev officielt annonceret i dag, men CatBoost kom ikke ud af ingenting. Det er blevet udviklet af Rusland-baseret og NASDAQ-handles Yandex. Yandex, kendt af mange som “russisk Google,” forherliger sig selv som en teknologi virksomhed, der bygger intelligente produkter og tjenester, der leveres af ML.
“ML beføjelser mere end 70 procent af Yandex, produkter og tjenester,” siger Misha Bilenko, leder af Maskinen Intelligens og Forskning (MIR) på Yandex. Selv om dens MatrixNet og DaNet biblioteker er ikke så kendt som andre i dette område, de har været rundt i et stykke tid, og er brugt meget af folk fra CERN og Gazprom.
“CatBoost er den næste generation af MatrixNet og Yandex vil være at implementere CatBoost næsten overalt MatrixNet er allerede på plads,” siger Bilenko.
Dejligt. Men hvad er CatBoost og hvorfor bør du pleje?
Yandex beskriver CatBoost som “en state-of-the-art open-source gradient øge bibliotek,” og uddyber, at mens DL er faktisk brugbart, og noget har haft gode erfaringer med, at der er mere til livet og AI end DL, såsom GB.
Yandex gælder GB til den slags problemer, virksomhederne støder på hver dag-ligesom afsløring af svig, forudsige, customer engagement, og ranking anbefalede emner. Yandex hævder den vigtigste fordel af GB i løbet DL er evnen til at levere meget præcise resultater, selv når der er relativt få data.
Dette, siger Yandex, der gør det ideelt for prædiktive modeller, der kan analysere mange forskellige former for data, og især beskrivende data formater med kategoriske features (funktioner med diskrete snarere end konstant-værdier). Yandex fortalere CatBoost som en model til at styre dem alle, integrere input fra mange forskellige ML teknikker.
Yandex sørget for, at strukturen af CatBoost kan støtte deres historie, som den kan blive fed med modeller fra DL rammer såsom TensorFlow eller Keras. Hvad mere er, kan det til gengæld foder til Core ML, og dermed bringe CatBoost-drevne applikationer til en bred vifte af enheder rundt omkring i verden.
CatBoost har best-in-class nøjagtighed blandt GB algoritmer, og Yandex siger, at det forbedrer evnen til at skabe prædiktive modeller ved hjælp af en bred vifte af datakilder, såsom sensoriske, historiske og forretningsmæssige data.
Yandex opkald CatBoost den mest magtfulde “ultimative” model. Selv om sådanne krav skal være dokumenteret i praksis, kan ikke hjælpe, men bemærk, at Yandex synes at være at sætte sine penge, hvor dens mund er. Til at begynde med, Yandex fokuserer sin egen fremtidige udvikling omkring CatBoost.
Yandex står stærkt bag CatBoost
CatBoost kan være legende navngivet og slankt, der markedsføres, men tag ikke fejl, den alvor, med hvilken Yandex nærmer sig denne. (Billede: Yandex)
Yandex vil være at implementere CatBoost næsten overalt MatrixNet er allerede på plads, siger Bilenko. Der står i stedet for noget, som MatrixNet har været nøglen til Yandex. For så vidt som andre er bekymrede for, Yandex forsøger at gøre CatBoost tiltrækkende ved at give muligheder for det.
Udover TensorFlow og Core ML integration, CatBoost kan bruges i Python og R eller via en kommando-linje værktøj, har visualisering kroge og automatiseret funktion, betydning beregning, og det giver muligheder for parameter tuning og kan prale af overlegenhed i benchmarks.
Ganske vist, Yandex gør nogle overbevisende argumenter. Der er bare et par ting, du sandsynligvis spekulerer på, om.
En, der er Yandex igen, og hvad der gør dem sådanne eksperter i ML? Og to, hvis CatBoost er så fantastisk, hvorfor så ikke holde det for sig selv? Nå, de to kan være faktisk relateret.
Vi har allerede nævnt, hvordan Yandex er i daglig tale kendt som den russiske Google. Selvom der helt sikkert er noget grundlag for dette, Yandex mennesker, og især dens DIREKTØR, uenig. Først af alt, de siger, Yandex blev grundlagt i 1997, “for et år, før Google, så vi kunne ikke følge dem.”
Yandex startede som en søgemaskine ligesom Google, men så diversificeret til andre domæner. Ja, meget gerne Google, men også som Amazon og Uber. Yandex, ud over at eje en 54-procent andel af online-søg på markedet i Rusland, har udvidet sig til at tilbyde tjenester som Shopping (Yandex.Markedet er anvendt af 19 millioner mennesker en måned) og taxa (Yandex.Taxa ejer 60 procent af dette marked i Moskva).
Noget af det kan have at gøre med russiske protektionisme, men sikkert ikke det hele. Yandex har bygget på en række af fordele i det lokale marked og er ved at udvide til andre markeder også. At ansætte ex-Microsoft Bilenko, i tillæg til andre højt profilerede medarbejdere og intern omorganisering, ser ud til at være en del af planen om at tage på verden.
Når du bliver spurgt, hvilke barrierer er der for at blive behandlet i denne indsats, Bilenko reagerede ved at nævne, at “Yandex er forpligtet til at opretholde en høj kvalitet produkter og tjenester til brugere i vores kerne markeder, men som en global teknologivirksomhed, finder vi det uvurderligt at bidrage mere bredt til de større tech samfund.
“I betragtning af den grundlæggende betydning, og den udbredte brug af GB, ønskede vi at bidrage til, at en kerne har brug for, og skabe noget, der er nemt for data forskere til at integrere med andre machine learning rammer. Tilbyder samfundet en stor out-of-the-box-værktøj er noget, vi forventer vil blive meget udbredt og meget gavnlig.”
Machine Learning sværvægter
Bilenko nævnt Yandex Clickhouse som et eksempel på de værktøjer, Yandex stillet til rådighed for open source-fællesskabet. Bilenko siger, at han håber at se CatBoost indvirkning tech samfund på en positiv måde, hvad enten det er detail-eller forsikrings-eller enhver anden kommerciel brug, og han understreger, at den rigdom af udvikler-talent i Rusland.
Yandex benytter ML i en række forbruger-orienterede applikationer, såsom en oversættelse, et billede anerkendelse, søgning på nettet, reklamer, vejrudsigter, talegenkendelse, og anti-svig. Hvad mere er, Bilenko siger Yandex vil være at implementere ML med Yandex.Sky-holdet. Så forvent at se flere ML i skyen fra Yandex snart, at holde med tiden.
Et andet interessant og meget lidt kendte omstændighed, dog, er, at Yandex også har en enterprise side — og data, der er den drivende kraft bag det. CatBoost er også beregnet til at lykkes MatrixNet i områder som industriel proces optimering eller effektivisering af partikel fysik forskning.
CatBoost har enterprise-klar funktioner, og det er ingen overraskelse i betragtning af sin oprindelse og-applikationer. (Billede: Yandex)
Yandex Data Fabrik (YDF) er en division af Yandex, at giver AI-baserede løsninger til at øge produktiviteten, reducere omkostningerne og forbedre energieffektiviteten. Det virker med den holder af, Gazprom, CERN og Intel, og det var der, at MatrixNet, oprindeligt udviklet af Google i 2009, var hærdet.
Selv om Bilenko siger, at hans MIR division er normalt ikke er relateret til YDF, CatBoost blev brugt til at skabe en forudsigelsesmodel for en YDF kunde, en stor stålproduktion selskab.
Denne kvalitet forudsigelse model blev uddannet på tidligere data om produktion af stål plader med henblik på at forudsige den sandsynlige mængde af defekt masse i den enkelte plade er baseret på de foreliggende målinger. Resultatet var, faldt de samlede produktionsomkostninger og defekt priser.
Proces-industrien i Yandex hjem retten markeder er tungt, og kombinationen af adgang til denne industri, viden og talent, som kan give Yandex potentialet til at udnytte sin styrkeposition til at tage på andre markeder.
Så bør du overveje CatBoost? Sandsynligvis ja. Hvor er det passe ind i Yandex ‘ s strategi? Ligner en nøgle flyt til at få udsættelse, om oprettelse af ekspertise, og tiltrække talentfulde medarbejdere og kunder, samtidig med at fremskynde dens udvikling. Også ser som en interessant twist i plottet af den igangværende AI saga, lad os se, hvordan det vil terningerne rulle.
Hvem der egentlig ejer din Internet af Ting, data?
I en verden, hvor flere og flere objekter kommer online og leverandører er ved at blive involveret i forsyningskæden, hvordan kan du holde styr på, hvad der er dit og hvad er ikke?
0