CatBoost Machine Learning kader van Yandex verhoogt het bereik van AI

0
146

0

v-3-mi-landscape-3-81-1400px-3b7a8a307b1c6a3d2c20c22613e4438f.jpg

De AI landschap is aan het veranderen met de dag. (Afbeelding: Shivon Zilis en James Cham, ontworpen door Heidi Skinner. Een grotere versie kunt u vinden op Shivon Zilis’ website.)

Het is moeilijk om te voorkomen dat de AI buzz die er zijn. Voorbij de hype, er is geen ontkennen dat de vooruitgang wordt gedaan in sprongen en stappen. We zijn medio 2017, en al het beeld van machine-intelligentie zoals geschilderd voor 2016 heeft gezien opmerkelijke nieuwe items.

Alleen houden in de technologie-stack, we hebben gezien dat de invoering van Caffe2 van Facebook, Core ML even van Apple, die heeft het spel, en niet te vergeten de alom ambitieuze NeoPulse.

Een ding al deze gemeen hebben: Diep leren. Caffe2 en NeoPulse zijn uitsluitend DL kaders, en de DL staat ook centraal in de Kern ML. Terwijl DL is zeker waardevol, er is meer aan ML. En er zijn ook meer spelers in het spel dan de usual suspects.

Aan CatBoost, een nieuwe ML-bibliotheek op basis van de gradiënt van het stimuleren van (GB) en gericht op het vinden van zijn eigen sweet spot in de AI landschap.

CatBoost, uw vriendelijke buurt feline

De release van CatBoost als open source officieel aangekondigd vandaag, maar CatBoost kwam niet uit het niets. Het is ontwikkeld door Rusland-gebaseerd en NASDAQ worden verhandeld Yandex. Yandex, bekend als de “russische Google,” touts zichzelf als een technologie bedrijf dat bouwt intelligente producten en diensten aangedreven door ML.

“ML bevoegdheden meer dan 70 procent van Yandex producten en diensten”, zegt Misha Bilenko, hoofd van de Machine-Intelligentie-Onderzoek (MIR) op Yandex zijn. Hoewel de MatrixNet en DaNet bibliotheken zijn niet zo bekend als anderen in dit domein, zij zijn rond voor een tijdje en worden intensief gebruikt door de wil van CERN en Gazprom.

“CatBoost is de volgende generatie van MatrixNet en Yandex zal de uitvoering van CatBoost bijna overal MatrixNet is al op zijn plaats,” zegt Bilenko.

Geweldig. Maar wat is CatBoost en waarom zou je?

Yandex beschrijft CatBoost als een “state-of-the-art open-source verloop stimuleren bibliotheek,” en uitgewerkt dat terwijl DL is inderdaad handig en iets hebben goede ervaringen met, er is meer in het leven en AI dan DL, zoals GB.

Yandex is van toepassing GB naar de aard van de problemen die bedrijven ondervinden elke dag, zoals het opsporen van fraude, het voorspellen van customer engagement en classificeren aanbevolen items. Yandex vorderingen die de sleutel maken van GB over DL is de mogelijkheid om zeer nauwkeurige resultaten, zelfs als er relatief weinig gegevens.

Dit, zegt Yandex, maakt het ideaal voor voorspellende modellen die het analyseren van de vele verschillende vormen van gegevens, en vooral beschrijvende data-formaten met de categorische functies (functies met discrete plaats van continue waarden). Yandex advocaten CatBoost als een model om allen te regeren, de integratie van de inbreng van veel verschillende ML-technieken.

Yandex zorgde ervoor dat de structuur van CatBoost kunnen hun verhaal, als het kan gevoed worden met de modellen van DL kaders zoals TensorFlow of Keras. Wat meer is, het kan op zijn beurt voeden tot de Kern ML, waardoor CatBoost-aangedreven apps op een breed scala van apparaten over de hele wereld.

CatBoost biedt best-in-class nauwkeurigheid onder GB-algoritmen, en Yandex zegt het verbetert de mogelijkheid tot het maken van voorspellende modellen met behulp van verschillende gegevensbronnen zoals zintuiglijke, historische en transactionele gegevens.

Yandex oproepen CatBoost de meest krachtige “ultieme” model. Hoewel een dergelijke claim moet worden bewezen in de praktijk, kan men niet helpen, maar merken dat Yandex lijkt te worden om zijn geld waar zijn mond is. Om te beginnen met, Yandex richt zich met haar eigen toekomstige ontwikkeling rond CatBoost.

Yandex staat sterk achter CatBoost

cat.png

CatBoost kan worden op speelse wijze de naam en strak op de markt gebracht, maar vergis je niet, als aan de ernst waarmee Yandex benaderingen. (Afbeelding: Yandex)

Yandex zal de uitvoering van CatBoost bijna overal MatrixNet is al op zijn plaats, zegt Bilenko. Dat staat voor iets, als MatrixNet is de sleutel tot Yandex. Zo ver als anderen zijn betrokken, Yandex probeert te maken CatBoost aantrekkelijk door het verstrekken van opties.

Naast TensorFlow en Core ML integratie, CatBoost kan worden gebruikt in Python en R of via een command-line tool, heeft visualisatie haken en geautomatiseerde voorziening belang berekening, en biedt opties voor parameter tuning en beschikt over superioriteit in benchmarks.

Toegegeven, Yandex maakt een aantal overtuigende argumenten. Er zijn gewoon een paar dingen die u zich waarschijnlijk afvragen over.

Wie is Yandex weer en wat maakt hen zo ‘ experts in ML? En twee, als CatBoost is zo groot, waarom niet het voor zich houden? Goed, de twee kunnen eigenlijk worden gerelateerd.

We hebben al vermeld hoe Yandex is in de volksmond gekend als de russische Google. Hoewel er zeker een aantal basis voor deze, Yandex mensen, en met name de CEO, smeek te verschillen. Eerste van alles, zeggen ze, Yandex werd opgericht in 1997, “een jaar voor Google, zodat we niet volgen.”

Yandex is begonnen als een zoekmachine, zoals Google, maar dan gediversifieerde naar andere domeinen. Ja, net als Google, maar ook als Amazon en Uber. Yandex, naast het bezitten van een 54 procent aandeel in de online search markt in Rusland is uitgebreid diensten aan te bieden, zoals Winkels (Yandex.De markt wordt gebruikt door meer dan 19 miljoen mensen per maand) en taxi-ritten (Yandex.Taxi bezit 60 procent van deze markt in Moskou).

Een deel van dat kan te maken hebben met de russische protectionisme, maar waarschijnlijk niet alles. Yandex is gebouwd op een aantal van de voordelen voor de lokale markt en is uit te breiden naar andere markten. Het inhuren van ex-Microsoft Bilenko, in aanvulling op andere high-profile huurt en interne reorganisatie, lijkt onderdeel te zijn van het plan de wereld over te nemen.

Op de vraag welke belemmeringen zijn er om te worden opgelost in deze inspanning, Bilenko reageerde door te vermelden dat “Yandex is geëngageerd aan het handhaven van de hoge kwaliteit van producten en diensten voor de gebruikers op onze belangrijkste markten, maar als een wereldwijd technologiebedrijf, vinden we het van onschatbare waarde om bij te dragen meer in het algemeen aan de grotere tech-gemeenschap.

“Gegeven het fundamentele belang en het wijdverspreide gebruik van GB, we wilden een bijdrage leveren aan een core nodig is en maken iets dat gemakkelijk is voor gegevens wetenschappers om te integreren met andere machine learning kaders. Het aanbieden van de gemeenschap een geweldige out-of-the-box tool is iets wat we verwachten niet veel zal worden gebruikt en zeer nuttig is.”

Machine Learning zwaargewicht

Bilenko vermeld Yandex Clickhouse als een voorbeeld van de tools Yandex beschikbaar gesteld aan de open source community. Bilenko zegt hij hoopt om te zien CatBoost impact van de tech gemeenschap op een positieve manier, of dat het voor de detailhandel of een verzekering of enig ander commercieel gebruik, en hij benadrukt de rijkdom van de ontwikkelaar talent in Rusland.

Yandex maakt gebruik van ML in een aantal van consument-gerichte toepassingen, zoals vertalingen, beeldherkenning, zoeken op het web, reclame, weersvoorspellingen, spraakherkenning en een anti-fraude. Wat meer is, Bilenko zegt Yandex implementatie ML met Yandex.Cloud team. Zo verwachten meer te zien ML in de cloud van Yandex snel, te houden met de tijden.

Een andere interessante en weinig bekende feit, echter, is dat Yandex heeft ook een onderneming kant-en-gegevens is de drijvende kracht achter de rug. CatBoost is ook bedoeld om te slagen MatrixNet in domeinen zoals industriële proces-optimalisatie en het verbeteren van de efficiëntie van de deeltjesfysica-onderzoek.

catboostfeatures.png

CatBoost heeft enterprise-functionaliteit, en dat is geen verrassing, gezien de oorsprong en toepassingen. (Afbeelding: Yandex)

Yandex Data Factory (YDF) is een divisie van Yandex dat biedt AI-gebaseerde oplossingen om de productiviteit te verhogen, kosten te verlagen, en het verbeteren van de energie-efficiëntie. Het werkt met de wil van Gazprom, CERN en Intel, en het was daar dat MatrixNet, oorspronkelijk ontwikkeld door Yandex, in 2009, was verhard.

Hoewel Bilenko zegt dat zijn MIR-divisie is het normaal gesproken niet in verband met YDF, CatBoost werd gebruikt voor het maken van een voorspellingsmodel voor een YDF klant, een grote staalproductie bedrijf.

Deze kwaliteit voorspelling-model werd opgeleid op gegevens uit het verleden over de productie van stalen platen om te voorspellen van de waarschijnlijke bedrag van gebrek massa in elke afzonderlijke plaat op basis van de beschikbare metingen. Het resultaat was daalde de totale productie kosten en gebrek tarieven.

De proces industrie in Yandex thuis hof markten is zwaar, en de combinatie van de toegang tot deze industrie, know-how, en talent kan geven Yandex het potentieel te benutten zijn bolwerk te nemen op andere markten.

Dus, moet u overwegen CatBoost? Waarschijnlijk ja. Waar past het in Yandex strategie? Ziet eruit als een sleutel bewegen te krijgen van de blootstelling, de oprichting van expertise, en het aantrekken van talent en klanten, terwijl de versnelling van de evolutie. Ook ziet eruit als een interessante twist in het plot van de lopende AI saga; laten we zien hoe de dobbelstenen rollen.

Who really owns your Internet of Things data?

Wie echt de eigenaar van uw Internet der Dingen gegevens?

In een wereld waar meer en meer objecten komen online en leveranciers zijn betrokken te raken in de supply chain, hoe kan je houden van wat van jou is en wat niet?

0