0

Data science und machine learning für domänenspezifische Erkenntnisse sind der Kern von Alibaba Strategie für Globale Expansionen.
Michael Borgers, Getty Images/iStockphoto
Der Krieg im Einzelhandel hat schon vor langer Zeit gegangen ist technologische. Amazon ist das Aushängeschild dieses Wandels, ebnet den Weg zunächst durch die Aufnahme von online-Geschäft, dann umarmt die cloud und bieten immer mehr erweiterte Dienstleistungen für Rechen-und storage-zu thirrd Parteien, die über Amazon Web Services (AWS).
Könnte Amazon der unangefochtene Marktführer sowohl im Hinblick auf seinen Marktanteil im retail-und Ihre cloud-Angebot, aber das bedeutet nicht, dass die Konkurrenz sitzt nur herum zu beobachten. Alibaba, die einige sehen, wie eine chinesische Pendant zu Amazon, ist inspiriert von Amazons Erfolg. Allerdings ist seine Strategie, die sowohl im Einzelhandel und in der cloud ist abwechslungsreich, mit den beiden konvergierenden auf einer Schwerpunkt: data science und machine learning (ML).
Wanli Min, Alibaba ‘ s principal data scientist, ist eine zentrale Figur in der Konzeption und Umsetzung von Alibabas Strategie. ZDNet hatte die Gelegenheit zu einem Gespräch mit Min über Einzelhandel und in der cloud sowie data science, data pipelines und ML.
Ein Händler Geschichte
Alibaba ist nicht wirklich ein bekannter name in den USA, als e-retail-Markt ist dominiert von Amazon und Walmart mit den anderen in der Verfolgung. Die jüngsten Ausbaus von Amazon und der daraus resultierenden Nachfrage von Walmart auf seine Mitarbeiter zu bewegen, Ihre Anwendungen über AWS geweckt hat der Antagonismus zwischen Ihnen.
Alibaba ist jedoch enorm in China, und China ist groß. Das macht Alibaba eine Kraft, mit der gerechnet werden. Umso mehr, als dass es noch Spielraum für Wachstum gibt, sowohl in Bezug auf den Einzelhandel und in Bezug auf die cloud. Dies ist nicht unbemerkt geblieben, die von global players, die hetzen, zu China, zu behaupten, ein Stück von diesem Kuchen, aber es ist klar, dass Alibaba hat das home-court-Vorteil gibt.
Alibaba ist nicht wirklich in das Bild für den Einzelhandel in den USA. Aber Sie gesetzt sind, auf, dies zu ändern, durch die Nutzung neuer Produkte und data science. Bild: Statista
Diese schneidet in beide Richtungen, obwohl, wie Alibaba ist auch mit dem Ziel zu erweitern, über seine Haus-Markt. Neben Asien Alibaba expandiert in den Nahen Osten, den USA und Europa. Dies brachte Min nach Paris, zu untersuchen, Partnerschaften und zu befürworten, wie Alibaba Cloud nahm an Viva-Technologie, die französische Antwort auf die CeBIT.
Alibabas Rekord-Börsengang in 2014 zeitgleich mit dem launch von Alibaba Cloud. Alibaba sah auf Amazon für inspiration, aber seine cloud-Strategie ist sehr breit gefächert, entsprechend Ihrer Gesamtstrategie. Alibaba arbeitet als ein ökosystem von Einzelhändlern, die aus dem, was er fordert eine Wirtschaft.
Was dies bedeutet ist, dass Alibaba will so etwas wie ein service-provider, um Ihre retail-Kunden, eher als Besitz der gesamten Stacks, wie z.B. Amazon oder Walmart. Und jetzt Alibaba will, nutzt seine cloud -, Daten-und know-how werden die Schüler der digitalen transformation (DT) für seine ecosystem-Partner.
“”Die cloud ist schon akzeptiert, aber die Frage ist-was kommt als Nächstes?”, sagt Min. “Was können Sie tun, mit dieser Rechenleistung? Unsere Antwort ist data intelligence, in Echtzeit umsetzbare Erkenntnisse. Wir bringen unsere cloud unsere Daten und unser know-how zu erleichtern DT über die Daten-Wissenschaft.”
Vertikale, vertikaler, vertikales — Wert, Wert, Wert — Gehirne, Gehirne, Gehirne
Min bezieht sich auf Alibaba, den letzten Start des “Brains”: Alibaba-domain-specific intelligence-Lösungen für Bereiche wie Gesundheitswesen, Transport und Produktion. Dies steht in krassem Gegensatz zu den AWS, die bietet eine generische Infrastruktur und tools und ermöglicht Kunden die Erstellung von Anwendungen.
Min erklärt, dass die Begründung war die Diversifizierung von AWS durch das anbieten von Mehrwert-Vorschlag, anstatt zu versuchen, um zu spielen catch-up mit Ihnen. “Überzeugen Kunden zu gehen, cloud ist einfach. Aber wir müssen Sie davon überzeugen zu gehen, Alibaba Cloud, und das ist, wo wir anders entschieden: vertikal, vertikale, vertikaler, Wert, Wert, Wert.”
Das klingt wie eine vernünftige Strategie für Alibaba, aber es ist nicht ganz leicht zu führen.
Erstens, wie können Sie das know-how für so viele domains in einem Ort? Für Bereiche wie Produktion und transport, Alibaba leveraged-know-how durch die Suche und Einstellung der richtigen Leute. Aber Min sagt, Sie können nicht tun Sie dies für jede domain, also das Ziel ist der Aufbau strategischer Partnerschaften.
“Wir entwickeln etwas, das praktikabel ist, wie ein version 1.0, etwas, was unsere Partner können mit starten, und dann mit Ihnen arbeiten zu build-Versionen 2.0, 3.0 und so weiter”, erklärt Min. Es gibt da nur ein problem: wie ist “so etwas praktikabel” gehen, um sich gegen spezialisierte Lösungen, die entwickelt wurden, durch eine Reihe von domains, die von heute?
“Wir hatten unsere Zweifel,” Min bekennt. “Dies zu tun bedeutet, sich gegen Konkurrenten spezialisiert in Ihrem Bereich.” Die Vorteile der cloud, die Alibaba bieten kann, wie Elastizität und Skalierung über verschiedene Regionen, sind ziemlich viel gegeben für diese Lösungen zu. Laufen im (AWS, Microsoft, Google, etc.) cloud als SaaS bedeutet, dass nicht viel von einem differenzierenden Faktor.
Warum also gehen Sie für Alibaba? Es ist immer das ökosystem Aspekt, und Min die Antwort auf diesen Linien, mit Schwerpunkt auf Daten-Wissenschaft: “Wir können die Betreuung der Kunden geht in unbekanntes Gebiet. Unser Gehirn unterstützen können, und Sie wird nicht kämpfen Sie sich-Sie werden eine Armee von Daten, die Wissenschaftler auf Ihrer Seite.”
Sie und welche Daten die Wissenschaft Armee?
Die zahlen dort sprechen Bände. Alibaba hat ~37.000 Mitarbeitern und 20.000 von Ihnen sind technische. Min ist der Anführer einer cross-funktionalen team mit 300 Menschen, darunter etwa 50 Wissenschaftler Daten, Daten 200 Ingenieure und 50 business-Experten. Die Daten der Wissenschaft Fachkräftemangel ist auch gefühlt in China, aber Min sagt, dass Sie es geschafft haben, zu rekrutieren Menschen aus Ländern wie Japan, Europa und den USA.
Alibaba ‘ s Strategie basiert auf einem ökosystem, und er nutzt dieses ökosystem zu bieten, domain-spezifischen Daten Wissenschaft-intelligence-Anwendungen zu.
So wie alle diese Leute arbeiten, und was hält Sie beschäftigt? Min sagt bei der Annäherung an eine neue Domäne oder ein problem, so tun Sie das in einer explorativen Mode, aber immer mit einem business-orientierten Denkweise. Zum Beispiel, Transport und Logistik wurde gewählt, für seine potenziellen Auswirkungen. Sogar eine einzelne Ziffer Verbesserung für die Alibaba-Partner können in der Folge enorme Einsparungen.
“Es gibt verschiedene Stufen”, sagt Min. “Zunächst weiß niemand, wie viel wir tun können. Wir untersuchen die Machbarkeit und Grenzen-wo es möglich wäre, diese zu durchbrechen, aktuelle Barrieren. Dann versuchen wir, zu beschleunigen, besser finden Ansätze und laden unsere Partner zur co-Innovation.”
Das klingt eng, aber auch Arbeits-und zeitintensiv. Hat Alibaba betrachten die Automatisierung der Teil dieses Prozesses, oder über irgendeine Art von Rahmen für diese? “Unser Ansatz ist semi-automatisiert. Ich glaube nicht, dass in der voll automatisierten data-science”, sagt Min. “Es ist ein großes Risiko vorhanden ist: Sie können kommen mit etwas, das nicht sinnvoll in der realen Welt.
Wenn Sie explorative Arbeit in der Physik, zum Beispiel, müssen Sie sicherstellen, dass Ihre Ergebnisse im Einklang mit den Gesetzen der Physik. Im Geschäft, Ihre Ergebnisse müssen im Einklang mit den Geschäftsprozessen. Sonst können Sie am Ende mit Ergebnissen, die gut Aussehen auf dem Papier, aber nicht sinnvoll.”
Es gibt eine Reihe von unechten Korrelationen Beispiele, Min cites vorhanden. Aber ist nicht die Produktivität steigern, das kommt von der Automatisierung von Aufgaben wie der Versuch, eine Vielzahl von ML-Modellen und features verlockend? Und was macht Alibaba tun, um sicherzustellen ML Ergebnisse sinnvoll in der realen Welt?
“Wir tun sanity-checks”, sagt Min. “Und es ist die subject matter experts, das machen diejenigen, die nicht die Daten, die Wissenschaftler. Ich will nicht Daten beteiligten Wissenschaftler, ich möchte, dass Leute mit einem kritischen Blick zu tun. Sie nicht wissen, die Techniken, aber Sie wissen, dass die domain, und kann dir sagen, ob etwas Sinn macht oder nicht.
Ja, es ist denkbar, dass Sie sich Gehen-wie Situationen, in denen ein Algorithmus kann zu Resultaten führen, die keinen Sinn machen, weil Sie nicht denken, dass etwas möglich war, aber wir reden hier nicht über diese. Wir sprechen über prüfen, ob Ihre Züge sind in den Vorstand, so zu sprechen. Wenn die Ergebnisse, die Regeln einzuhalten, fein, sonst haben Sie ein problem. Ich sehe das eine Menge, das ist, warum ich darauf bestehen.”
In den schwarzen Kästen und Daten der Rohrleitungen
Und was ist mit den black-box-problem mit ML? Während der Verwendung von ML kann geben hervorragende Ergebnisse, zu erklären, wie diese Ergebnis abgeleitet wurden, ist nicht immer einfach. “Das ist eine große Sorge”, sagt Min. “Die Vorhersage ist toll, aber am Ende ist es alles über umsetzbare Erkenntnisse. Unsere Kunden wollen wissen, wie Sie zu verbessern, welcher Faktor zu ändern und warum. Also müssen wir Modelle erklärbar. Ich weiß nicht, wie massive data intelligence, ohne Aufmerksamkeit, und unsere Kunden erzählen uns oft zu.”
Min der Umgang mit dieser ist durch den Bau von zwei Modellen-eine schnelle und eine erklärbare. “Wir verwenden eine black-box-Modell, um schnelle Ergebnisse zu erzielen. Dann werden wir versuchen, ein traditionelles Modell mit erklärbar Struktur zu approximieren, die unsere Ergebnisse. Solange haben wir ein Modell erklärbar, dass die Annäherung der Ergebnisse mit unendlich kleinen Unterschied, es ist gut genug. Ich gehe lieber für ein Modell erklärbar.
Sehr oft haben wir eine harte Zeit zu erklären, die Ergebnisse an die Kunden. Wenn wir das Ungefähre Modell, es ist viel einfacher zu verkaufen: diese ist negativ, das ist positiv… dies entspricht dem Experten-Erfahrung der Welt. Sie möglicherweise nicht in der Lage zu quantifizieren, aber Sie können sich auf positive und negative Auswirkungen.”
Min meint, Sie bauen solche Modelle, die Aussehen wie die sequentielle schrittweise regression zu versuchen und zu imitieren, und die Annäherung an eine black-box-Modell. Aber es ist immer möglich, dies zu tun, wenn Sie über Merkmale, die in die Tausende? Und wow schwer ist es? Für Min -, “Sie brauchen die nötige Rechenleistung, um Sie auszuführen, aber Sie ist der schwierigste Teil.
Es dauert eine Weile, für jedes neue Produkt, weil es ein trial-and-error-Prozess. Es ist auch schwer zu definieren Sie das problem: wir müssen-Konto für alle Eingaben, herauszufinden, welche Art von Ausgabe, die wir erwarten sollten, und so weiter. Müssen wir zerlegen das problem in eine Anzahl kleinerer Probleme, und das erfordert sowohl technische als auch betriebswirtschaftliche expertise.
Zum Beispiel, mein team kam einmal mit dem, was Sie als eine große Lösung für ein bestimmtes problem. Aber bei genauem hinschauen, dass die Lösung hing stark von einem parameter, der verwundbar war, als Wert kam aus einem sensor, der war nicht zu 100 Prozent zuverlässig. So, das Modell war nicht praktikabel. Was passiert, wenn dieser Wert fehlt, oder wenn es falsch ist?”
Schließlich, welche Art von Architektur und Infrastruktur bietet Alibaba nutzen für seine Daten-pipeline? Die pipeline ist eine klassische Lambda-Architektur, mit einem streaming-Schicht und eine batch-layer. Es ist ziemlich kompliziert, in der Tat, wie Alibaba verwendet, beide Flink und Storm für die Echtzeit-Verarbeitung von Daten, und in beiden Fällen hat seinen eigenen Gabeln, dass es funktioniert.
Min sagt, der Grund hat zu tun mit dem Erbe. Dies ist auch der Grund, warum die Unternehmen keine unmittelbaren Pläne, Sie zu glätten, Ihre Architektur zu einem reinen streaming-Kappa -, als es um die Unterstützung bestehender Partner, die Verwendung Sturm.
Min betont, dass Partnerschaften der Schlüssel sind, um Alibaba Strategie für die expansion, also in dem Licht, das macht Sinn. Min auch behauptet, die “Gehirn” – Lösungen sind erprobt und zuverlässig und konkurrenzfähig sein werden, gegen Punkt-Lösungen. Es bleibt abzuwarten, wie sich diese Strategie zahlt sich für Alibaba, und wie viel Traktion, das es bekommen kann.
0