Alibaba: Opbygning af en detail-økosystem om data videnskab, machine learning, og cloud

0
115

0

thinkstockphotos-620726872.jpg

Data videnskab og machine learning til domæne specifikke indsigter er kernen af Alibaba ‘ s strategi for global ekspansion.

Michael Borgers, Getty Images/iStockphoto

Krigen i detailhandlen har for længe siden gået teknologisk. Amazon er den plakat barn af denne overgang, hvilket banede vejen for det første ved at tage sin virksomhed online, og derefter omfavne skyen og tilbyder stadig mere avancerede services til at beregne og storage til thirrd parter via Amazon Web Services (AWS).

Amazon kan være den ubestridte leder både i form af sin markedsandel inden for detailhandel og dens sky tilbyder, men det betyder ikke, at konkurrencen bare sidder rundt at se. Alibaba, som nogle ser som en Kinesisk pendant til Amazon, er inspireret af Amazon ‘ s succes. Dog, dens strategi, både i detail-og i skyen er varieret, med to konvergerende på et centralt punkt: data videnskab og machine learning (ML).

Wanli Min, Alibaba ‘s vigtigste data videnskabsmand, er en central figur i udformningen og gennemførelsen af Alibaba’ s strategi. ZDNet havde en chance for at snakke med Min om detailhandel i og sky, samt data videnskab, data rørledninger, og ML.

En fortælling forhandler

Alibaba er egentlig ikke et kendt navn i USA, som e-retail marked, der er domineret af Amazon og Walmart med andre i hælene. Den seneste udvidelse bevæger sig ved Amazon og den deraf følgende efterspørgsel efter Walmart på dets associerede selskaber for at flytte deres applikationer fra AWS har toppet den antagonisme mellem dem.

Alibaba er dog enorm i Kina, og Kina er enorm. Dette gør Alibaba en kraft at være produktionsvirksomheden med. Endnu mere, så der er stadig plads til vækst er der, både i form af detailhandel, og i form af cloud. Dette er ikke gået ubemærket af globale spillere farende til Kina for at gøre krav på et stykke af denne kage, men det er klart, at Alibaba har den hjem retten fordel der.

marketshareretailers.png

Alibaba er ikke rigtig på billedet, for detailhandelen i USA. Men de er indstillet på at ændre på det, ved at udnytte nye produkter og data videnskab. Billede: Statista

Dette går begge veje, og om den, som Alibaba, der også sigter mod at ekspandere uden for sit hjem markedet. Ud over Asien, Alibaba er i rivende udvikling i Mellemøsten, USA og Europa. Dette bragte Min til Paris for at undersøge, partnerskaber og slå til lyd for, som Alibaba Cloud deltaget i Viva Teknologi, det franske svar på CeBIT.

Alibaba ‘ s rekord BØRSNOTERING i 2014 faldt sammen med lanceringen af Alibaba Cloud. Alibaba så ud til at Amazon for inspiration, men dets cloud-strategi er diversificeret, som afspejler den overordnede strategi. Alibaba fungerer som et økosystem af forhandlere, der består af, hvad det kræver en økonomi.

Hvad dette betyder er, at Alibaba ønsker at være noget som en service-udbyder til sine kunder i detailleddet, i stedet for at eje hele stakken som Amazon eller Walmart. Og nu Alibaba ønsker at udnytte sin cloud, data, og ekspertise til at blive discipel af digital transformation (DT) for sit økosystem af partnere.

“Cloud er der allerede accepteret, men spørgsmålet er-hvad er det næste?” siger Min. “Hvad kan du gøre med, at compute magt? Vores svar er, data intelligence til at give real-time handlingsorienteret indsigt. Vi samler vores sky, vores data og vores ekspertise til at lette DT via data videnskab.”

Lodret, lodret, lodret — værdi, værdi, værdi-hjerner, hjerner, hjerner

Min refererer til Alibaba ‘ s nylige lancering af “Hjerne”: Alibaba domæne-specifikke intelligence-løsninger til områder som sundhed, transport og produktion. Dette er i skarp kontrast til AWS, som kan tilbyde generiske infrastruktur og værktøjer, og lader kunderne bygge applikationer på toppen af det.

Min forklaret, at begrundelsen var at diversificere fra AWS ved at tilbyde en value-add proposition i stedet for at forsøge at spille catch-up med dem. “Overbevisende kunder til at gå cloud er let. Men vi er nødt til at overbevise dem om at gå Alibaba Cloud, og det er her, vi truffet et andet valg: lodret, lodret, lodret, værdi, værdi, værdi.”

Det kan lyde som en fornuftig strategi for Alibaba, men det er ikke let at udføre.

Først og fremmest, hvordan kan du få den nødvendige ekspertise til så mange domæner på ét sted? For områder som produktion og transport, Alibaba gearede ekspertise ved at finde og ansætte de rigtige mennesker. Men Min siger, de kan ikke gøre dette for hvert domæne, så målet er at opbygge strategiske partnerskaber.

“Vi udvikle noget brugbart, som en version 1.0, som er noget vores partnere kan starte med, og derefter arbejde med dem for at bygge version 2.0, 3.0 og så videre,” forklarer Min. Der er bare ét problem: hvordan er “noget brugbart” kommer til at konkurrere mod specialiserede løsninger, der er blevet udviklet af en række domæner som nu?

“Vi havde vores tvivl,” Min bekender. “Gør dette betyder, at gå imod konkurrenter specialiserede i deres område.” Fordelene ved cloud, at Alibaba kan give, ligesom elasticitet og skalering på tværs af geografi, er temmelig meget en given for disse løsninger. Kører i (AWS, Microsoft, Google, osv.) cloud som SaaS betyder, at der ikke er meget af en differentierende faktor.

Så hvorfor gå for Alibaba? Der er altid økosystemet aspekt, og Min ‘ s svar langs disse linjer, der fokuserer på data videnskab: “Vi kan støtte kunder gå ind på ukendt territorium. Vores Hjerner kan støtte dig, og du vil ikke slås med dig selv — vil du have en hær af data forskere på din side.”

Du, og hvad data videnskab hær?

Tal der taler. Alibaba har ~37.000 medarbejdere, og 20.000 af dem er tekniske. Min er leder af et tværgående team af 300 mennesker, heriblandt omkring 50 data forskere, 200 data ingeniører, og 50 business-eksperter. De data, videnskab mangel er også mærkes i Kina, men Min siger, at de har formået at rekruttere folk fra steder som Japan, Europa og USA.

Alibaba ‘ s strategi er baseret på et økosystem, og det udnytter dette økosystem til at tilbyde domæne specifikke data science-baseret intelligens programmer også.

Så hvordan kan alle disse mennesker arbejder, og hvad der holder dem i gang? Min siger, når du nærmer dig et nyt domæne eller et problem, de gør det på en indlevende måde, men altid med en business-orienteret tankegang. For eksempel, transport og logistik blev valgt for dens potentielle indvirkning. Selv en enkelt ciffer forbedring for Alibaba partnere kan resultere i store besparelser.

“Der er forskellige faser,” siger Min. “I første omgang ingen ved, hvor meget vi kan gøre. Vi undersøger mulighederne og grænserne-hvor det ville være muligt at bryde gennem de nuværende barrierer. Så skal vi forsøge at fremskynde, at finde bedre metoder, og opfordre vores partnere til at samarbejde-innovation.”

Det lyder sammentømrede, men også arbejds-og tidskrævende. Ikke Alibaba overveje at automatisere en del af denne proces, eller ved hjælp af en slags ramme for dette? “Vores tilgang er semi-automatiseret. Jeg tror ikke på fuldt automatiseret data videnskab,” siger Min. “Der er en stor risiko der: du kan komme op med noget, der ikke giver mening i den virkelige verden.

Hvis du gør det undersøgende arbejde i fysik for eksempel, skal du sørge for, at dine resultater er i overensstemmelse med fysikkens love. I erhvervslivet, er dine resultater skal være i overensstemmelse med virksomhedens processer. Ellers kan du ende op med resultater, der ser fine ud på papiret, men ikke mening.”

Der er en række af spuriøse sammenhænge eksempler på, at Min cites der. Men er det ikke det løft i produktiviteten, der kommer fra at automatisere opgaver, som forsøger sig med et væld af ML-modeller og funktioner fristende? Og hvad betyder Alibaba gøre for at sikre ML resultater, der giver mening i den virkelige verden?

“Vi har sanity checks” siger Min. “Og det er den genstand eksperter til at gøre dem, ikke de data, som forskere. Jeg ønsker ikke data forskere, der er involveret, jeg ønsker, at folk med en kritisk holdning til at gøre dette. De kender ikke teknikker, men de ved, at domænet, og kan fortælle dig, om noget giver mening eller ej.

Ja, det er tænkeligt, at du kan komme i Gå-lignende situationer, hvor en algoritme, der kan give resultater, der ikke giver mening, fordi du ikke tror, at noget var muligt, men vi taler ikke om denne. Vi taler om at tjekke, om dit træk der er i bestyrelsen, så at sige. Hvis resultaterne er i overensstemmelse med de regler, fint, ellers har du et problem. Jeg ser en masse, det er derfor, jeg insisterer.”

Sorte bokse og data rørledninger

Og hvad med den sorte boks problem med ML? Mens du bruger ML kan give store resultater, der forklarer, hvordan disse resultatet blev fremstillet, er ikke altid let. “Det er et kæmpe problem,” siger Min. “At forudsige er stor, men i sidste ende handler det om handlingsorienteret indsigt. Vores kunder ønsker at vide, hvordan man kan forbedre, som faktor til at ændre og hvorfor. Så vi er nødt til at have forklares modeller. Jeg kan ikke lide massive data intelligens uden at være opmærksom, og vores kunder ofte fortælle os alt.”

Min måde at klare dette på er ved at bygge to modeller-en hurtig en, og en forklares. “Vi bruger en black box model for at få resultater hurtigt. Så skal vi forsøge at bruge en traditionel model kan forklares med struktur at tilnærme vores resultater. Så længe vi har en forklares model, der kan tilnærme resultater med forsvindende lille forskel, det er godt nok. Jeg vil hellere gå til en forklares model.

Meget ofte har vi en hård tid på at forklare resultater til kunderne. Hvis vi bruger den omtrentlige model, det er meget lettere at sælge: denne er negativ virkning, denne er positiv indvirkning… dette svarer til den sagkyndiges oplevelse af verden. De kan ikke være i stand til at kvantificere det, men de kan forholde sig til positive og negative konsekvenser.”

Min siger, at de bygge sådanne modeller, der ser ud som sekventielle trinvis regression til at prøve og efterligne, og omtrentlige en black box model. Men er det altid muligt at gøre dette, når du har har i tusinder? Og wow svært er det? For Min, “du har brug for den regnekraft til at køre dem, men at bygge dem, er den sværeste del.

Det tager et stykke tid for hvert nyt produkt, da det er en trial and error proces. Det er endnu svært at definere problemet: vi er nødt til at tage højde for alle input, finde ud af, hvilken slags output, vi bør forvente, og så videre. Vi har brug for at nedbryde problemet i en række mindre problemer, og det kræver både tekniske og forretningsmæssige ekspertise.

For eksempel, mit team en gang kom op med, hvad de betragtes som en fantastisk løsning til et bestemt problem. Men ved nærmere kig, at en løsning, der afhang tungt på en parameter, der var sårbar, idet dens værdi, der kom fra en sensor, der ikke var 100 procent pålidelig. Så denne model ikke var brugbar. Hvad sker der, hvis denne værdi er mangler, eller hvis det er forkert?”

Endelig, hvilken type af arkitektur og infrastruktur-ikke Alibaba brug for sine data? Sin pipeline er en klassisk Lambda arkitektur, med en streaming-lag og et parti lag. Det er temmelig kompliceret i virkeligheden, som Alibaba bruger både Flink og Storm for real-time databehandling, og i begge tilfælde har sin egen gafler, at det virker med.

Min siger den grund har at gøre med arv. Dette er også grunden til, at virksomheden ikke har umiddelbare planer om at sprede deres arkitektur til en ren streaming Kappa, som har til støtte for eksisterende partnere, der bruger Storm.

Min fremhæver, at partnerskaber er nøglen til at Alibaba ‘ s strategi for ekspansion, så i det lys, der giver mening. Min hævder også, “Hjernen” løsninger er blevet afprøvet og pålidelig og vil være konkurrencedygtig i forhold til punkt-løsninger. Det er endnu uvist, hvordan denne strategi kan betale sig for Alibaba, og hvor meget trækkraft det kan få.

0