Alibaba: att Bygga en butik ekosystem på data vetenskap, maskininlärning, och moln

0
181

0

thinkstockphotos-620726872.jpg

Data vetenskap och maskininlärning för domän-specifika insikter är kärnan i Alibaba strategi för global expansion.

Michael Borgers, Getty Images/iStockphoto

Kriget i detaljhandeln har för länge sedan gått tekniskt. Amazon är affischen barnet i denna övergång, som banar väg för det första genom att ta sin verksamhet på nätet, för att sedan omfamna molnet och erbjuder allt mer avancerade tjänster för att beräkna och lagring för att thirrd parter via Amazon Web Services (AWS).

Amazon kan vara den obestridde ledaren, både i termer av dess marknadsandel inom detaljhandeln och dess cloud erbjuder, men det betyder inte att tävlingen bara sitter runt att titta på. Alibaba, som vissa ser som en Kinesisk motsvarighet i Amazon, är inspirerad av Amazon ‘ s framgång. Dock sin strategi både i detaljhandeln och i molnet är diversifierad, med två konvergerande på en samlingspunkt: data vetenskap och lärande (ML).

Wanli Min, Alibaba huvudsakliga data scientist, är en centralgestalt i utformningen och genomförandet av Alibaba strategi. ZDNet fick en chans att prata med Min om detaljhandel i och moln, samt data-vetenskap, data rörledningarna, och ML.

En återförsäljare berättelse

Alibaba är egentligen inte ett känt namn i USA, som e-retail-marknaden domineras av Amazon och Walmart med andra i jakten. Den senaste tidens expansion rör sig genom Amazon och den minskade efterfrågan från Walmart på sina medarbetare att flytta sina program av AWS har toppat den antagonism mellan dem.

Alibaba är dock stor i Kina, och Kina är enorm. Detta gör Alibaba en kraft att räkna med. Ännu mer så det är fortfarande marginal för tillväxt, både i form av detaljhandel och i form av moln. Detta har inte gått obemärkt förbi global spelare rusar till Kina för att göra anspråk på en bit av kakan, men det är klart att Alibaba har hem domstol fördel.

marketshareretailers.png

Alibaba är inte riktigt på bilden för detaljhandeln i USA. Men de är inställd på att förändra det, genom att utnyttja nya produkter och data vetenskap. Bild: Statista

Detta skär åt båda hållen men, som Alibaba är också syftar till att expandera utanför sin hemmamarknad. Förutom Asien, Alibaba expanderar i Mellanöstern, USA och Europa. Detta väckte Min till Paris för att undersöka partnerskap och att förespråka, som Alibaba Moln deltagit i Viva Teknik, det franska svaret på CeBIT.

Alibaba ‘ s record-breaking IPO 2014 sammanföll med lanseringen av Alibaba Moln. Alibaba såg till Amazon för inspiration, men det är moln strategi är diversifierad, vilket återspeglar dess övergripande strategi. Alibaba fungerar som ett ekosystem av återförsäljare, bestående vad man kallar en ekonomi.

Vad detta betyder är att Alibaba vill vara något som en tjänsteleverantör till sina kunder inom detaljhandeln, snarare än att äga hela bunten som Amazon eller Walmart. Och nu Alibaba vill utnyttja sin cloud, data och kompetens för att bli lärjunge till digital omvandling (DT) för dess ekosystem av partners.

“”Molnet redan accepterat, men frågan är-vad är nästa steg?” säger Min. “Vad kan du göra med att beräkna makt? Vårt svar är data intelligens, för att ge realtid värdefulla insikter. Vi för samman våra moln, våra uppgifter och vår kompetens för att underlätta DT via data vetenskap.”

Vertikala, vertikalt vertikalt — värde, värde, värde — hjärnor, hjärnor, hjärnor

Min hänvisar till Alibaba senaste lanseringen av “Hjärnor”: Alibaba domän-specifika intelligence-lösningar för områden som hälso-och sjukvård, transport och tillverkning. Detta står i skarp kontrast till AWS, som erbjuder allmänna infrastruktur och verktyg och låter kunder att bygga applikationer ovanpå denna.

Min förklarade att tanken var att diversifiera från AWS genom att erbjuda ett värde-lägga proposition i stället för att försöka spela catch-up med dem. “Att övertyga kunder att gå cloud är enkel. Men vi måste övertyga dem att gå Alibaba Moln, och det är där vi gjort ett annat val: vertikal, vertikal, vertikala, värde, värde, mervärde.”

Detta kanske låter som en rimlig strategi för Alibaba, men det är inte lätt att köra.

Först av allt, hur kan du få den sakkunskap som för så många domäner på ett ställe? För områden som tillverkning och transport, Alibaba tillvara kompetens genom att hitta och anställa rätt personer. Men Min säger att de inte kan göra detta för varje domän, så målet är att bygga strategiska partnerskap.

“Vi utveckla något användbart, som en version 1.0, något som våra partners kan börja med, och sedan arbeta med dem för att bygga version 2.0, 3.0 och så vidare”, förklarar Min. Det finns bara ett problem: hur är “något fungerande” kommer att tävla mot specialiserade lösningar som har utvecklats av ett antal domäner med nu?

“Vi hade våra tvivel,” Min bekänner. “Detta innebär att man går emot konkurrenter som är specialiserade inom sitt område.” Fördelarna med cloud att Alibaba kan ge, som elasticitet och skalning över geografiska områden, är ganska mycket en självklarhet för dessa lösningar också. Kör i (AWS, Microsoft, Google, etc.) molnet som SaaS innebär att det är inte mycket av en särskiljande faktor.

Så varför gå till Alibaba? Det är alltid ekosystemet aspekt, och Min är svaret längs dessa linjer, med inriktning på data vetenskap: “Vi kan stödja kunder att gå in på outforskat territorium. Våra Hjärnor kan stödja dig, och du kommer inte att slåss med dig själv-du kommer att ha en armé av data forskare på din sida.”

Du och vad för data vetenskap armén?

Siffrorna talar volymer. Alibaba har ~till 37 000 anställda och 20 000 av dem är tekniska. Min är ledare för ett tvärfunktionellt team för 300 personer, varav cirka 50 data forskare, 200 data ingenjörer, och 50 experter verksamhet. Data vetenskap kompetensbristen är också känt i Kina, men Min säger att de har lyckats rekrytera personer från länder som Japan, Europa och USA.

Alibaba strategi, som är baserad på ett ekosystem, och det utnyttjar detta ekosystem att erbjuda specifik domän, data baserad på vetenskap intelligence-applikationer också.

Så hur ska alla dessa människor arbetar, och vad som håller dem upptagna? Min säger att när man närmar sig en ny domän eller problem, de gör det på ett undersökande sätt, men alltid med en affärsorienterad inställning. Till exempel transport och logistik valdes för dess potentiella effekt. Även en enda siffra förbättring för Alibaba partner kan resultera i stora besparingar.

“Det finns olika stadier, säger Min. “Till en början, ingen vet hur mycket vi kan göra. Vi undersöker genomförbarheten och gränser-där det skulle vara möjligt att bryta igenom alla hinder. Då försöker vi att påskynda, hitta bättre metoder, och inbjuder våra partners för att co-innovation.”

Det låter sammansvetsat, men också arbete och tid i anspråk. Har Alibaba anser att automatisera en del av denna process, eller med hjälp av någon form av ram för detta? “Vår strategi är semi-automatiserad. Jag tror inte på att helt automatiserad data vetenskap, säger Min. “Det är en stor risk det: du kan komma upp med något som inte är vettigt i den verkliga världen.

Om du gör det förberedande arbetet i fysik till exempel, måste du se till att dina resultat är i linje med fysikens lagar. I företag, dina resultat måste vara i linje med företagets processer. Annars kan det sluta med resultat som ser bra ut på papperet, men inte vettigt.”

Det finns ett antal falska korrelationer exempel att Min cites det. Men är inte den ökade produktivitet som kommer från automatisera uppgifter som att försöka reda på en mängd ML modeller och funktioner frestande? Och vad gör Alibaba göra för att se till ML resultat vettigt i den verkliga världen?

“Vi gör sanity checks”, säger Min. “Och det är de ämnesexperter som gör dessa, inte uppgifter som forskare. Jag vill inte att uppgifter forskare som deltar, jag vill att människor med en kritisk syn att göra detta. De vet inte tekniker, men de vet domän, och kan berätta för dig om något vettigt eller inte.

Ja, det är möjligt att du kan få i Gå-liknande situationer, där en algoritm som kan ge resultat som inte gör någon mening, eftersom ni inte tror att något var möjligt, men vi pratar inte om detta. Vi talar om att kontrollera om ditt drag är i styrelsen, så att säga. Om resultaten överensstämmer med de regler, fina, annars har du ett problem. Jag ser detta en hel del, det är därför jag insisterar.”

Svarta lådor och data rörledningar

Och vad om att den svarta rutan problem med ML? När du använder ML kan ge bra resultat, och förklara hur dessa resultat härrör sig är inte alltid lätt. “Det är ett stort bekymmer,” säger Min. “Att förutsäga är bra, men i slutändan handlar det om värdefulla insikter. Våra kunder vill veta hur du kan förbättra, vilket faktor att förändra och varför. Så vi behöver förklaras modeller. Jag gillar inte stora uppgifter intelligens utan att betala uppmärksamhet, och våra kunder berättar ofta för oss.”

Min s sätt att hantera detta är genom att bygga två modeller-en snabb en och en förklarlig. “Vi använder en svart låda modell för att få snabba resultat. Då försöker vi att använda en traditionell modell med förklarlig struktur för att approximera våra resultat. Så länge vi har en förklarlig modell som kan ungefärliga resultat med oändligt liten skillnad, det är bra nog. Jag skulle hellre gå till en förklarlig modell.

Mycket ofta har vi svårt att förklara resultaten till kunder. Om vi använder den ungefärliga modell, det är mycket lättare att sälja: denna är negativ inverkan, är positiv inverkan… det här matchar expert upplevelse av världen. De kanske inte kan kvantifiera det, men de kan relatera till positiva och negativa konsekvenser.”

Min säger de att bygga sådana modeller som ser ut som sekventiell stegvis regression för att försöka efterlikna och ungefärliga en svart låda modell. Men är det alltid möjligt att göra det när du har i tusentals? Och wow svårt är det? För Min, “du behöver datorkraft för att köra dem, men att bygga dem är den svåraste delen.

Det tar ett tag för varje ny produkt som det är en trial-and-error process. Det är även svårt att definiera problemet: vi behöver ta hänsyn till alla ingående, räkna ut vilken typ av produktion vi bör förvänta sig och så vidare. Vi måste bryta ner problemet i ett antal mindre problem, och som kräver både teknisk och affärsmässig kompetens.

Till exempel, mitt team en gång kom upp med vad de ansåg att en bra lösning för ett visst problem. Men vid en närmare titt som lösning berodde mycket på en parameter som var utsatta, eftersom dess värde kom från en sensor som inte är 100 procent tillförlitliga. Så att modellen var inte genomförbart. Vad som händer om värde saknas, eller om det är fel?”

Slutligen, vilken typ av arkitektur och infrastruktur har Alibaba använda för data pipeline? Dess ledning är en klassisk Lambda arkitektur, med en streaming-lager och ett parti lager. Det är ganska komplicerat i själva verket, som Alibaba använder både Flink och Storm för data i realtid bearbetning, och i båda fallen har sina egna gafflar som det fungerar med.

Min säger att orsaken har att göra med arv. Detta är också anledningen till att företaget inte har omedelbara planer på att platta till deras arkitektur till en ren streaming Kappa, eftersom det har till stöd för befintliga partners som använder Storm.

Min betonar att partnerskap är nyckeln till Alibaba strategi för expansion, så i det ljuset som gör att känslan. Min hävdar också “Hjärnan” lösningar testas och pålitliga och kommer att vara konkurrenskraftiga mot led-lösningar. Det återstår att se hur denna strategi lönar sig för Alibaba, och hur mycket dragkraft som det kan få.

0