Uber är i Mellanöstern för att stanna, köper konkurrenten
Uber förvärvar Mellanöstern ride-tillkalla service Careem i sek 3,1 miljarder affär.
“Jag försökte verkligen att föreställa sig, om jag deltog på denna konferens för två år sedan, vilken typ av tjugo minuters prat skulle ha varit mest värdefulla,” sade Josua Shinavier, forskare vid ride-delar giant Uber.
“Jag valde en bit av ett annat format, mindre av en teknisk diskussion,” avslutade han. Och med den kom massor av praktiska lärdomar från hantering av massor av data på Uber.
Tala onsdag morgon under dag två av en två-dagars konferens om “kunskap grafer,” värd Columbia University ‘ s School of Professional Studies, Shinavier delade insikter om hur att använda grafiska verktyg för att hantera enheter och relationer för stora data management uppgifter på Uber.
Hans tal, beslöt han, skulle vara mindre tekniskt, för även om många vet om “grafen frågespråk,” i fokus för hans diskussion var i stället hur det är “en hel del organisatoriska utmaningarna” i att bygga en graf på ett företag.
Även: Kunskap graphs bortom hype: att Få kunskap i och ut diagram och databaser
Omfattningen av data, i detta fall, är ganska stora. Shinavier beskrivs hur Uber har 200 000 enskilda “lyckades datamängder”, och som efter att ha passerat de “tio-miljarder-resa” – märket i rider tjänade förra året, bolaget är på en daglig basis samlar låg tusentals personer” som måste finnas i sin knowledge graph.
Shinavier lägga upp en bild som visar ett glas vatten, vilket naturligtvis dök upp antingen halvfullt eller halvtomt. Hans poäng med att göra så var att uppmuntra hans kolleger data som forskarna brottas med verkligheten. “Riktiga data är rörigt,” sade han, “men faktum är, om du vill bygga upp ett företag knowledge graph, du har att ta itu med det.”
Eller, uttryckt på ett annat sätt, “livet ger dig citroner, och tusentals schema, och du har att hantera.”
Uppgifter som är svårbedömda på grund av sådana saker som Om drivrutiner manuellt mata in data i sina telefoner, konstaterade han.

Uber forskaren Joshua Shinavier samtal praktiska frågor av kunskap grafer vid Columbia University School of Professional Studies Knowledge Graph Konferens, 8 Maj 2019.
×
uber-graph-theory-talk-may-8th-2019.jpg
Bland ord av visdom till publiken, Shinavier konstaterade att “ingen gillar verkligen RDF,” databasen query language används för att hämta strukturerad information, “det är svårt att sälja.” Hans råd om du vill använda RDF: “Antingen marskalk alla de argument du kan till förmån för det, annars gör det diskret, vilket är vad jag gjorde”, erkände han, framkalla mycket skratt från publiken.
En annan lärdom var att “akta dig för den hype cycle”, eftersom “kunskap grafer finns massor av andra saker med ett annat namn,” sade han, brukar sätta på plats eftersom “Någon i ledningen fick fel [för grafer], och anställer en massa folk” att gå och göra efter dem.
Ett första steg, sade han, att utveckla en knowledge graph innebära införande av “någon form av system för en gemensam vokabulär,” sade han, och tillade: “detta är mycket viktigt för mig.”
Också: Salesforce Forskning: Kunskap grafer och maskininlärning för att driva Einstein
Uber gjort mindre användning av off-the-shelf verktyg för grafer eftersom det är en mycket dedikerad infrastruktur och hängivna team på företaget, både som bör tas tillvara, sade han.
En annan pärla av visdom var att “passa data modell data,” eftersom uppgifterna kan vara ganska unikt i en viss verksamhet. Till exempel, “de Flesta av våra data är inte i form av en fastighet graf-det är relationell scheman — behövde vi något som passar det”, sade han. “Du har att göra med varningar och meddelanden och migreringar och andra grejer….”
Shinavier rabblade några tekniska detaljer, såsom de tre-lager-kaka av kunskap diagram på Uber. En nivå är en “OLTP graf,” som gör användning av öppen källkod Cassandra data store. Sedan finns det en annan nivå, en “analytics-baserade graph” som använder Hadoop-filsystem, med Cypher och Apache Gnista. Och för det tredje, det är “graph embeddings”, även om han snabbt till, “fråga mig inte alltför mycket om grafen embeddings, det är inte mitt område.”
När han kom till den bild som är märkt “Risk och Säkerhet Knowledge Graph,” det var avsiktligt lämnats tom “för att spara entropi,” med tanke på att, som Shinavier sade, “det är en sådan sak som dålig skådespelare som inte är dumma”, det vill säga, människor som kan få idéer för bus.
Bland de utmaningar som finns på Uber är behovet av att ha en gedigen politik för att skydda integriteten för användar-data, särskilt i ljuset av den Europeiska “GDPR” sekretess lagstiftning. Men saker är svårt eftersom “det är ganska svårt att definiera” vad som utgör data som måste hållas privat, sade han. “Slutsatsen är skyldig att veta om det är användarens uppgifter som måste skyddas”, sade han.
Måste läsa
Vad är AI? Allt du behöver för att vetavad är djupt lärande? Allt du behöver för att vetavad är lärande? Allt du behöver för att vetavad är cloud computing? Allt du behöver veta
Avrundning ut hans tal, Shinavier berört kortfattat om de “roligaste” på gång på Uber, vilket är något som kallas “algebraiska egendom grafer,” som drar på teori och kategori teori. Ansträngningen är att bilda en “gemensam datamodell för RPC, lagring och kunskap representation” på Uber. Det är i linje med en W3C försök att definiera “egendom diagram schema” och även att utvecklas med ett öga till något som kallas “Universell Struktur” av Apache TinkerPop4 projektet. TinkerPop är en computing ramen för grafdatabaser.
Att arbete på grund av för publicering i en kommande artikel, sade han.
I Q&A som följde Shinavier prata, han fick frågan om det är bättre att börja med infrastruktur innan du samlar in data, eller om det är bäst att samla in data och sedan bygga. Hans svar föreslås på båda sätt hade meriter. Det är bäst att samla in data först och sedan ställa infrastruktur för att passa det, var hans första svar på den frågan. Men sedan tillade han att det inte var en dålig idé att sätta upp en stabil infrastruktur i förväg.
Uber är inställd på att gå på New York-Börsen i fredags.
Arbetar du med kunskap grafer i ditt företag? Låt mig veta vad du tycker dem i kommentarerna.
Artificiell Intelligens
MIT slutligen ger ett namn till summan av alla AI rädslor
Varför företagen kommer att ha till revision algoritmer, AI och står för risken
Microsoft är iordningställande AI-drivna Azure digitala pennanteckningar tjänster
Vodafone tecknar femårigt avtal med IBM för moln, analytics och AI
Facebook: Nya AI-tech fläckar hatpropaganda snabbare (CNET)
16 böcker om AI, robotik och automation (TechRepublic)
Relaterade Ämnen:
Big Data Analytics
Digital Omvandling
CXO
Sakernas Internet
Innovation
Affärssystem