Uber grafico esperto che porta le cicatrici di miliardi di viaggi

0
107

Uber è in Medio Oriente per soggiorno, acquista principale rivale
Uber acquisisce Medio Oriente ride-chiamare il servizio Careem in 3,1 miliardi di dollari affare.

“Ho provato ad immaginare, se ho partecipato a questa conferenza di due anni fa, che tipo di venti minuti di discorso sarebbe stato più prezioso”, ha detto Joshua Shinavier, un ricercatore presso ride-sharing gigante Uber.

“Ho scelto un po’ di un formato diverso, meno di un discorso tecnico”, ha concluso. E con che è venuto un sacco di lezioni pratiche da gestire tonnellate di dati a Uber.

Parlando mercoledì mattina nel corso di una conferenza di due giorni sulla “conoscenza grafici,” in hosting ” presso la Columbia University, la Scuola di Studi Professionali, Shinavier condivisione delle conoscenze su come utilizzare la grafica strumenti per la gestione di entità e relazioni per l’enorme attività di gestione dei dati a Uber.

Il suo discorso, ha deciso, sarebbe un po ‘ meno tecnico, perché anche se molte persone non conoscono “grafico linguaggi di interrogazione,” il fuoco della sua discussione è stata, invece, come ci sono “un sacco di sfide organizzative” nella costruzione di un grafico di una società.

Inoltre: Conoscenza grafici oltre hype: Ottenere la conoscenza dentro e fuori di grafici e database

La scala di dati, in questo caso, è piuttosto grande. Shinavier descritto come Uber è di 200.000 individuale “set di dati gestiti”, e che, dopo aver superato le “dieci miliardi di viaggio” mark in corse servito l’anno scorso, la società su una base quotidiana accumulando “low-migliaia di entità” che devono essere inclusi nel suo knowledge graph.

Shinavier mettere in su una diapositiva che mostra un bicchiere di acqua, il che, naturalmente, è apparso sia mezzo pieno o mezzo vuoto. Il suo punto di farlo era quello di incoraggiare i suoi compagni di dati di scienziati alle prese con la realtà. “I dati reali del disordine,” ha detto, “ma il fatto è che se si vuole costruire un enterprise knowledge graph, hai a che fare con esso.”

O, per dirla in altro modo, “la vita ti dà limoni, e migliaia di schema, e hai a che fare.”

Dati disordinato a causa di cose come Uber driver manualmente l’inserimento dei dati nel loro telefoni, ha osservato.

uber-graph-theory-talk-may-8th-2019.jpg

Uber scienziato di ricerca Giosuè Shinavier parla di questioni pratiche di conoscenza grafici alla Columbia University, la Scuola di Studi Professionali Knowledge Graph Conferenza, l ‘ 8 Maggio, 2019.

×

uber-graph-theory-talk-may-8th-2019.jpg

Tra le parole di saggezza per il pubblico, Shinavier osservato che “nessuno ama veramente RDF,” il linguaggio di query di database utilizzato per recuperare informazioni strutturate, “è una vendita dura.” I suoi consigli, se si desidera utilizzare RDF: “maresciallo tutti gli argomenti che è possibile in favore di esso, o altro in modo discreto, che è quello che ho fatto”, ha confessato, suscitando molte risate da parte del pubblico.

Un’altra lezione è di “beware the hype cycle”, perché “la conoscenza grafici sono un sacco di altre cose con un altro nome”, ha detto, di solito messo in atto perché “Qualcuno di gestione ottenuto il bug [grafici], e ingaggia un gruppo di persone di” andare e fare.

Primi passi, ha detto, e lo sviluppo di una knowledge graph prevedere la creazione di “un qualche tipo di sistema per un vocabolario condiviso,” ha detto, aggiungendo, “questo è molto importante per me.”

Anche: Salesforce Ricerca: la Conoscenza grafici e di apprendimento automatico per l’alimentazione di Einstein

Uber fatto meno uso di off-the-shelf strumenti per grafici perché c’è un sacco di un’infrastruttura dedicata e un team dedicato alla società, che deve essere sfruttato, ha detto.

Un’altra perla di saggezza è stato quello di “adattare il modello di dati per i dati,” perché i dati possono essere abbastanza singolare, in un determinato business. Per esempio, “la Maggior parte dei nostri dati, non nella forma di un grafico di proprietà-e’ in schemi relazionali-abbiamo bisogno di qualcosa che si adattano a questa,” ha detto. “Hai a che fare con gli avvisi e le notifiche e le migrazioni e altre cose….”

Shinavier snocciolato alcuni dettagli tecnici, come i tre strati di torta di knowledge graph a Uber. Un livello è un “OLTP grafico” che sfrutta l’open-source Cassandra archivio dati. C’è poi un secondo livello, un “analisi basata su grafico” che utilizza il Hadoop file di sistema, con Cypher e Apache Scintilla. E in terzo luogo, ci sono “grafico incorporamenti,” anche se ha rapidamente aggiunto, “non mi chiedete troppo, grafico incorporamenti, non è il mio campo.”

Quando giunse alla diapositiva etichettato come “Rischio e Sicurezza Knowledge Graph,” è stata lasciata intenzionalmente in bianco “per salvare l’entropia”, dato che, come Shinavier ha detto, “c’è una cosa come il male attori che non sono stupido”, nel senso, persone che potrebbero ottenere idee per le marachelle.

Tra le sfide a Uber sono la necessità di disporre di una solida politiche per tutelare la privacy dei dati dell’utente, soprattutto alla luce di quello Europeo “GDPR” normativa in materia di privacy. Tuttavia, le cose sono difficili perché “è abbastanza difficile da definire” ciò che costituisce dati che devono essere mantenute private, ha detto. “L’inferenza è necessario sapere se si tratta di dati utente che ha bisogno di essere protetto”, ha detto.

Deve leggere

Che cosa è l’IA? Tutto il necessario per knowWhat è profondo apprendimento? Tutto il necessario per knowWhat è la macchina di apprendimento? Tutto il necessario per knowWhat è il cloud computing? Tutto quello che devi sapere

A completare il suo discorso, Shinavier toccato brevemente la “cosa più divertente” andando a Uber, che è qualcosa che si chiama “proprietà algebriche grafici” che attingono la teoria degli insiemi e di categoria di teoria. Lo sforzo è quello di formare un “modello di dati comune per la RPC, di stoccaggio e di rappresentazione della conoscenza” a Uber. È allineato con W3C sforzo per definire “grafico di proprietà dello schema” e anche di essere sviluppato con un occhio a qualcosa chiamato “Universale Struttura” di Apache TinkerPop4 progetto. TinkerPop è un quadro di calcolo per grafico database.

Che lavoro è dovuto per la pubblicazione in un prossimo articolo, ha detto.

In Un Q&a, che ha seguito Shinavier il discorso, gli è stato chiesto se è meglio iniziare con le infrastrutture prima di raccogliere qualsiasi tipo di dati, o se è meglio raccogliere i dati e costruire. La sua risposta è suggerito in entrambi i modi aveva meriti. E ‘ meglio per raccogliere i dati e ottimizzare l’infrastruttura per soddisfare, fu la sua risposta iniziale alla domanda. Ma poi ha aggiunto che non era una cattiva idea per impostare una solida infrastruttura di anticipo.

Uber è impostato per andare pubblico sul New York Stock Exchange questo venerdì.

Stai lavorando con conoscenza grafici nel vostro business? Fatemi sapere cosa ne pensate nella sezione commenti.

Intelligenza Artificiale

MIT, infine, dà un nome alla somma di tutti AI timori

Perché le aziende dovranno audit algoritmi di IA e per conto del rischio

Microsoft sta preparando AI-powered Azzurro inchiostro digitale servizi

Vodafone segni accordo di cinque anni con IBM per il cloud, analytics e AI

Facebook: Nuova IA tech punti di odio più veloce (CNET)

16 libri su AI, la robotica e automazione (TechRepublic)

Argomenti Correlati:

Big Data Analytics

La Trasformazione Digitale

CXO

Internet delle Cose

L’innovazione

Enterprise Software