Nvidia Rapids cuGraph: Effettuare l’analisi dei grafici onnipresente

0
78

Come Nvidia vede scienza di dati come il prossimo grande mercato
Il CEO di Nvidia Jensen Huang sta scommettendo che i dati che la scienza si fondono dati, ai centri di calcolo ad alte prestazioni. Ecco perché ha senso.

Un nuovo open-source Nvidia potrebbe essere l’ingrediente segreto per avanzare analytics e facendo grafico database più velocemente. La chiave: elaborazione in parallelo su Gpu Nvidia.

Nvidia ha da tempo smesso di essere “solo” una società di hardware. Come hardware è quello che molto di calcolare sostenere l’esplosione in AI, che corre Nvidia ha preso su di sé il compito di aprire l’ultimo miglio per il software. Nvidia fa questo attraverso lo sviluppo e il rilascio di librerie che gli sviluppatori di software e dati, gli scienziati possono utilizzare per integrare la potenza della GPU per il loro lavoro.
 
La premessa è semplice: Non tutti sono uno specialista di parallelismo o vuole essere uno. La programmazione parallela è difficile. Eppure, questo è ciò che è necessario per sfruttare le capacità della GPU e migliorare le prestazioni del software e analytics. Così, Nvidia fornisce le librerie le persone possono utilizzare per costruire il loro software, senza conoscere tutti i attuazione e dettagli hardware.

Nvidia ha fatto questo con CUDA dal 2007. Da allora, Nvidia ha pubblicato più di 40 Nvidia CUDA-librerie di X, l’ultima Rapids, un open-source data science piattaforma che è l’ombrello sotto il quale varie iniziative, come Dask o XGBoost per i dati che la scienza si sono evoluti.
 
Nvidia è ora di rilasciare Rapids cuGraph 0.9, una libreria il cui obiettivo è quello di rendere l’analisi dei grafici onnipresente. Questo potrebbe essere il fondamento di importanti sviluppi nel grafico analytics e grafico database. Il grafico è un campo in cui abbiamo monitorato attentamente, ma non siamo più gli unici, e non è l’unico motivo per cui si pensa che questo è grande.

Grafico di google analytics su steroidi

Questo breve estratto è preso di l’analisi di Gartner sul perché il grafico governare il mondo nel 2020:

“L’applicazione di elaborazione grafico e grafico database crescerà al 100 per cento all’anno fino al 2022 continuamente accelerare la preparazione dei dati e consentire una più complessa e adattabile dati della scienza.”

Brad Rees, tuttavia, ha fatto a lungo prima che fosse fresco.
 
Rees ha iniziato a lavorare con il grafico di programmazione e di analytics, i dati della scienza, e di AI nel 1980. Nel corso di diversi anni e di progetti, Rees ha trovato la sua strada per Nvidia nel 2017, in quello che allora era un nascente sforzo all’interno di Nvidia. Oggi, Brad Rees è l’IA gestore dell’infrastruttura, di Nvidia, il compito di portare grafico analytics e algoritmi per il mondo.
 
Rees ha interessato a GPU di programmazione in tutto il tempo CUDA 2.0 è venuto fuori. Come altri hanno sottolineato, le maglie utilizzati nella elaborazione grafica è il tipo di una naturale corrispondenza per il grafico di elaborazione: Ogni nodo rappresenta un concetto, ogni bordo rappresenta una relazione.

cugraphviz.jpg

Grafici e grafico-powered algoritmi e analytics sarà tecnologie chiave per il 2020

Così, il fatto che la Gpu può accelerare il grafico di elaborazione non è passato inosservato. Quando Rees aderito Nvidia, c’erano già le implementazioni per un paio di algoritmi di grafico su Gpu. Come Rees ha spiegato, tuttavia, questi non erano molto sistematico, o molto ben integrato all’interno della Nvidia ecosistema. Come l’algoritmo collezione è cresciuta, e il grafico è stato guadagnando a vapore, cuGraph è nato, e Rees è diventato il leader del progetto.
 
CuGraph è un insieme di algoritmi di grafico realizzato su Gpu Nvidia. Che potrebbe non sembrare molto, se non siete in algoritmi di grafico, in modo da contestualizzare il tutto, diciamo che il PageRank, il famoso algoritmo che Google ha costruito il suo impero, è riportato un grafico algoritmo, troppo.
 
Ci sono molti algoritmi di grafico di tutto, e ogni algoritmo è in grado di fornire spunti per dati diversi scenari di analisi. Quando cuGraph la prima release ufficiale, 0.6, uscito a fine Marzo, conteneva già molti algoritmi, tra cui il PageRank. Che versione iniziale focalizzata sulla fornitura di una fondazione e gli algoritmi ottimizzati per una singola GPU analytics.

Con il rilascio della versione 0.9, Nvidia cuGraph è venuta un passo più vicino a 1.0. Come Rees, ha spiegato, l’obiettivo non è solo quello di continuare ad aggiungere algoritmi per cuGraph, ma per farli funzionare su più Gpu, troppo. Questo ora è stato raggiunto per il PageRank. Anche in versione 0.6, tuttavia, cuGraph era già fino a 2000 volte più veloce rispetto NetworkX.
 
NetworkX è riportato un grafico analytics quadro per Python che cuGraph è stato modellato su, a fare tutto il NetworkX fa su Gpu. NetworkX è stato scelto perché è il più popolare grafico framework utilizzato da scienziati dati. NetworkX su steroidi sarebbe già un’impresa, ma la visione che va al di là, e le implicazioni sono molto interessanti.

La vision di Nvidia cuGraph

Rees notato che cuGraph sviluppo sarebbe lentamente spostamento verso migliorare la facilità d’uso, l’interoperabilità e l’integrazione con il resto di Nvidia Rapids biblioteca.
 
In un post sul blog, Rees continuato a spiegare come cuGraph utilizza il grafico di proprietà di paradigma, e come i Frame di Dati sono la chiave per l’interoperabilità con Rapide. Rees ha detto che i Frame di Dati potrebbero essere utilizzati per costruire grafici, eseguire algoritmi su quei grafici, e poi prendere i dati algoritmi di produrre e aggiungerli ai Dati originali quadri secondo le esigenze.
 
CuGraph tabella di marcia comprende anche l’aggiunta dinamica di strutture di dati. Questi possono venire in pratico quando si analizza il grafico di modifiche nel corso del tempo. Come i dati vengono trasmessi, come la struttura di una rete cambiamenti possono essere monitorati e riportati.

cugraphvsnetworkx.png

Nvidia cuGraph biblioteca mira ad accelerare il grafico di elaborazione, e sembra che a destra sul marchio

Di pari importanza è l’utilizzo di una struttura dinamica all’interno di analytics. In molti casi, la dimensione del set di risultati è sconosciuto a priori. Essere in grado di chiudere, aprire, ampliare e ridurre il grafico o i risultati on-the-fly è una tecnica potente.
 
E non finisce qui, però. Rees notato che cuGraph sarebbe l’aggiunta di stato dell’arte grafico analytics framework come GraphBLAS e Hornet, mantenendo un occhio su tutti i nuovi sviluppi e integrandole perfettamente sotto cuGraph per gli sviluppatori di utilizzare.
 
Il riferimento alla proprietà grafici, tuttavia, è stato un trigger per un più speculativa discussione, che tocca non solo gli algoritmi, ma i database, troppo. Proprietà grafici sono uno dei due più diffusi modi per modello di grafici. Diverse grafico database adottato, ed è il punto focale del W3C il continuo sforzo di standardizzare grafico database.
 
Così, ci siamo chiesti che cosa l’interazione tra cuGraph e grafico database potrebbe essere. Per cominciare, dobbiamo sottolineare la differenza: cuGraph è una analytics quadro, ottimizzato per caricare i dati ed eseguire algoritmi. Basi di dati, d’altra parte, sono anche supposto per memorizzare i dati. Anche se cuGraph non è orientata verso questo, ci sono un paio di modi cuGraph possono influenzare ed essere influenzati da, grafico database.

Grafico query e grafico database

Abbiamo visto database offerta grafico analytics quadri, indipendentemente dal fatto che siano grafico database. Si può avere un database relazionale per la modellazione e la memorizzazione dei dati in tabelle, per esempio, che viene fornito in bundle con un quadro di riferimento che consente di interrogare i dati in un grafico linguaggio di query come Cypher. Quindi, se si può fare questo, potrebbe, e dovrebbe, cuGraph fare anche questo?
 
Rees ha osservato che l’aggiunta del supporto per Cypher, per esempio, è fattibile. Se, o quando, questo può essere fatto, tuttavia, è una storia diversa. Il programma di utilità per fare ciò potrebbe essere significativo: è più facile esprimere trattamento come parte di una query, potenzialmente anche in un ambiente interattivo, che si sta utilizzando un’API. L’ultimo esigenze di competenze di programmazione; un analista può fare anche il primo.
 
Altrettanto, se non più importante, tuttavia, è il contrario. Molti graph database hanno cominciato a offrire grafico di implementazioni di algoritmi di fuori della scatola. Come l’esecuzione di algoritmi di grafico è un caso di uso comune, non avrebbe senso per loro di integrare con cuGraph per aumentare le loro prestazioni? Totalmente, e sono totalmente possibile.

cugraph.gif

Grafico analytics fare una buona coppia con graph database. I database come molti in questi giorni sono in bundle con include algoritmi di grafico, cuGraph potrebbe avere un impatto database di troppo.

Anche se questo è un po ‘ speculativo, notiamo un paio di punti. Primo, ci sono graph database che si dice sia già in possesso, o di essere al lavoro su un supporto per le Gpu. In secondo luogo, ci sono molti GPU database intorno. Come c’è una crescente domanda per il grafico di elaborazione, presto potremmo vedere uno o più di tali aggiunta alla loro funzionalità.
 
Questo è il motivo per cui cuGraph può rivelarsi un fattore determinante che influenza il grafico database paesaggio: aggiunta di un grafico di funzionalità di query di potenziare sia cuGraph e qualunque sia il linguaggio di query viene ad essere supportata, mentre l’aggiunta di cuGraph a un database offerta di lavoro allo stesso modo, troppo.

Nel grande schema delle cose, cuGraph la scommessa è fare l’analisi dei grafici onnipresente. Ciò non significa solo più veloce analytics, ma potenzialmente una pietra miliare per il futuro di AI, che, in larga misura, passa attraverso il grafico. CuGraph è qualcosa da tenere d’occhio.

L’innovazione

Perché 2019 è l’anno migliore di sempre per comprare uno smartphone: Accessibile ammiraglie a bizzeffe

Può essere che stiamo entrando in una nuova era geologica

Apollo-ispirato robot hack insieme di strumenti che utilizza oggetti di uso quotidiano

Perché AI ottenere una cattiva reputazione da parte dei media? (ZDNet YouTube)

Questi deepfakes di Bill Hader sono assolutamente terrificante (CNET)

20 terrificante usi dell’intelligenza artificiale (TechRepublic)

Argomenti Correlati:

L’innovazione

La Trasformazione Digitale

Robotica

Internet delle Cose

Enterprise Software

CXO