ITALIANO

Greenplum 6 avventura al di fuori analitica box

154

Si tratta di circa sei mesi di anticipo, ma Fondamentale è parlare di Greenplum versione 6. È un traguardo di rilascio, come il v6 è uno che finalmente messo la Greenplum database in piena sincronia con l’open source PostgreSQL tronco. E, a sua volta, che ha liberato il team di sviluppo di diffondere le sue ali per coprire il terreno al di fuori Greenplum tradizionale MPP analytics impronta. A Postgres Conferenza a New York questa settimana, la società ha fornito uno sguardo alla tabella di marcia per la prossima versione, che è attualmente prevista per il mese di settembre di rilascio.

Un primo vantaggio di essere su PostgreSQL tronco è Fondamentale che non è necessario reinventare la ruota ogni volta che i cambiamenti di versione. Per il v6, spianato la strada per Greenplum database per aggiungere alcune delle caratteristiche operative. Che permetta di sostenere analitica dei carichi di lavoro che comprendono alcuni transazione funzioni come il blocco gamma di indici che possono accorciare la ricerca di dati i tempi, o “upsert” in tempo reale gli aggiornamenti condizionali e inserti.

Questo è parte di una tendenza più ampia per i database per aggiungere la sovrapposizione di capacità. Mentre Microsoft, con il Cosmo DB è il bambino del manifesto per il multi-modello di database, su un livello più modesto, transazione piattaforme come SQL Server e Oracle hanno a lungo gestito carichi di lavoro misti, e anche Amazon, che si concentra su fit-for-purpose database, ha aggiunto un po ‘ di luce le capacità analitiche con query parallela alla sua Aurora transazione piattaforma.

Il vero motivo per Greenplum aggiungere il supporto delle transazioni non è per trasformarlo in un Oracle o SQL Server sostituzione per il back-office per le applicazioni finanziarie, ma, invece, per l’IoT. Il database è ancora un’analitica colonna store, ma supporta più veloce di legge e scrive da renderlo adatto per il funzionamento di analytics. Per IoT, i benefici sono aggravati con Apache Kafka supporto. Kafka supporto consente di Greenplum sfruttare il suo parallelismo massiccio di processo in ingresso IoT torrenti che hanno i requisiti per l’elaborazione in tempo reale e in scala.

Un altro grande accessorio per la v6 è Kubernetes supporto. Fornisce i mezzi per semplificare la distribuzione in ambienti cloud privati. Gestisce il provisioning (e la revoca), l’installazione di pacchetti di, scala e di recupero – trasformando la cottura di un cluster in la comodità di un self-service cloud.

Containerizzazione sta cominciando a venire al database, ma più limitare a mettere l’intero database in un contenitore. Greenplum contenitore di supporto è molto più granulare: è possibile containerize “segmenti” che sono logicamente isolato carichi di lavoro e gruppi di risorse. La nozione di sostegno isolamento all’interno di Greenplum, non è nuova, era l’equivalente di supporto per Linux gruppi di controllo, così si potrebbe logicamente isolare i più carichi di lavoro all’interno di un cluster. Per Kubernetes, Fondamentale era quello di sviluppare un operatore per la configurazione stateful carichi di lavoro, perché né l’Kubernetes o Postgres comunità open source non aveva ancora a passo fino alla piastra di sviluppare uno (Kubernetes è stata associata con stateless carichi di lavoro fino ad ora). Fondamentale sostiene che l’operatore si è sviluppato potrebbe essere generalizzato per PostgreSQL.

La prossima versione di Greenplum aggiunge più di machine learning per il supporto, e apre la strada ad un apprendimento profondo. Apache MADlib, open source e di machine learning library progetto Fondamentale che ha portato, ha aggiunto un nuovo supporto per Keras con TensorFlow come back-end, e aggiunge anche il supporto per GPU. Ci sono le nuove funzionalità per la gestione delle versioni dei modelli e di confronto tra le prestazioni dei diversi modelli. Combinato con containerizzazione, facilita tecniche di distribuzione come campione/challenger o canarini.

Sempre sul PostgreSQL tronco sarà accelerare il onramping di nuove funzionalità per Greenplum. È ancora un work in progress; la versione attuale di sviluppo ha ottenuto di PostgreSQL 8.4 (che si aggiunge a colonne autorizzazioni), ma l’obiettivo è quello di ottenere Greenplum 6 fino a PostgreSQL 9, quando va GA. Che si andranno ad aggiungere hot standby e in streaming la replica, tra le altre chicche. Ma PostgreSQL è ora raggiungere v11, che AWS ha appena rilasciato il suo servizio RDS. Che significa che chicche come a livello di tabella di partizionamento e di partizionamento hash – che la facilità di bilanciamento del carico – dovrà aspettare, ma probabilmente non così a lungo.

Argomenti Correlati:

Intelligenza Artificiale

La Trasformazione Digitale

Robotica

Internet delle Cose

L’innovazione

Enterprise Software