Fondamentale Greenplum è vivo e vegeto

0
177

Zero

pivotal-logo.png

Quando è stato girato fuori da EMC e VMware, Cardine sembrava essere una strana collezione di imprese. Le più grandi parti del business, tra cui il Cloud Foundry e Greenplum database analitico, sembrava il massimo strana coppia: una piattaforma tecnologia cloud e di un database analitico. Abbiamo sempre chiesto circa le sinergie tra i due settori e quando o se Cardine sarebbe finalmente dimostrare che la somma è maggiore delle parti. Eppure, lo stesso è stato detto quando Dell usato di private equity per acquisire EMC in un’acquisizione che si accumulavano notevole debito. Un anno dopo Dell ed EMC chiuso, il combinato business è un run rate di buttare fuori quattro volte tanto il flusso di cassa rispetto al servizio del debito.

Chi lo sapeva?

Altrettanto si potrebbe dire per il Greenplum lato dei Cardini di business. Sotto Cardine dell’orologio, ha operato nell’ombra di Cloud Foundry, che ha attirato l’attenzione e probabilmente la parte del leone di investimento. L’ultima volta che abbiamo lasciato, Cardine aveva perso il Hadoop business – prima interrompendo la propria piattaforma, e quindi il funzionamento di un partenariato con Hortonworks, solo per ottenere eclissato da IBM.

Così, quando abbiamo preso un altro sguardo al Cardine del Greenplum di business, siamo stati molto sorpresi. OK, non abbiamo ancora trovato la sinergia con il Cloud Foundry, ma indovinate un po’? Il Greenplum business sta facendo abbastanza bene, grazie. Si stima che Greenplum è di circa 100 milioni di dollari di business e di redditività solida. E, sorprendentemente, per un’azienda nata oltre 15 anni fa, si stima che è attualmente in crescita a metà a doppia cifra annuale di costo. Mentre la nave madre brillato i riflettori su Cloud Foundry, il Greenplum base installata è rimasto ostinatamente fedele e continua a mettere più la pelle nel gioco.

Greenplum, un altro dei database PostgreSQL, in concorrenza sullo stesso mercato Teradata, Exadata, e Redshift. Dato Fondamentale è iniziata l’open source il suo portafoglio di prodotti di un paio di anni indietro, Greenplum ha, in effetti, ha gareggiato con il Teradatas del mondo, ma al più Hadoop-prezzi come. Come la sua data warehousing rivali, Greenplum ha ampliato al di là delle tradizionali SQL; è stato uno dei primi magazzini di dati di abbracciare MapReduce e supporta l’apprendimento automatico attraverso l’open source di Apache MADlib progetto che porta. E come la maggior parte dei suoi rivali, inoltre, ha realizzato il database più flessibile, in grado di ospitare una varietà di tipi di dati al di là delle tradizionali relazionale di dati strutturati. E ha la casella di controllo Scintilla connettore — qualcosa che sta diventando la norma per l’analitica database.

Nessuna di queste caratteristiche sono necessariamente unico, ma quando si combinano la capacità di scala, eseguire altamente query SQL complesse, e di gestire una grande varietà di carichi di lavoro, il suo prezzo inferiore rispetto al calibro di Oracle e Teradata hanno dimostrato attraente.

La nuova release, Greenplum 5, è stato annunciato oggi. Si arricchisce ulteriormente il database con il supporto di testo, geospaziali, e dati in formato JSON. Certo, questa capacità è essenzialmente tiene il passo con i Jones, che la maggior parte di Greenplum rivali stanno diventando anche più estensibile.

Il multi-capacità di carico di lavoro pone le basi per un miglioramento correlati: la capacità di gestire carichi di lavoro misti e applicare “CPU scherma” di specifiche risorse di calcolo possono essere dedicati a specifici tipi di carichi di lavoro. Mentre la maggior parte analitica le prestazioni dei database di gestione del carico di lavoro, la capacità di equilibrio, di calcolo e di dati (IOPS)-per la cpu carica ha tradizionalmente confinata nella top-of-the-line di sistemi di Teradata e Oracle.

Naturalmente, con FILO, Hadoop, inoltre, gestisce carichi di lavoro misti — così a prima vista, si potrebbe chiedere cosa c’è di così speciale. Ma Hadoop capacità di gestire in modo ottimale interattivi, batch, e in streaming i carichi di lavoro su diverse parti del cluster rimane un work in progress perché FILATO solo alloca le risorse, e non in grado di gestire attivamente o per ottimizzare il loro..

Per la nuova release, Greenplum ha ulteriormente affinato le query optimizer complessi sub-operazioni di selezione e query nidificate, e ha aggiunto la possibilità di convertire le query correlate a più gestibile operazioni di join. Che rafforza il fatto che è in competizione con il Teradatas, non il Redshift del mondo. Tenetelo a mente.

Infine, Greenplum 5 aggiunge certificazioni per più fornitori di servizi cloud. È già disponibile come Infrastructure-as-a-Service (IaaS) offrendo AWS marketplace, dove è possibile portare la propria licenza o di utilizzo on-demand prezzi. E Greenplum è disponibile anche per la società sorella di VMware vSphere e OpenStack per le implementazioni di cloud privati. Con la nuova versione, Azure certificazione è aggiunto, con Google Cloud in arrivo. Multi-cloud capacità di essere critici, come ci aspettiamo che inizierà a diventare un bruciatore anteriore problema per le imprese, come hanno rampa di distribuzione cloud; la maggior parte avrà inizio in via di sviluppo secondo fonti politiche per evitare di cloud vendor lock-in.

Cosa manca da Pivotal Greenplum è un cloud gestito che offre. Mentre non ci attendiamo Greenplum di competere con Redshift sulla base della scala di raggiungere e suo posizionamento ad alta complessità analytics, un servizio di cloud gestito che offre di un ampliamento del mercato indirizzabile in modo significativo. Questo è il mezzo con il quale più imprese saranno in grado di sfruttare i big data analytics.

In ultima analisi Fondamentale Greenplum dovrebbero fare un passo fino alla piastra con un managed cloud pubblico Greenplum servizio. Ma per cominciare, perché non bootstrap gestito offerta di cloud privato utilizzo di-avete indovinato-il Cloud Foundry infrastrutture? Ora che avrebbe finalmente messo a riposo assillanti domande da fastidiosi analisti come il sottoscritto a cui la sinergia tra Cloud Foundry e Greenplum in realtà poggia.

0