Cloudera e Hortonworks: figli Prodighi riunire

0
186

Zero

merging-two-worlds.jpg

Con il vantaggio di due set di occhi e orecchie, uno di noi ha la notizia in diretta, mentre l’altro l’ho appena visto in una serie di criptici messaggi di testo durante l’atterraggio all’Aeroporto di Newark un paio di ore più tardi: Cloudera e Hortonworks stanno entrando in una merger of equals che vede Cloudera azionisti di possedere circa il 60% della nuova società.

Larry Dignan consegnato le flash news di ieri: Si mette insieme una società con circa 5 miliardi di dollari di valutazione e di $750 milioni di euro di ricavi, con i giocatori che sono stati lentamente avanzando verso il flusso di cassa positivo di bilancio. Fino ad ora, abbiamo pensato che IBM sarebbe stato più probabile pretendente per Hortonworks data una relazione OEM che stava trovando crescente commerciali di trazione. Ma come IBM di ritardo è stato impegnato a bilico il futuro del proprio business da Watson cognitive computing verso un confine attuazione di AI, per non parlare dell’urgenza di costruire il Cloud di IBM business, ci sono pesci più grandi da friggere.

L’accordo mette insieme due ex rivale. I co-fondatori di entrambe le aziende in comune di sfondo a Yahoo inventare Hadoop, ma poi ha continuato a forgiare percorsi separati che in alcuni punti è diventato personale e contenzioso. Ma anche durante il culmine della rivalità, entrambi hanno lavorato insieme nella comunità Apache, a volte sullo stesso Hadoop progetti, ma molte volte, sulla competizione. Attraverso gli anni, l’analista di Gartner Merv Adrian ha fedelmente seguito la canonica storia di Hadoop progetti, che tende ad assomigliare di più di una scorecard.

cutting-murthy.jpg
Arun Murthy e Doug Cutting essere intervistato da Jeff Kelly in Hadoop Summit 2014

Il passare del tempo (per non parlare di un certo grado, il turnover del personale) può avere levigato fuori alcuni dei più ruvida bordi della rivalità negli anni, ma c’è la questione della sovrapposizione di progetti a contendere con. Come molte fusioni, ci sarà sempre la necessità per il prodotto di razionalizzazione. Ma c’è così tanta storia che l’ordinamento di Apache Sentry e Ranger; Spot e Metron; Atlas e Cloudera Navigatore; Hive LLAP e Impala; e Ambari e Cloudera Manager difficilmente sarà tagliato e secco. Ci sarà probabilmente vedere Doug Cutting e Arun Murthy riprendeva la loro Hadoop Summit 2014 stage congiunto aspetto, ma nei confini di sale per conferenze.

Non sorprende che, data la forte identità culturali di entrambi i giocatori, la fusione comunicato stampa omesso alcuna menzione di ciò che la società combinata sarà chiamato. Sì, ci sono alcuni ego che probabilmente bisogno di essere placato. Ci sono anche modelli di business per essere in sintonia, ma la buona notizia è che, sottilmente, Hortonworks 100% puro modello open source è stato gradualmente convergendo a qualcosa di più come Cloudera open core. Mentre il nucleo Hortonworks piattaforma è rimasta open source, è entrato il rivenditore transazioni di software proprietario.

Ma il mondo è cambiato da quando era semplicemente la battaglia di Hadoop piattaforme open source o altro. Un tempo c’erano una mezza dozzina di offerte tra cui scegliere, ma che era quando Hadoop è stato l’unico gioco in città per l’analisi di petabyte di dati. Oggi il panorama del mercato offre molti più percorsi, molti di loro molto meno complesso di marshalling tutte le dozzine di componenti del cluster Hadoop.

Non c’è Scintilla, che può funzionare in modo indipendente o come parte di un’analitica dei dati piattaforma di magazzino, o come un progetto sostenuto di Hadoop. C’è una crescente varietà di scelte per il discreto e l’apprendimento automatico apprendimento profondo servizi per coloro che desiderano sviluppare e rendere operative AI modelli. Ci sono di streaming di flusso di dati e sistemi che consentono di analizzare i dati in tempo reale e di bypass Hadoop, incanalando direttamente nel cloud storage.

E poi c’è SQL. Ricordate SQL? Ci sono servizi cloud-based che consente di eseguire query SQL ad hoc contro di Hadoop. Nell’ultimo tocco, SQL Server 2019, ha appena annunciato in anteprima da Microsoft, introdurrà i big data edizione swap out Hadoop sul nodo di calcolo a favore di Microsoft motore di database SQL e Scintilla che viene eseguito direttamente contro HDFS in nodi di dati (che in realtà c’è una grande somiglianza tra il modo di Cloudera distribuisce Impala demoni). Amazon Redshift Spettro, il Cloud di Google BigQuery, e di SQL Azure Data Warehouse è possibile eseguire tutti contro di cloud storage. Così fa il Fiocco di neve.Ci sono anche servizi cloud-based che permette di eseguire query SQL su cloud object storage.

In questo sempre più frammentato, paesaggio, Hadoop biglietto da visita è la versatilità e la governance emergenti che, con uno qualsiasi dei servizi di cui sopra, deve implementato a la carte.

Abbiamo detto di servizi basati sul cloud? La presenza di Amazon EMR, Azure HDInsight, e Google Cloud Dataproc anche inclina l’equazione. Cloudera e Hortonworks devono fare i conti con il “nessuno è stato licenziato per acquistare” il fornitore di servizi cloud gestiti Hadoop servizio se si sta già utilizzando il cloud. A parte HDInsight (dove Microsoft Oem il Hortonworks piattaforma), entrambi sono stati girevole di più verso i servizi specialistici per i dati di ingegneria, di data warehousing e data science di differenziare Emr del mondo-che si concede che EMR et al predefiniti Hadoop piattaforme in cloud e che non ha senso per Cloudera o Hortonworks per andare dritto contro di loro con un altro che offre.

A proposito, il cloud ha cambiato anche la definizione di ciò che è Hadoop, come prossime versioni di Apache piattaforma renderà più facile scambiare in cloud storage in luogo di HDFS. Con il cloud storage diventare de facto dati lago, il refactoring di Hadoop livello di archiviazione è in arrivo, non un momento troppo presto. E come per MapReduce, l’altro originale pilastro di Hadoop, sta diventando una specie in via di estinzione.

Sul lato commerciale, il paesaggio è una sfida e un’opportunità. Sul lato positivo, le due aziende hanno combinato circa 2500 clienti. Come ogni piattaforma enterprise, i cicli di vendita sono lunghe e costose, il che significa che il percorso di profitti è la terra e di espandere il modello. Data la le nostre stime, l ‘ 80% di questa base è in sede, il cloud non è una diretta concorrente, e che fornisce lo spazio aereo per la nuova società di poter finalmente usufruire di “espandere” la parte di terra e di espandere il ciclo, come la strada a margini più elevati. E con una base di 2500, c’è una dimensione sufficiente per preparare un percorso per la redditività. E come Cloudera e Hortonworks hanno preso di mira il top 3000 – 5000 aziende in base alla complessità dei problemi analitici, il loro business simile a quello di Teradata, che è ora il suo percorso di redditività.

Come Ovulo è previsto per il prossimo anno, la metà dei nuovi dati di grandi carichi di lavoro sarà in the cloud, che è dove l’attrito si riscalda. Hadoop è installato di base è costituito da aziende che hanno le competenze per impostare grandi cluster di dati. Ma la maggior parte delle aziende non hanno tali competenze, e per loro, la semplicità del cloud chiama. Può Hadoop essere resa più semplice attraverso un servizio di gestione che si porta via tutte le sudice di provisioning e configurazione, o punto di servizi e / o familiare e database relazionali SQL essere i modi più convenienti per ottenere risultati?

Ecco dove Cloudera/Hortonworks affronta il suo miglior nemico più feroce. Per Cloudera e Hortonworks, Amazon rapporto è stato più lungo di armi e Google rapporto è in uno stadio molto precoce. Che lascia Azure, in cui la Microsoft ha messo la pelle nel gioco con Hortonworks in HDInsight, e dove Cloudera e Microsoft hanno collaborato a più specializzati Altus offerte. Ma poi di nuovo, Microsoft è copertura di scommesse e ha messo significativo muscolo di marketing dietro di Azure Databricks come la prima piattaforma per la Scintilla e AI. In futuro, ci aspettiamo che Microsoft verrà eseguito il Database SQL Azure anche contro di archiviazione Blob di Azure o di RIPOSO, di lanciare la Scintilla nel trattare, proprio come si fa con SQL Server 2019 sul HDFS.

E così, mentre Cloudera/Hortonworks’ vicino al termine del percorso di redditività si trova di ampliare la superficie esistente sulla premessa di base installata, il caldo, la crescita del mercato sarà nel cloud, dove è molto più di una giungla.

Argomenti Correlati:

Cloud

La Trasformazione Digitale

Robotica

Internet delle Cose

L’innovazione

Enterprise Software

0