Per CockroachDB, transazioni, analytics è una feature, non un bug

0
123

Cloud nativo database. Senza server di database. Comunque lo si voglia chiamare, c’è una nuova generazione di database, in aumento. Uno che promette la scalabilità automatica su scala globale: Non più lavorando sulla configurazione, gestione, replica e simili, basta girare alcuni casi, in cloud e andare.

Anche: Open source AI chip facendo Onde Verdi: Portare efficienza energetica per l’architettura IoT

Ma anche se i dati è naturalmente gravitano verso il cloud, non tutti sono disposti e in grado di spostare tutti i dati là. In modo che i database in questi giorni sono sempre di più dovrebbero essere in grado di gestire carichi di lavoro senza soluzione di continuità, sia on-premise e in una moltitudine di nuvole.

E poi, c’è anche quello che ormai sembra un vecchio dilemma: SQL, o NoSQL? Mentre l’inclinazione tradizionale di progettazione di database relazionali ha portato vantaggi in termini di scalabilità, in sostituzione di SQL non è necessariamente qualcosa che la gente vuole.

Così come si fa a combinare SQL, cloud nativo, multi-cloud e hybrid cloud?

Multi-cloud, cloud ibrido, incontrare SQL

Non sorprende, ci sono un paio di cloud database nativo offerte da fornitori di cloud. Alcuni di loro, come Azure CosmosDB, Google Chiave e AWS Aurora, anche il supporto di SQL. Chiaramente, nessuno di loro è multi-cloud.

Anche: 2019 sarà un altro Anno di Grafico: OpenCorporates è la prova N. 1

Ci sono anche un paio di multi-cloud database intorno, del calibro di DataStax Impresa o MongoDB, fare un gioco per sfruttare questa forza, e l’aggiunta di serverless caratteristiche. Essendo open source, è un tratto comune tra tali offerte. Essi in genere non hanno il supporto SQL.

Ma ci sono opzioni di cloud nativo, il supporto multi-cloud e hybrid cloud, SQL, e l’open source? Pochi, e CockroachDB è notevole tra di loro.

Se vi state chiedendo cosa con il nome è un cenno alla resilienza, qualcosa per cui le blatte sono noti per. Scarafaggio Laboratori, sede dell’open source CockroachDB, è stata fondata nel 2015 da ex-Googler Spencer Kimball, Peter Mattis, e Ben Darnell. Mentre Google, avevano utilizzato Bigtable e di conoscere il suo successore, Chiave. Quindi, hanno deciso di costruire qualcosa che può fare quello che Chiave possibile, e di più.

evolve-business-by-zach-meyers.jpg

Essere resilienti è dove CockroachDB prende il nome. Ma c’è di più in questo database è interessante oltre che per il nome.

ZDNet ha avuto un Q&A con Kimball, Scarafaggio Laboratori di CEO, per discutere di dove sono nella loro viaggio, e quello che accadrà dopo. Dal 2015m Scarafaggio Labs è cresciuta di quasi 100 dipendenti, spostato in un nuovo ufficio new york, e ha aperto tre nuovi uffici a Seattle, Boston e San Francisco, e ha sollevato un totale di $53.5 M su tre turni.

Kimball ha detto che hanno speso gran parte dei primi tre anni di progettazione e implementazione del prodotto di base, con circa l ‘ 80% dei dipendenti è focalizzata su attività di R&D. Più di recente, hanno costruito assistenza clienti, marketing, persone ops e i team di vendita, e sono ora più vicini al 50 per cento del personale dedicato alla R&D.

Questi tutti i suoni come segnali di crescita. Ma da dove viene CockroachDB stand rispetto alla concorrenza? Kimball pensa che fondamentalmente si riduce la capacità di un geo-distribuito SQL RDBMS, ma in un modo che fornisce la flessibilità per i clienti che non possono o non vogliono andare all-in e l’abbraccio di un proprietario che offre da un fornitore di soluzioni cloud.

Geo-distribuzione per la vittoria

Ma mentre la differenziazione dalle soluzioni offerte dal cloud e NoSQL fornitori è chiaro, CockroachDB non è l’unico cloud-nativo, multi/cloud ibrido, SQL gioco in città. Ciò che distingue, secondo Kimball, geo-distribuzione:

“Abbiamo speso un sacco di tempo di esecuzione CockroachDB da terra per fornire veramente geograficamente distribuito SQL. Più recenti i partecipanti al cloud-SQL nativo di mercato non sono geograficamente distribuito (TiDB, Citus) o SQL aspetto monolitico testa che è stato apposto un distribuite corpo (Yugabyte, FoundationDB, Aurora).

Geograficamente distribuito porta a due vantaggi fondamentali: la resilienza, che può tollerare datacenter e anche la regione a livello di fallimenti e i dati domiciling, che può mantenere i dati vicini al cliente per la latenza e la privacy. Dei grandi fornitori, solo la Chiave ed Aurora fornire la stessa resilienza del modello, anche se Aurora è limitato a una singola regione. Nessun altro database di fornitori di fornire i dati domiciling capacità di CockroachDB offre.”

webui-cluster-overview-cockroachdb.png

Geo-distribuzione è una caratteristica fondamentale per la CockroachDB

Anche: Habana, AI chip innovatore, promette prestazioni al top e l’efficienza

Kimball notato che quando hanno iniziato la società, non erano ancora sicuri di dove CockroachDB adatterebbe in ecosistema, o che tipo di società dovrebbero essere disposti e in grado di passare a un nuovo RDBMS. Ha poi aggiunto, tuttavia, che, nel 2018, hanno cominciato a rispondere a queste domande e si è conclusa con un impressionante primo anno di reddito:

“Si scopre che gran parte della Fortuna del 2000 è alle prese con spesso a livello di scheda mandati ad abbracciare i vantaggi del cloud pubblico. Che il processo di modernizzazione apre le porte a soluzioni alternative alla Oracle, in particolare database più adatto a sfruttare le opportunità insite nel cloud.

Dove CockroachDB ha un grande vantaggio strategico rispetto del calibro di AWS Aurora o Google Cloud Chiave è che noi offriamo un ponte tra la realtà esistente on-premise per l’esito desiderato utilizzando il cloud pubblico, sia sensato. CockroachDB può essere eseguito on-premise, ibrido, e tutto arbitrario fornitori di cloud.”

Business, incontrare open source. Open source, soddisfare il cloud.

Questo ci porta a un argomento interessante: la Competizione con i fornitori di soluzioni cloud, e l’commons clausola. Questo è qualcosa che molti open source fornitori di software di affrontare, come i fornitori di soluzioni cloud stanno prendendo i loro prodotti e li offre come servizi gestiti, direttamente in competizione con i fornitori di software. In risposta, i produttori di software stanno modificando le proprie licenze per evitare questo. Kimball ha riconosciuto questo come un problema enorme:

“Proprio quando tutti pensavano che una stalla modello di business evoluto open source per le imprese, AWS perfezionato la loro striscia operazione di data mining. Non abbiamo ancora affrontare lo stesso insieme di condizioni che non Confluenti, sia in termini di mercato, l’adozione e la concorrenza diretta da AWS con il nostro core prodotto open source. Inoltre, la gestione di Kafka dalla Apache Foundation presenta la complessità del Confluente del sistema di licenze.

Tuttavia, dobbiamo affrontare lo stesso problema alla radice. Siamo stati una delle prime aziende ad introdurre una fonte-disponibili licenza enterprise e data, sono stato ben attento a non applicarlo solo alle funzioni che sono utili soprattutto per le aziende che in realtà dovrebbe essere il pagamento di noi.”

istock-485587762.jpg

Open source è un fattore abilitante per il software aziendale, ma la concorrenza da parte di fornitori di cloud è la creazione di attrito e causando licenza modifiche

boygovideo, Getty Images/iStockphoto

Kimball ha anche osservato che il comportamento concorrenziale di AWS metterà pressione su di loro per aggiungere funzioni che tradizionalmente sarebbe pure open source “libero” categoria del nostro licenza enterprise, e per aggiungere un’esclusione per AWS-come comportamento.

Gli affari sembrano andare bene per Scarafaggio Labs, nonostante la concorrenza. Vorremmo anche aggiungere nomi come NuoDB a che lista, anche se NuoDB non è un prodotto open source. CockroachDB viene int tre sapori: Core, Enterprise, e Gestito. Caratteristiche come la Geo-Partizionamento, distribuito backup e ripristino e di sicurezza supplementari sono parte della versione Enterprise.

Anche: Confluenti mostra open source, cambiamenti di paradigma, cloud, il successo commerciale e tutti possono co-esistere

Nomi come Comcast e Baidu sono elencati come CockroachDB utenti. Avendo un precedente con uno dei BAT utilizzo di software open source di Apache Flink, e, infine, l’acquisizione di dati Artigiani, il fornitore che offre il supporto per esso, eravamo curiosi di sapere Scarafaggio Labs rapporto con Baidu. Kimball ha detto Baidu si rivolse a CockroachDB per sostituire il suo sharded MySQL con un database distribuito che è scalabile orizzontalmente, fornendo la familiare interfaccia SQL.

In fase di cloud nativo, Kubernetes, streaming analytics, HTAP, e il futuro di CockroachDB

Inevitabilmente, la discussione ha toccato anche l’impatto di Kubernetes su un database. Scarafaggio Labs è un membro di CNCF, e Kimball crede Kubernetes, più di ogni altro CNCF progetto, illumina un percorso per ottenere il risultato desiderato:

“Può essere eseguito on-premise, e nativamente su tutti i fornitori di cloud, dando le operazioni di un coerente piano di controllo in ambienti. Questo è il motivo per cui è uno dei più rapida crescita progetti open source di tutti i tempi.

Tuttavia, rispetto a Borg, il progetto all’interno di Google, che l’ha ispirata, Kubernetes è ancora nella sua infanzia. È lottato di recente per gestire stateful servizi. Ulteriori strumenti necessari per gestire più Kubernetes cluster di regioni o fornitori di cloud. Queste capacità sono fondamentali per favorire CockroachDB caratteristiche geo-replica e geo-partizionamento.”

kubernetes-part2-zoevandijk.jpg

CockroachDB ha un grande interesse su Kubernetes, e di essere il cloud nativo con automatico geo-scala

Mentre CockroachDB ha un grosso palo in Kubernetes, e a proposito di caratteristiche come il supporto per lo streaming e analytics? Sta HTAP qualcosa ci si può aspettare di vedere? Kimball ha detto che stanno affrontando i transazionale casi di utilizzo in primo luogo, ma ha intenzione di costruire su questo:

“Si tratta di un $45 miliardi di euro di mercato, in modo che una succosa di destinazione. Fornire un cloud-nativo, geo-sistema distribuito di record è una posizione di forza da cui si espande in una formidabile HTAP offerta. Questa è una differenza sostanziale con la strategia impiegata da Snappy Dati o Giunzione Macchina.

Tali prodotti hanno scelto di affrontare HTAP come una distinta categoria di prodotto, mentre noi crediamo fortemente che la categoria di prodotto che conta è in realtà il sistema OLTP di record, e l’aggiunta di meglio di analytics che in discesa è un viaggio.”

Kimball ha detto che sono nel processo di vettorizzazione l’esecuzione di SQL e l’aggiornamento del sistema di archiviazione sottostante per ottimizzare analitica dei carichi di lavoro. Nel frattempo, distribuito change data capture consente di effettuare le modifiche nel database transazionale in streaming in tempo reale di cloud storage o Kafka. Questo permette CockroachDB per essere accoppiato con il data warehousing o soluzioni di business intelligence. Integrazione nativa con Kafka è uno dei modi, ma c’è un JDBC lavello connettore per Kafka che CockroachDB è compatibile con out of the box.

Anche: Avviare la riqualificazione rivoluzione senza di me: il Futuro del Lavoro, le tendenze e morbido dati sulle soft skills

Kimball ha concluso citando caratteristiche come il full-text e geo-indici spaziali come probabile futuro integrazioni, e ha osservato che, di routine, considerare l’aggiunta di grafico di funzioni. In ogni caso, CockroachDB è parte di una crescente classe di database che si desidera avere tutto, e vale la pena di tenere d’occhio.

Storie correlate:

La nuova era del Multi-Modello di Database Oracle svela Autonoma Database NoSQL serviceMongoDB vuole ottenere il database di il modo in cui Il web come un database: Il più grande knowledge graph everBig Dati 2019: il Cloud ridefinisce il concetto di database Oracle prossimo capitolo: La regione Autonoma del Database e il DBA Un quarto di corporate dati nel cloud

Argomenti Correlati:

Big Data Analytics

L’innovazione

CXO

Intelligenza Artificiale

Enterprise Software

Archiviazione