For CockroachDB, transaktioner først, så kan analytics er en funktion-ikke en fejl

0
145

Cloud native databaser. Serverless databaser. Men du ønsker at kalde dem, der er en ny race af databaser på fremmarch. En, der lover automatisk skalerbarhed på en global skala: Ikke mere slidt end konfiguration, administration, replikation og lignende, bare spin nogle tilfælde i skyen og gå.

Også: Open source AI chips at gøre Grønne Bølger: at Bringe energi effektivitet til at IoT arkitektur

Men selv om data er naturligvis tiltrækkes til sky, og ikke alle er villige og i stand til at flytte alle data der. Så databaser i disse dage er de også i stigende grad forventes at være i stand til at håndtere arbejdspres problemfrit på både forudsætning for og på tværs af et væld af skyer.

Og så er der også, hvad der nu synes som en gammel dilemma: at SQL, eller at NoSQL? Mens upending det traditionelle design af relationelle databaser har bragt fordele i form af skalerbarhed, udskiftning af SQL er ikke nødvendigvis noget folk ønsker.

Så hvordan kan man kombinere SQL, cloud indfødte, multi-cloud, og hybrid cloud?

Multi-cloud, hybrid cloud, mødes SQL

Ikke overraskende, er der et par cloud native database tilbud rundt fra cloud-leverandører. Nogle af dem, som Azure CosmosDB, Google Skruenøgle, og AWS Aurora, også understøttelse af SQL. Det er klart, at ingen af dem er multi-cloud.

Også: 2019 vil der være en anden ‘År af Grafen’: OpenCorporates er dokumentation for, No. 1

Der er også et par multi-cloud databaser rundt, de kan lide af DataStax Virksomhed eller MongoDB, der gør en spiller til at udnytte denne styrke, og tilføje serverless funktioner. At open source er et fælles træk blandt sådanne tilbud. De typisk ikke har SQL støtte selv.

Men er der muligheder, der er sky indfødte, der understøtter multi-cloud og hybrid cloud, SQL, og open source? Et par, og CockroachDB er blandt dem.

Hvis du spekulerer over, hvad der er med det navn, det er en hilsen til modstandsdygtighed, og det er noget, som kakerlakker er berygtet for. Kakerlak Labs, der er hjemsted for open source CockroachDB, blev grundlagt i 2015 med ex-Googlere Spencer Kimball og Peter Mattis, og Ben Darnell. Mens på Google, at de havde alle brugt Bigtable og blev bekendt med sin efterfølger, Skruenøgle. Så de satte sig for at bygge noget, der kan gøre, hvad Skruenøgle kan, og mere.

evolve-business-by-zach-meyers.jpg

Der er modstandsdygtige hvor CockroachDB har fået sit navn fra. Men der er mere i denne database, der er interessant, udover navnet.

ZDNet havde en Q&A med Kimball, Kakerlak Labs DIREKTØR, til at diskutere, hvor de er i deres rejse, og hvad der kommer næste. Da 2015m Kakerlak Labs er vokset til næsten 100 medarbejdere, flyttet til en ny NYC kontor, og åbnede tre nye kontorer i Seattle, Boston og San Francisco, og der er rejst i alt $53.5 M over tre runder.

Kimball sagde, at de brugte meget af de første tre år architecting og gennemførelsen af de centrale produkt, med omkring 80 procent af de ansatte med fokus på R&D. for nylig, de har bygget ud, kundeservice, marketing, folk ops, og salgsteams, og er nu tættere på at 50 procent af de beskæftigede, der afsættes til R&D.

Alle disse lyde som tegn på at vokse op. Men hvor er CockroachDB stå i forhold til konkurrenterne? Kimball mener, at det grundlæggende kommer ned til de funktioner, en geo-fordelt RDBMS SQL, men som udbydes på en måde, der giver fleksibilitet til kunder, der enten ikke kan eller ikke ønsker at gå all-in og tage hul på en proprietær tilbud fra en cloud-leverandør.

Geo-distribution for at vinde

Men mens differentiering fra løsninger, der tilbydes af cloud og NoSQL leverandører er klart, CockroachDB er ikke kun cloud-indfødte, multi/hybrid cloud, SQL spil i byen. Hvad indstiller det fra hinanden, ifølge Kimball, er geo-distribution:

“Vi har brugt en masse tid på at gennemføre CockroachDB fra jorden op til at give virkelig geo-fordelt SQL. Nyere deltagere til cloud-native SQL-markedet, er enten ikke geo-fordelt (TiDB, Citus), eller SQL aspekt er en monolitisk hoved, der er blevet anbragt på en distribueret krop (Yugabyte, FoundationDB, Aurora).

Geo-udloddede udbytter to grundlæggende fordele: robusthed, som kan tåle at datacenter og regioner-niveau fejl, og data domiciling, som kan holde data tæt til kunden forsinkelse og privatliv. De store leverandører, kun Skruenøgle og Aurora give den samme modstandskraft model, selv om Aurora ‘ s er begrænset til en enkelt region. Ingen andre database-leverandører, men giver data domiciling kapaciteter, som CockroachDB tilbud.”

webui-cluster-overview-cockroachdb.png

Geo-distribution er en vigtig funktion for CockroachDB

Også: Habana, AI chip innovator, løfter top ydeevne og effektivitet

Kimball bemærkes, at da de startede virksomheden, var de endnu ikke sikker på, hvor CockroachDB ville passe ind i økosystemet, eller hvilke typer af virksomheder vil være villige og i stand til at flytte til en ny RDBMS. Han fortsatte med at tilføje, dog, at der i 2018 begyndte de at besvare disse spørgsmål, og sluttede af med en imponerende første år af indtægter:

“Det viser sig, at en stor del af den Formue, 2000 kæmper ofte med bord-niveau mandater til at tage fordelene af den offentlige sky. Der moderniseringsproces, åbner døren til behandling af alternativer til Oracle, især databaser, der er bedre egnet til at udnytte de muligheder, der ligger i skyen.

Hvor CockroachDB har en stor strategisk fordel i forhold til folk af AWS Aurora eller Google Cloud Skruenøgle, er, at vi tilbyder en bro fra virkeligheden af eksisterende on-premise installationer til det ønskede resultat af at bruge den offentlige cloud, hvor det giver mening. CockroachDB kan køre on-premise, hybrid, og på tværs af vilkårlig cloud-leverandører.”

Virksomhed, mødes open source. Open source, mødes skyen.

Dette bringer os til et interessant emne: Konkurrence med cloud-leverandører, og det commons klausul. Dette er noget mange open source software leverandører står over for, som cloud-leverandører, der tager deres produkter og tilbyde dem som administrerede tjenester, der konkurrerer direkte med sagde software leverandører. I svar, software leverandører med at ændre deres licenser til at forhindre dette. Kimball har anerkendt det som et stort problem:

“Lige når alle troede, en stabil forretningsmodel havde udviklet sig til open source virksomheder, AWS perfektioneret deres strip mining drift. Vi har endnu ikke står over for samme sæt af betingelser, som Sammenflydende gør, både i form af markedet vedtagelse og direkte konkurrence fra AWS med vores centrale open source-produkt. Desuden, hvorledes Kafka af Apache Foundation introducerer nogle af kompleksiteten i Sammenflydende ‘ s licensordning.

Ikke desto mindre, vi skal løse de samme grundlæggende problem. Vi var en af de første virksomheder til at indføre en kilde-til rådighed for enterprise-licens, og til dato, har været omhyggelig med at anvende det kun til funktioner, som er nyttige, især for de virksomheder, der virkelig bør være at os.”

istock-485587762.jpg

Open source er en katalysator for virksomhedens software, men konkurrencen fra cloud-leverandører er at skabe friktion og forårsager ændringer licens

boygovideo, Getty Images/iStockphoto

Kimball også bemærkes, at den konkurrencemæssige adfærd i AWS vil lægge pres på dem for at tilføje funktioner, der traditionelt ville blive ren open source til den “gratis” kategori af vores enterprise-licens, og for at tilføje en undtagelse for AWS-lignende adfærd.

Forretningen ser ud til at gå godt for Kakerlak Labs, på trods af konkurrencen. Vi vil også tilføje navne som NuoDB til at liste, selv om NuoDB er ikke et open source tilbyder. CockroachDB kommer int tre varianter: Core, Enterprise, og det Lykkedes. Funktioner som Geo-Partitionering, fordelt backup og gendan, og ekstra sikkerhed er en del af Enterprise version.

Også: Sammenflydende viser, open source, paradigmeskift, cloud, og kommercielle succes, alle kan co-eksistere

Navne såsom Comcast og Baidu er opført som CockroachDB brugere. At have en præcedens med en af de BAT anvender open source Apache Flink, og i sidste ende erhverve data Håndværkere, leverandør, der tilbyder støtte til det, vi var lidt spændt på Kakerlak Labs’ forhold med Baidu. Kimball sagde, Baidu henvendte sig til CockroachDB til at udskifte sin sharded MySQL med en distribueret database, der kan skaleres horisontalt, mens du leverer den velkendte SQL-grænseflade.

Om at være sky indfødte, Kubernetes, streaming, analytics, HTAP, og fremtiden for CockroachDB

Uundgåeligt, at den diskussion er inde på virkningen af Kubernetes på databaser samt. Kakerlak Labs er medlem af CNCF, og Kimball mener Kubernetes, mere end nogen anden CNCF projekt, oplyser en sti til det ønskede resultat:

“Det kan være kører on-premise, og lokalt på alle cloud-leverandører, og giver operationer en konsekvent kontrol fly på tværs af miljøer. Dette er grunden til, at det er en af de hurtigst voksende open source-projekter af alle tid.

Men i forhold til Borg, projektet inden for Google, der har inspireret det, Kubernetes er stadig i sin vorden. Det er kæmpet for nylig til at håndtere stateful tjenester. Yderligere værktøjer, som vil være nødvendige for at orkestrere flere Kubernetes klynger på tværs af regioner og cloud udbydere. Disse kapaciteter er afgørende for at give CockroachDB ‘ s funktioner som geo-replikation og geo-partitionering.”

kubernetes-part2-zoevandijk.jpg

CockroachDB har en stor aktiepost på Kubernetes, og om at blive cloud indfødte med automatisk automatisk geo-skalering

Mens CockroachDB har en stor aktiepost i Kubernetes, hvad med funktioner, såsom støtte til streaming og analytics? Vil HTAP noget, vi kan forvente at se? Kimball sagde, at de er bekæmpelse af forretnings use cases først og fremmest, men har til hensigt at bygge på, at:

“Det er en $45 milliarder markedet, så en saftig mål. Leverer en cloud-indfødte, geo-distribueret system for registrering er en styrkeposition, som vi vil udvide til en formidabel HTAP tilbyder. Dette er en afgørende forskel fra den strategi, der er ansat af Bidsk Data eller Splejse Maskine.

Disse produkter har valgt at løse HTAP som et særskilt produkt-kategori, der henviser til, at vi tror på, at det produkt, kategori, der betyder noget, er faktisk OLTP system for registrering, og tilføjer bedre analytics til at der er en rejse ned ad bakke.”

Kimball sagde, at de er i færd med at vectorizing SQL-udførelse og opgradering af den underliggende storage system til at optimere for analytisk arbejdsmængder. I mellemtiden, fordelt ændre data capture giver mulighed for ændringer i databasen for at være transactionally streamet i real-time cloud storage eller Kafka. Dette giver CockroachDB til at blive parret med data warehousing eller BI-løsninger. Native integration med Kafka er én måde, men der er en JDBC-vask-stik til Kafka, der CockroachDB er kompatibel med ud af boksen.

Også: Start omskoling revolution uden mig: Fremtidige Arbejde tendenser og bløde data på de bløde kvalifikationer

Kimball, der er indgået med at nævne funktioner, såsom fuld-tekst og geo-fysisk indeks som sandsynlige fremtidige tilføjelser, og bemærkede, at de rutinemæssigt overveje at tilføje grafen evner så godt. I alle tilfælde, CockroachDB er en del af en voksende klasse af databaser, der ønsker at have det hele, og er værd at holde øje med.

Relaterede historier:

Den nye æra af Multi-Model-Database Oracle lancerer Autonome NoSQL Database serviceMongoDB ønsker at få databasen ud af din måde internettet som en database: Den største viden graf everBig Data 2019: Cloud omdefinerer database Oracle ‘ s næste kapitel: De Autonome Database og DBA En fjerdedel af virksomhedens data nu i skyen

Relaterede Emner:

Big Data Analytics

Innovation

CXO

Kunstig Intelligens

Virksomhedens Software

Opbevaring