Cloud native-databaser. Serverlösa databaser. Men du vill kalla dem, det är en ny typ av databaser på uppgång. En som lovar automatisk skalbarhet på en global skala: Ingen mer slit över konfiguration, hantering, kopiering och liknande, bara snurra vissa fall i molnet och gå.
Också: Öppen källkod AI marker att göra Gröna Vågor: att Föra energieffektivitet till IoT-arkitektur
Men även om data är naturligt att söka sig till molnet, inte alla är villiga och har möjlighet att flytta alla data finns. Så databaser i dessa dagar är också i allt större utsträckning förväntas kunna hantera arbetsbelastning sömlöst både lokalt och över en mängd av moln.
Och sedan, det är också vad som nu känns som en gammal dilemma: att SQL, eller att NoSQL? Samtidigt som ställs på högkant traditionell design av relationsdatabaser har inneburit fördelar när det gäller skalbarhet, byta SQL är inte nödvändigtvis något som folk vill ha.
Så hur gör man för att kombinera SQL native cloud, multi-moln och hybridmoln?
Multi-cloud, hybrid cloud, träffa SQL
Föga förvånande finns det några moln native-databas erbjudanden runt från moln-leverantörer. Vissa av dem, som Azure CosmosDB, Googles Spanner, och AWS Aurora, också stöd för SQL. Klart, ingen av dem är multi-cloud.
Också: 2019 kommer att vara ett År av Grafen’: OpenCorporates är bevis Nr 1
Det finns också ett antal mysql databaser runt, de gillar DataStax Företag eller MongoDB, göra en pjäs för att kapitalisera på denna styrka, och lägga till serverlösa funktioner. Att vara öppen källkod är ett gemensamt drag bland sådana erbjudanden. De vanligtvis inte har SQL-stöd ändå.
Men finns det alternativ som är molnet inbyggt, stöd för multi-moln och hybridmoln, SQL, och öppen källkod? Ett par, och CockroachDB är bland dem.
Om du undrar vad är det med det namnet är en blinkning till motståndskraft, något som kackerlackor är ökända för. Kackerlacka Labs, hem för öppen källkod CockroachDB, grundades år 2015 genom att ex-Googel Spencer Kimball, Peter Mattis, och Ben Darnell. Medan på Google, de hade alla använt Bigtable och var bekanta med dess efterföljare, Käppar. Sedan satte de sig för att bygga något som kan göra vad som Nyckel kan, och mer.

Att vara resilient är där CockroachDB fick sitt namn från. Men det finns mer i denna databas som är intressant förutom namnet.
ZDNet hade en Q&a med Kimball, Kackerlacka Labs VD, diskutera när de är i sin resa, och vad som kommer härnäst. Eftersom 2015m Kackerlacka Labs har vuxit till nästan 100 anställda, flyttade till en ny NYC kontor, och öppnat tre nya kontor i Seattle, Boston och San Francisco, och tog upp en summa av $53.5 M över tre rundor.
Kimball sade att de tillbringade mycket av de tre första åren utformning och genomförande av kärnprodukten, med ungefär 80 procent av de anställda fokuserade på R&D. Mer nyligen, de har byggt ut kundsupport, marknadsföring, människor ops, och säljteam, och är nu närmare 50 procent av personalstyrkan som ägnas åt fou.
Alla dessa ljud som tecken på att växa upp. Men där tar CockroachDB står i förhållande till konkurrenterna? Kimball tycker att det i grunden handlar om att funktionerna i en geografiskt distribuerad SQL RDBMS, men erbjuds på ett sätt som ger flexibilitet till kunder som antingen inte kan eller inte vill gå all-in och omfamna en egen erbjudande från ett moln säljaren.
Geo-distribution för att vinna
Men samtidigt som differentiering, från lösningar som erbjuds av molnet och NoSQL leverantörer är klart, CockroachDB är inte den enda moln-native, multi/hybrid cloud SQL spelet i stan. Vad som skiljer, enligt Kimball, är geo-distribution:
“Vi har tillbringat en hel del tid att genomföra CockroachDB från grunden för att ge verkligt geo-distribuerade SQL. Nyare aktörer till molnet-native SQL-marknaden är antingen inte geo-fördelade (TiDB, Citus), eller SQL-aspekten är en monolitisk huvud som anbringats för att en distribuerad kroppen (Yugabyte, FoundationDB, Aurora).
Geo-distribuerade ger två grundläggande fördelar: motståndskraft, vilket kan tolerera datacenter och även region-nivå misslyckanden, och data domiciling, som kan hålla data nära kunden för latens och integritet. Av den stora leverantörer, bara Grus och Aurora ge samma motståndskraft modell, men Aurora är begränsad till en enda region. Inga andra leverantörer databas ännu tillhandahålla de uppgifter som domiciling kapacitet som CockroachDB erbjuder.”
Geo-distribution är en viktig funktion för CockroachDB
Också: Habana, AI chip innovatör, lovar toppen prestanda och effektivitet
Kimball berättade att när de startade företaget, de var ännu inte säker på var CockroachDB skulle passa in i ekosystemet, eller vilka typer av företag skulle vara villiga och har möjlighet att flytta till en ny RDBMS. Han fortsatte med att lägga, dock att i och med 2018, började de att besvara dessa frågor och slutade med en imponerande första året av inkomster:
“Det visar sig att mycket av Fortune 2000 kämpar, ofta med styrelse-nivå mandat att omfamna det som är fördelarna med det publika molnet. Att modernisering öppnar dörren till övervägande av alternativ till Oracle, särskilt databaser som är bättre lämpade att utnyttja de möjligheter som finns inneboende i molnet.
Där CockroachDB har en stor strategisk fördel över lik för AWS Aurora eller Google Cloud Nyckel är att vi erbjuder en bro från den verklighet som finns på plats byggs ut önskat resultat av att använda de offentliga moln där det är vettigt. CockroachDB kan köras på plats, hybrid, och över godtyckliga moln-leverantörer.”
Företag, träffa öppen källkod. Öppen källkod, träffa cloud.
Detta leder oss till en intressant fråga: Konkurrensen med moln-leverantörer, och commons klausul. Detta är något som många leverantörer öppen källkod är programvara är inför, eftersom molnleverantörer med sina produkter och erbjuda dem som hanterade tjänster, direkt konkurrera med sa programvaruleverantörer. I svar, leverantörer programvara ändrar sina licenser för att förhindra detta. Kimball erkänt detta som ett stort problem:
“Just när alla trodde att en stabil affärsmodell hade utvecklats för öppen källkod företag, AWS fulländat sitt band gruvdrift. Vi ännu inte har samma förutsättningar som Sammanflytande gör, både i termer av marknaden adoption och direkt konkurrens från AWS med våra grundläggande open source-produkt. Dessutom, förvaltning av Kafka av Apache Foundation introducerar några av komplexiteten i Sammanflytande: s licenssystem.
Men vi måste ta itu med samma grundläggande problemet. Vi var ett av de första företagen att införa en källa-som finns enterprise-licens och har hittills varit försiktig med att tillämpa det bara att funktioner som är användbara i huvudsak till företag som verkligen bör betalar oss.”
Öppen källkod är en möjliggörare för affärssystem, men konkurrensen från moln-leverantörer är att skapa friktion och orsakar licens ändringar
boygovideo, Getty Images/iStockphoto
Han noterade också att den konkurrensutsatta beteende AWS kommer att sätta press på dem att lägga till funktioner som traditionellt skulle vara en ren open source för att “gratis” – kategorin av vår enterprise-licens, och att lägga till ett undantag för AWS-liknande beteende.
Verksamheten verkar gå bra för Kackerlacka Labs, trots konkurrensen. Vi vill också lägga till namn som NuoDB till den listan, även om NuoDB är inte en öppen källkod erbjuder. CockroachDB kommer int tre smaker: Core, Enterprise, och Lyckades. Funktioner som Geo-Partitionering, som distribueras säkerhetskopiering och återställning och extra säkerhet är en del av Enterprise-versionen.
Också: Sammanflytande visar öppen källkod, paradigmskiften, moln, och kommersiell framgång kan samexistera
Namn som Comcast och Baidu är listad som CockroachDB användare. Att ha ett prejudikat med en BAT med hjälp av öppen källkod Apache Flink, och så småningom förvärva data Hantverkare, försäljare och erbjuder stöd för det, vi var nyfikna på Kackerlacka Labs relation med Baidu. Kimball sade Baidu vände sig till CockroachDB att ersätta sin sharded MySQL med en distribuerad databas som vågar horisontellt samtidigt som den ger det välkända SQL-gränssnittet.
På cloud infödda, Kubernetes, streaming, analytics, HTAP, och framtiden för CockroachDB
Oundvikligen, diskussionen har berört effekterna av Kubernetes på databaser. Kackerlacka Labs är en medlem av CNCF, och Kimball anser Kubernetes, mer än någon annan CNCF projektet, lyser upp en väg till det önskade resultatet:
“Det kan köras på plats och direkt på alla moln leverantörer, vilket ger verksamheten en konsekvent kontroll plan över miljöer. Det är därför det är en av de snabbast växande öppen källkod-projekt.
Men jämfört med Borg, projekt inom Google som inspirerade den, Kubernetes är fortfarande i sin linda. Det är nyligen kämpat för att hantera stateful tjänster. Ytterligare verktyg som kommer att vara nödvändiga för att orkestrera flera Kubernetes kluster i olika regioner eller moln leverantörer. Dessa funktioner är kritiska för att möjliggöra CockroachDB funktioner som geo-replikering och geo-partitionering.”
CockroachDB har en stor insats på Kubernetes, och på att vara moln infödda med automatisk automatisk geo-skalning
Medan CockroachDB har en stor andel i Kubernetes, vad sägs om funktioner som stöd för streaming och analytics? Kommer HTAP något som vi kan förvänta oss att se? Kimball sade att de behandlar affärsbeslut använd fall först och främst, men har för avsikt att bygga vidare på detta:
“Det är en $45 miljarder på marknaden, så en saftig mål. Ger ett moln-native, geo-distribuerade system för dokumentation är en position av styrka utifrån vilken vi kommer att expandera till en formidabel HTAP erbjuder. Detta är en viktig skillnad från den strategi som används av Snappy Data eller Skarva Maskinen.
Dessa produkter har valt att ta itu HTAP som en egen produktkategori, medan vi tror starkt på att den produktkategori som är viktigt är faktiskt OLTP-system av register, och lägga till bättre analytics för att det är en nedförsbacke resa.”
Kimball sade att de är i färd med att vectorizing SQL och uppgradering av underliggande lager system för att optimera för analytisk arbetsbelastning. Under tiden, distribueras ändra data capture gör ändringar i databasen för att vara transactionally strömmas i realtid till moln lagring eller Kafka. Detta gör att CockroachDB att vara ihop med data warehousing eller BI-lösningar. Native integration med Kafka är ett sätt, men det är en JDBC-sink-kontakt för Kafka som CockroachDB är kompatibel med out of the box.
Även: Starta omskolning revolution utan mig: Framtida Arbete trender och mjuka data på mjuka färdigheter
Han avslutade med att nämna funktioner såsom en full-text och geografiska index som sannolikt att framtida tillägg, och noterade att de rutinmässigt överväga att lägga till diagram kapacitet. I alla fall, CockroachDB är en del av en växande klass av databaser som vill ha allt, och är värt att hålla ett öga på.
Relaterade artiklar:
Den nya eran av Multi-Modell av Databasen Oracle lanserar Autonoma NoSQL-Databas serviceMongoDB vill få databas ur vägen webben som en databas: Den största knowledge graph everBig Data 2019: Cloud omdefinierar databasen Oracle nästa kapitel: Den Autonoma Databas och DBA En fjärdedel av företagens uppgifter nu i molnet
Relaterade Ämnen:
Big Data Analytics
Innovation
CXO
Artificiell Intelligens
Affärssystem
Förvaring