
Det handlar om sex månader för tidigt, men Avgörande är att tala om Greenplum version 6. Det är en milstolpe release, som v6 är det som kommer att slutligen sätta Greenplum databas i full synkronisering med PostgreSQL, som har öppen källkod stammen. Och i sin tur, som har befriat utvecklingsteamet för att sprida sina vingar för att täcka marken utanför Greenplum traditionella MPP analytics fotavtryck. På Postgres-Konferens i New York den här veckan, det företag som gett en inblick i den färdplan för nästa version som för närvarande är planerad till September release.
En utmärkt fördel för att vara på den PostgreSQL stammen är det Avgörande inte uppfinna hjulet på nytt varje gång en version förändringar. För v6, det banat väg för Greenplum databas för att lägga till några affärsbeslut funktioner. Som ger stöd för analytisk arbetsbelastning som omfattar vissa transaktioner funktioner såsom block utbud index som kan förkorta data lookup gånger, eller “uppdatera” för att i realtid villkorlig uppdateringar och inlägg.
Detta är en del av en bredare trend för databaser för att lägga till överlappande funktioner. Medan Microsoft, med Kosmos DB är affischen barnet for multi-modell databas, på en mer blygsam nivå, transaktion plattformar som Oracle och SQL-Server har lång hanteras blandade arbetsbelastning, och även Amazon, som fokuserar på fit-for-purpose databaser, har lagt till lite ljus analytics kapacitet med parallell fråga till sin Aurora transaktions platform.
Den verkliga orsaken till Greenplum att lägga till några transaktioner till stöd är inte att vända det till en Oracle eller SQL-Server ersättning för back office-ekonomiskt program, men istället för sakernas internet. Databasen är fortfarande en analytisk kolumn store, men det stöder snabbare läser och skriver för att göra det lämpat för operativa analytics. För IoT, fördelarna är ihop med Apache Kafka stöd. Kafka stöd gör Greenplum att utnyttja sin massiv parallellism för att behandla inkommande IoT strömmar som har krav på realtid och skala.
En annan stor förbättring för v6 är Kubernetes stöd. Det ger möjlighet för att förenkla distribution i ett privat moln miljöer. Det hanterar inbetalningar (och deprovisionering), installation av paket, skalning och återhämtning – i huvudsak vrida skjuter upp av ett kluster i bekvämligheten av en self-service cloud.
Containerization börjar att komma till databasen, men de flesta begränsa det till att sätta hela databasen i en container. Greenplum behållare stöd är långt mer detaljerad: du kan containerize “segment” som är logiskt isolerade arbetsbelastning och grupper av resurser. Begreppet stödjande isolering inom Greenplum är inte ny, den hade motsvarande stöd för Linux kontroll grupper, så att du kan logiskt isolera flera arbetsbelastningar i ett kluster. För Kubernetes, Avgörande var att utveckla en operatör för att konfigurera stateful arbetsbelastning på grund av att varken Kubernetes eller Postgres öppen källkod ännu inte hade steget upp till plattan för att utveckla en (Kubernetes har varit mer i samband med statslösa arbetsbelastning fram till nu). Avgörande krav att verksamhetsutövaren det utvecklats kunna generaliseras för PostgreSQL.
Den kommande versionen av Greenplum lägger mer maskininlärning stöd, och banar väg för djupt lärande. Apache MADlib, öppen källkod machine learning library project som Central har lett, har lagt till nya stöd för Keras med TensorFlow som back-end, och lägger även till GPU-stöd. Det finns nya funktioner för versionshantering av modeller och jämföra resultatet av olika modeller. I kombination med containerization, det underlättar distribution tekniker såsom champion/challenger eller kanarieöarna.
Att få den PostgreSQL trunk kommer att påskynda onramping av nya funktioner för att Greenplum. Det är fortfarande ett pågående arbete; den nuvarande utvecklingen versionen har fått till PostgreSQL-8.4 (som lägger till kolumner tillstånd), men målet är att få Greenplum 6 upp till PostgreSQL 9 när det går GA. Det kommer att lägga till hot standby och streaming replication, bland andra godsaker. Men PostgreSQL är nu att få till v11, som AWS har precis släppt sin RDS-tjänster. Det innebär att godsaker som bords-nivå partitionering och hash partitionering som underlättar lastbalansering – kommer att få vänta, men förmodligen inte så länge.
Relaterade Ämnen:
Artificiell Intelligens
Digital Omvandling
Robotteknik
Sakernas Internet
Innovation
Affärssystem