DANSK

Greenplum 6 ventures uden for det analytiske box

171

Det er omkring seks måneder for tidligt, men Afgørende er tale om Greenplum version 6. Det er en milepæl udgivelse, som v6 er en, der vil endelig sætte Greenplum database i fuld synkronisering med open source PostgreSQL kuffert. Og igen, der har befriet udvikling team til at sprede sine vinger til at dække jorden uden Greenplum traditionelle MPP-analytics-fodaftryk. På Postgres-Konference i New York i denne uge, virksomheden tilbyder et kig ind i køreplanen for den næste version, der i øjeblikket planlagt til September udgivelse.

En oplagt fordel for at være på den PostgreSQL trunk er det Afgørende, behøver ikke at opfinde den dybe tallerken hver gang en version ændringer. For v6, at det banede vej for Greenplum database for at tilføje nogle transaktionsbeslutning funktioner. Der giver støtte til analytiske arbejdsmængder, som omfatter nogle transaktion funktioner, såsom at blokere række indekser, der kan forkorte data opslag gange, eller “upsert” for real-time betinget opdateringer og skær.

Dette er en del af en bredere tendens til databaser for at tilføje overlappende funktioner. Mens Microsoft, med Kosmos DB er poster child for multi-model-database, på et mere beskedent niveau, transaktion platforme som Oracle og SQL Server har længe håndteres blandede workloads, og endda Amazon, som fokuserer på ” fit for purpose databaser, har tilføjet nogle lys analytics-funktioner med parallel query til sin Aurora handelstransaktion platform.

Den virkelige årsag til Greenplum at tilføje nogle transaktion støtte er ikke at gøre det til en Oracle eller SQL Server erstatning for back office finansielle applikationer, men i stedet for Ti. Databasen er stadig et analytisk kolonne butik, men det understøtter en hurtigere læser og skriver for at gøre det egnet til operationelle analytics. For IoT, de fordele, der er blandet med Apache Kafka støtte. Kafka-understøttelse gør det muligt Greenplum at udnytte sin massive parallelitet til at behandle indgående IoT vandløb, der har behov for real-time behandling og skala.

En anden stor forbedring for v6 er Kubernetes støtte. Det giver mulighed for at forenkle implementering i en privat cloud-miljøer. Det håndterer provisioning (og deprovisioning), installation af pakker, skalering og recovery – hovedsagelig dreje fyring op af en klynge i den bekvemmelighed af en self-service cloud.

Containerization er begyndt at komme til databasen, men de fleste begrænser det til, at sætte hele databasen i en container. Greenplum beholder støtte er langt mere detaljeret: du kan containerize “segmenter”, der er logisk isoleret arbejdsmængder og grupper af ressourcer. Begrebet støtte isolation i Greenplum er ikke nyt, for det havde tilsvarende støtte til Linux kontrol grupper, så du kan logisk isolere flere arbejdsopgaver på tværs af en klynge. For Kubernetes, Afgørende var at udvikle en operatør til konfiguration af stateful arbejdspres, fordi hverken Kubernetes eller Postgres open source-fællesskaber var endnu ikke til at optrappe til pladen til at udvikle en (Kubernetes er blevet mere forbundet med statsløse arbejdsmængder indtil nu). Afgørende krav, at den erhvervsdrivende, at det udviklede kunne generaliseres til PostgreSQL.

Den kommende version af Greenplum tilføjer flere machine learning support, og baner vejen for dyb læring. Apache MADlib, open source machine learning bibliotek projekt, der Afgørende har ført, har tilføjet nye støtte til Keras med TensorFlow som back-end, og tilføjer også GPU support. Der er nye muligheder for versionshåndtering af modeller og sammenligne effektiviteten af forskellige modeller. Kombineret med containerization, det letter implementering teknikker såsom champion/challenger eller kanariske øer.

Kom på PostgreSQL trunk vil fremskynde onramping af nye funktioner til Greenplum. Det er stadig et arbejde i gang; den nuværende version har fået til PostgreSQL 8.4 (som tilføjer søjleformet tilladelser), men målet er at få Greenplum 6 op til PostgreSQL 9, når det går GA. Der vil tilføje varme standby og streaming replikation, blandt andre lækkerier. Men PostgreSQL er nu at komme til v11, som AWS har netop udgivet sin RDS-service. Det betyder, at godbidder som tabel-niveau separation og hash-partitionering, som lethed load balancing – bliver nødt til at vente, men nok ikke så længe.

Relaterede Emner:

Kunstig Intelligens

Digital Transformation

Robotteknologi

Tingenes Internet

Innovation

Virksomhedens Software