
×
influxdata-logo.png
På Google NÆSTE i denne uge, at Google er ved at indføre sin egen strategi for modtagelse af open source-platforme. Snarere end at konkurrere med sine egne implementeringer, det er at gøre dem på første klasse borgerne om GCP med native integration til sin egen cloud-infrastruktur. InfluxData, skaberen af en af de mest populære open source tidsserier databaser, der har undertegnet den. Det sker som tidsserier databaser er begyndt at kravle ud fra bag skyggerne. Vi vil være gennemgang af det mere dybt i næste uge i vores syn på begivenheden.
Som for tidsserie data, det er ikke en ny use case. Men, med et par undtagelser, databaser, som er optimeret til denne form for data, der har været undtagelser til reglen. Den eksplosion af maskinen data fra sensorer og mobile enheder, og forbrugerelektronik har skabt et væld af nye use cases krævende tidsserie analyse.
Blandt de tidligste eksempler er KDB, en proprietær database udviklet af Kx der har været omkring i løbet af et par årtier, oprindeligt målrettet til tidsserie analyse af aktiemarkedet-feeds for Wall Street selskaber. Streaming motorer, såsom Amazon Kinesis Data Analytics, giver muligheder for at samle og bearbejde data i glidende gang windows.
For mange organisationer, og strategien var at prøve deres held med SQL og relationelle databaser, en fremgangsmåde, der var beslægtet med montering af en firkantet pind i et rundt hul. Mens SQL-sproget understøtter data typer så som DATETIME og INTERVAL, de fleste kommercielle databaser manglende funktioner, der optimere partitionering eller indekser for tiden dimensioner, og de var ikke designet til at understøtte sliding windows.
Og så nødvendigheden af at være mor til opfindelsen, de seneste år har set en eksplosion af projekter – mange af dem er open source – til opbygning af tidsserie data butikker. Blandt de mest populære er InfluxDB, en open source-bygget til formålet tidsserier database, der blev udgivet for første gang i naturen tilbage i 2013. InfluxData er firmaet bag det. Siden da, InfluxDB har trukket et stort fællesskab, med hundredvis af tusindvis af implementeringer, mere end 500 betalende kunder, med virksomheden at tiltrække over $120 millioner i venture funding. Selv Oracle, som normalt ville udsætte sine egne databaser, er en kunde. På en nylig InfluxDB kunde event i New York, en Oracle højttaler beskrevet, hvordan Oracle var opbygningen af en performance målinger service til sine public cloud hjælp InfluxDB.
Montering konkurrence
Så ingen god gerning går ustraffet, InfluxDB har trukket konkurrence. Den efterspørgsel, ikke kun for forvaltning og overvågning af IoT, udførelsen af cloud-baserede applikationer, og sporing af brugernes adfærd, har givet grobund for nye spillere at hoppe i spillet. Kx, hvis arv kom fra Wall Street, sigter på at filial ud fra kapitalmarkederne-feeds til at IoT og har netop indgået et partnerskab med H2O.ai til at integrere sin KDB database i H2O ‘ s Førerløse AI data videnskab platform. Tidsplanen, som blev grundlagt i 2015, har taget en anden vej, ved at tilpasse PostgreSQL til at appellere til den brede krop af SQL-udviklere. Det tilføjer en virtuel “hypertable” på toppen af PostgreSQL motor, der håndterer partitionering problem, automatisk indvinding af tidsserie data fordelt i “klumper”, som stadig blive vist som en enkelt logisk visning. Der er også Interana, analytics-motor, der er solgt i fællesskab med Microsoft for at udføre kunden adfærdsmæssige analytics med Azure Active Directory, Bing, og Office 365. Interana ikke positionere sig som en tidsserie database udbyder, men anvender en på bagsiden til at levere sine analyser af kundernes adfærd.
Og så er der AWS. Deres adgang til markeder, ikke kun udfordringer uafhængige, men validerer, at den teknologi, der er klar til prime time. Er det for nylig indført Timestream, som nu er i preview. Det tilbyder en modulær arkitektur, afkobling data indtager fra søgning og lagring for at støtte elasticitet og skalerbarhed. Timestream også tilbyder Api ‘er og sdk’ er med det formål at gøre den platform agnostiker til query language og output formatering. Amazon, der adskiller Timestream, ikke kun som en administreret formål-at bygge tidsserier cloud-database, men også for dens omfang og mulighed for at pay-per-bruger. For nu, Timestream preview understøtter en proprietær SQL-lignende query language, som vil være velkendte for udviklere, men i det lange løb kunne blive åbnet op for andre query sprog.
At tage en tur
Med alt dette en stigende konkurrence, InfluxDB er ved at udløse en anden version af sin platform skal revidere og forenkle den samlede API og indførelse af en ny funktionel forespørgsel sprog. Det er en velkendt historie, med nye teknologier, der, på v2.0 niveau, kode og grænseflader er sager som den udvikling holdet (eller open source-projekt) overvejer, hvad det kommer til at tage en skala. Det skete med Gnist, som ændret Api ‘ er til at samle streaming og batch, og der blev indført nye biblioteker for machine learning til 2.0-generationen.
Specifikt, InfluxDB 2.0 decouples query language fra databasen engine, og der indføres en ny forespørgsel sprog, Flux. Den version 2.0 forenkler installation af Tilstrømning DB ved at sætte hver af de stykker (hver af dem, separat open source-projekter), “TICK” stack, under samme fælles API. Disse stykker omfatte indsamling af data, GUI, streaming data processing engine, og den centrale database, med moduler såsom Telegraf, der har trukket over et par hundrede plugins til dato. 2,0 open source-version, skal du indtaste den generelle udgivelse engang i begyndelsen af i anden halvdel af året, med den kommercielle enterprise version til at følge kort efter. Men InfluxDB 2.0 managed cloud edition, en serverless tilbyder, vil være rettet mod nye konti ved hjælp af den nye Flux sprog, er rettet mod udgivelse i slutningen af andet kvartal.
Det er klart, at foretage sådanne grundlæggende arkitektoniske ændringer er en stor flodbåd gamble for InfluxData. Udfordringen er selvfølgelig at dividere fællesskabet, mens overgangen til den nye fælles API bør være en øvelse i forenkling, og en, der kunne blive rullet ind i eksisterende installationer, indførelse af en ny forespørgsel sprog risikerer at splitte fællesskabet. Det sker på det punkt, hvor selskabet er tegning højere profil konkurrenter som bevidstheden af tidsserier databaser udvider sig dramatisk. Det var en oplevelse at Spark fællesskab overlevede, som flytter til en ny generation af ikke-drev nedslidning, men overgangen forekom også som alternativer til Gnist behandling dukket op for at køre avancerede analytiske og AI modeller.
For InfluxDB, afkobling af query language fra databasen kan give et svar på at holde fællesskabet, bogstaveligt talt, hele.
Relaterede Emner:
Cloud
Digital Transformation
Robotteknologi
Tingenes Internet
Innovation
Virksomhedens Software