SVENSKA

Elasticsearch 6.0: inte som ny, men ganska förbättrad

191

Noll

Shay Banon har kallats en person som har skrivit mer kod än vad som är mänskligt möjligt. Detta har lett honom från att arbeta på en lösning för sökning på sin fritid för att bygga ett open source ramverk och ett globalt företag runt det med kunder som till exempel eBay och Verizon.

Elasticsearch har kommit en lång väg och Elastisk handlar om mycket mer än att söka. Idag Elastisk meddelar version 6.0 av vad är nu en hel stack uppbyggd runt den centrala förutsättningen för sök, och Banon som nyligen utsetts till VD diskuterade med ZDNet det förflutna, nutid och framtid Elasticsearch och de trender som formar branschen.

Elasticsearch som ett system av register

Vår konversation inte börja med de nya funktionerna i version 6.0. Om du är en del av den Elastiska gemenskapen, du kanske redan känner till dem. Om inte, kan du inte få mycket imponerade vid första ögonkastet. Detta är intressant i och av sig själv, men vi trodde att det skulle vara en bra idé att sprida lite ljus över vad Elasticsearch kan och inte kan göra innan man påbörjar en detaljerad diskussion om nya funktioner.

När Banon började arbeta på Elasticsearch, det var allt om lagring av JSON och ha ett kraftfullt sök språk. Det var 8 år sedan, och som han konstaterar “NoSQL var i ropet. För mig Elasticsearch var något jag brinner för, så jag inte vill vara en del av någon hype cycle. Det skulle vara att flytta fokus från det värde som Elasticsearch kan ta som en mycket kraftfull lösning för sökning.

Folk har bett — kan jag byta ut min MongoDB, eller min Oracle-databas med Elasticsearch? Kan det fungera som ett system av rekord? Mitt svar har alltid varit att om du placerar Elasticsearch bredvid någon av dessa system, var det Cassandra eller Hadoop eller vad som helst, det kommer att tillföra värde. Det har denna vinkel på hur man kan lösa utmaningar i en sökning prisma som inget annat system har. Men vårt mål är inte att ersätta dessa system.”

Detta “system av record” – diskussionen har varit en pågående om Elasticsearch. I tidigare versioner har det varit arbete i samband med Jepsen projekt som avslöjade förhållandena under vilken förlust av data i Elasticsearch kan uppstå. Även idag, Kyle Kingsbury, Jepsen är hjärnan, säger “jag skulle inte använda det här som ett system av register, så skulle du sätta din data i S3 eller Postgres och har en replikering verktyget så att det upprepar data.”

Banon verkar hålla med om att i hans väg. Han erkänner Kingsbury ‘ s bidrag i att peka ut brister i Elasticsearch sharding och säger att de har arbetat med honom i att försöka lösa dem, och detta arbete har gjort massor av framsteg och är öppet dokumenterade. Och om någon vill använda Elasticsearch som ett centralt system för att lagra finansiella transaktioner, Banon skulle inte råda dem att göra detta.

I slutet, Banon medger Elasticsearch har inte funnits så länge som Orakel av världen, och detta innebär att det per definition mindre mogna. Naturligtvis, som han konstaterar, om dina data på Elasticsearch försvinner eller skadas, gör detta till en dålig användarupplevelse, så de arbetar på motståndskraft.

För Banon dock motståndskraft är inte allt om distribuerade algoritmer och sharding, men också om saker som stabilitet och minne fotavtryck: “om du slutar skriva till ett system som gör att dina runtime-för att pausa, det är omöjlig att skilja från ett nätverk partition. Vi har investerat kraftigt i detta område och det finns många förbättringar i 6.0.”

Elasticsearch 6.0

En sådan förbättring Banon höjdpunkter är baserat på något som kallas sekvens-Id. Det är förmågan att ha konsensus på den sekvens av operationer mellan en primär och en replik shard. Banon säger detta förbättrar avsevärt möjligheten att upprätthålla överensstämmelse mellan uppgifter, och hjälper till att rikta en lucka Elasticsearch har haft historiskt.

Ett annat område som Banon höjdpunkter är vad han kallar brytare. Detta handlar om att förbättra upptäckt av begär att sluta konsumera massor av resurser så att de kan vara isolerade utan att få ner ett kluster. Han säger en hel del arbete har lagts på att kunna spåra och stoppa frågor när det behövs, samt att arbeta med Java-off-heap minne tekniker och strukturer. Som ett resultat, minne fotavtryck i dag är mycket mindre än det brukade vara.

Många andra förbättringar finns i denna kategori samt – saker som kräver expertkunskap inte bara att genomföra, men också att förstå och utvärdera effekterna av den. Funktioner som index sortering, som till slut trading tid i att indexera dokument, kan avsevärt öka fråga prestanda. En annan funktion, glesa doc-värden, förändringar av det sätt glest befolkade områden är lagrade, vilket resulterar i mellan 30 procent och 70 procent av besparingar i lagringsutrymme..

I slutändan, om du inte tillbringar tid att gräva i dessa nya funktioner, det finns en god chans att du kan förbli imponerad av Elasticsearch 6.0. Även om Banon säger att de ser den nya versionen som något som har allt gemensamt med och förklarade att gemenskapen via en serie av blogginlägg, han erkänner det faktum att alla inte nödvändigtvis kommer att ha tid och energi för att.

För posten, andra nya funktioner i Elasticsearch 6.0 är utspridda över Elastisk stack, som består av Kibana, Beats och Logstash. Dessa är Elasticsearch lösningar för visualisering och instrumentpaneler, data förtäring och log lagring respektive. Den Elastiska stack kompletteras med X-Pack, en premium uppsättning av funktioner som inkluderar saker som att grafen visualisering och upptäcka avvikelser via maskininlärning.

Att lyssna till användarna laddar för framtiden

Elasticsearch började som en blygsam lösning centrerad kring att göra Lucene, open source ramverk för indexering och sökning som används mycket till denna dag, som kan användas för effektiv sökning på JSON. Diskutera med Banon den utveckling som har lett fram till där Elasticsearch är idag, blir det tydligt att vad han ser som nyckeln till Elasticsearch framgång är också anledningen till att du kanske fortfarande imponerad med nya funktioner.

För Banon är det alltid handlat om att få kontakt med och lyssna till gemenskapen. “En av de saker jag har lärt mig om att bygga ett framgångsrikt open source-företag är att du behöver vara en god lyssnare, säger han. “Efter att ha släppt core Elasticsearch, det var klart att man ville ha visualisering och instrumentpaneler på toppen av det. Så vi tog Kibana i-huset och gjorde det till en del av stacken.

När jag började arbeta på Elasticsearch, jag har aldrig trott att en dag att lagra loggar skulle vara en del av det. Men människor började göra det, och i dag är vi nummer ett open source-lösning och i själva verket ett system för dokumentation för detta. Människor är nöjda med att vår lösning fungerar mycket bättre än Splunk till exempel.”

lessons-learned-in-deploying-the-elk-stack-elasticsearch-logstash-and-kibana-13-638.jpg

Detta har varit ganska mycket historien om hur Elasticsearch har ökat, och kommer tydligen att fortsätta att vara. Banon tror inte på att gå bort och kommer tillbaka med helt nya saker som kan vara ber människor att satsa på dem, utan snarare i att ta progressiva steg. Elasticsearch har anammat saker såsom molnet, eller machine learning, men är inte att gå all-in på dem heller.

När man diskuterar att flytta till molnet, Banon säger Elasticsearch var utformad för att fungera med AWS från början, och detta har bidragit en hel del till dess framgång. Idag Elasticsearch driver också på Azure-och Google cloud, som det också är ett partnerskap, samt med Alibaba moln. Det är inte många företag som tillhandahåller mjukvara som är stor i Kina, och Banon ser detta som en validering av strategin.

Fortfarande, han betonar att det för dem handlar om att ge användare: “när vi tagit steget att erbjuda en hanterad version i molnet 3,5 år sedan, det var inte för att tvinga våra användare, utan snarare att vara där för dem. De kan köra Elasticsearch på vad molnet de vill, eller använd våra hanterade versionen, eller köra på förutsättningen. Vi vill inte lämna någon bakom, och med Elastic Cloud Enterprise vi kör samma kod våra användare kör”.

För att flytta till IPaaS plattformar och maskininlärning (ML), Banon säger IPaaS är mycket stämmer överens med vad de gör. Progression mot analytics sker också i Elasticsearch, med det senaste förvärvet av Prelert ML-tekniken har integrerats i stacken. Inledningsvis används för att upptäcka avvikelser, och Banon säger att det redan ser en stor antagande och nästa steg är att lägga till prognosmöjligheter.

Andra områden som Elasticsearch kommer att rikta sig till nästa är program för övervakning av prestanda och upptäckt av bedrägeri, säkerhet analytics och med visualisering upp ett snäpp. Det är tydligt att flytta upp stacken till domän-specifika program, som kan ge en ny uppsättning av utmaningar som Elasticsearch kommer att ha konkurrera med de etablerade företagen. Banon dock anser i den strategi som har betalat ut så långt:

“För fem år sedan var vi ett litet företag med en relativt populära open source-produkt, och se vart vi är idag. Det sätt vi gjorde det är att vi omfamnar användare och lyssna till dem, och se till att när de förnya sig på toppen av vår plattform, detta kommer snart att hitta sin väg till plattformen. Om vi som företag beter sig på samma sätt som vi har gjort, jag har inga bekymmer.”

Tech Pro Forskning

Hur CXOs bör planera sin inställning till sakernas internet

Internet of Things politik

Hur Små och medelstora företag kan maximera nyttan av sakernas internet initiativ

Hyra kit: IoT-utvecklare

oT i den verkliga världen: Fem översta användningsfall

Relaterade Ämnen:

Hantering Av Data

Digital Omvandling

Robotteknik

Sakernas Internet

Innovation

Affärssystem