DANSK

Elasticsearch 6.0: ikke så nye, men ganske forbedret

188

Nul

Shay Banon er blevet kaldt en person, der har skrevet mere kode end, hvad der er menneskeligt muligt. Dette har ført ham fra at arbejde på en løsning for at søge i sin fritid på at opbygge et open source framework og en global virksomhed rundt omkring, der med klienter som eBay og Verizon.

Elasticsearch er kommet en lang vej og Elastisk handler om meget mere end søgning. I dag Elastisk annoncerer version 6.0 af, hvad der er nu en hel stak bygget op omkring den centrale forudsætning for search, og Banon som for nylig udnævnt til administrerende DIREKTØR drøftet med ZDNet fortid, nutid, og fremtid Elasticsearch og de tendenser, der er ved at forme branchen.

Elasticsearch som et system for registrering

Vores samtale ikke starte med de nye funktioner i version 6.0. Hvis du er en del af den Elastiske samfund, du måske allerede kender dem. Hvis ikke, kan du ikke få meget imponeret ved første øjekast. Dette er interessant i og af sig selv, men vi troede, det ville være en god idé at kaste lys over, hvad Elasticsearch kan og ikke kan gøre, før der iværksættes en detaljeret diskussion om nye funktioner.

Når Banon begyndte at arbejde på Elasticsearch, det var alt om at lagre JSON, og som har en kraftig søgning sprog. Det var 8 år siden, og som han bemærker “NoSQL var alle de vrede. For mig Elasticsearch var noget, jeg var passioneret omkring, så jeg har ikke lyst til at være en del af enhver hype cycle. Det ville være at flytte fokus fra den værdi Elasticsearch kan bringe en meget kraftfuld søg løsning.

Folk er blevet spurgt, — kan jeg udskifte mit MongoDB, eller min Oracle database med Elasticsearch? Kan det fungere sammen som et system for registrering? Mit svar har altid været, hvis du placerer Elasticsearch ud for nogen af disse systemer, skal være det Cassandra eller Hadoop eller hvad, det vil bringe værdi. Det er denne vinkel på, hvordan man løser udfordringer under en søgning prism, at intet andet system har. Men vores mål er ikke at erstatte disse systemer.”

Denne “record” – diskussion har der været en løbende om Elasticsearch. I tidligere versioner, der har været i arbejde i forbindelse med den Jepsen projekt, der afslørede, under hvilke betingelser tab af data i Elasticsearch kan forekomme. Selv i dag, Kyle Kingsbury, Jepsen, mastermind, siger: “jeg ville ikke bruge dette som et system for registrering, så du vil lægge dine data i S3 eller Postgres og har en replikation af, så det gentager data.”

Banon synes at være enige i, at der i hans måde. Han erkender, Kingsbury bidrag ved at påpege fejl og mangler i Elasticsearch sharding og siger, at de har arbejdet sammen med ham i forsøget på at løse dem, og dette arbejde har gjort masser af fremskridt og er åbent dokumenteret. Og hvis nogen ønsker at bruge Elasticsearch som et centralt system til at gemme finansielle transaktioner på, Banon ville ikke råde dem til at gøre dette.

I den sidste ende, Banon indrømmer, Elasticsearch har ikke eksisteret så længe som Orakler i verden, og dette betyder, at det er, per definition er mindre modne. Selvfølgelig, som han bemærker, hvis dine data på Elasticsearch bliver tabt eller ødelagt, det giver en dårlig brugeroplevelse, så de arbejder på modstandsdygtighed.

For Banon men modstandsdygtighed er ikke alle om distribuerede algoritmer og sharding, men også om ting som stabilitet og hukommelse fodaftryk: “hvis du ender med at skrive til et system, der bevirker, at din runtime til at holde pause, det er umulig at skelne fra et netværk partition. Vi har investeret kraftigt i dette område, og der er mange forbedringer i 6.0.”

Elasticsearch 6.0

En sådan forbedring Banon fremhæver, er baseret på noget, der hedder sequence-id ‘ er. Det er evnen til at have konsensus om den sekvens af operationer mellem en primær og en kopi shard. Banon siger, at dette i høj grad forbedrer evnen til at opretholde en sammenhæng mellem data, og hjælper med at løse et hul Elasticsearch har haft historisk.

Et andet område, som Banon fremhæver, er, hvad han kalder afbrydere. Dette handler om at forbedre påvisning af anmodninger, der ender med at forbruge masser af ressourcer, så de kan være isolerede, uden at bringe ned en klynge. Han siger en masse arbejde er gået i evnen til at spore og stoppe forespørgsler, når det er nødvendigt, samt at arbejde med Java-off-heap-hukommelse teknikker og strukturer. Som et resultat, hukommelse fodaftryk i dag er meget mindre end det plejede at være.

Mange andre forbedringer, der i denne kategori – ting, der kræver ekspert viden, ikke bare at gennemføre, men også for at forstå og vurdere konsekvenserne af. Funktioner som indeks sortering, som ender med handel gang med at indeksere dokumenter, kan i væsentlig grad øge forespørgsel tid ydeevne. En anden funktion, lav doc værdier, ændrer den måde, tyndt befolkede områder er gemt, hvilket resulterer i mellem 30 procent og 70 procent af besparelser i lagerplads..

I den sidste ende, hvis du ikke bruger tiden til at grave ind i disse nye funktioner, der er en god chance for du kan stadig imponeret af Elasticsearch 6.0. Selvom Banon siger, at de ser den nye version som noget, der har været gradvist blevet delt med, og forklarede, at fællesskabet via en serie af blog-indlæg, at han erkender det faktum, at ikke alle vil nødvendigvis har tid og energi til det.

For the record, andre nye funktioner i Elasticsearch 6.0 er spredt ud over hele Elastisk stak, som består af Kibana, Beats og Logstash. Disse er Elasticsearch løsninger til visualisering og dashboards, data indtagelse og log opbevaring hhv. Den Elastiske stakken er suppleret med X-Pack, en præmie sæt af funktioner, der omfatter ting som graf visualisering og anomalisøgning via machine learning.

At lytte til brugerne, opladning til fremtiden

Elasticsearch startede som et beskedent løsning, der er centreret omkring at gøre Lucene, open source framework til indeksering og søgning, som er meget brugt til den dag i dag, der er anvendelige til effektiv søgning på JSON. At diskutere med Banon den progression, der har ført til, hvor Elasticsearch er i dag, bliver det klart, at hvad han ser som en nøgle til Elasticsearch ‘ s succes er også grunden til, at du kan forblive uimponeret med de nye funktioner.

For Banon det har altid været om at forbinde med og lytte til fællesskabet. “En af de ting jeg har lært om at opbygge et vellykket open source-virksomhed er, at du er nødt til at være en god lytter”, siger han. “Efter udgivelsen af core Elasticsearch, var det klart, at folk gerne ville have visualisering og dashboards på toppen af det. Så vi bragte Kibana i huset og gjort det til en del ud af stakken.

Da jeg begyndte at arbejde på Elasticsearch, jeg havde aldrig forestillet mig en dag at gemme logfiler vil være en del af det. Men folk begyndte at gøre det, og i dag er vi nummer et open source-løsning, og i virkeligheden et system af registreringen for denne. Mennesker er tilfredse med, at vores løsning fungerer meget bedre end Splunk for eksempel.”

lessons-learned-in-deploying-the-elk-stack-elasticsearch-logstash-and-kibana-13-638.jpg

Dette har været temmelig meget historien om, hvordan Elasticsearch er vokset, og vil tilsyneladende fortsætte med at være. Banon ikke tror på at gå væk og komme tilbage med radikalt nye ting, der kan være at bede folk om at satse på dem, men snarere i at tage progressive skridt. Elasticsearch har taget ting som cloud, eller machine learning, men er ikke at gå all-in på dem enten.

Når vi diskuterer flytte til skyen, Banon siger Elasticsearch var designet til at arbejde med AWS fra start, og det har bidraget en hel del til dens succes. I dag Elasticsearch kører også på Azure og Google cloud, som der også er et partnerskab, samt med Alibaba cloud. Der er ikke mange enterprise software-leverandører, der er store i Kina, og Banon ser det som en validering af strategien.

Stadig, han fremhæver, at for dem handler det om at give brugerne: “når vi har gjort overgangen til at tilbyde en administreret version i skyen 3,5 år siden, var det ikke til at tvinge vores brugere, men snarere til at være der for dem. De kan køre Elasticsearch på uanset hvilken sky de ønsker det, eller bruge vores administrerede version, eller køre på præmissen. Vi ønsker ikke at lade nogen i stikken, og med Elastisk Cloud Enterprise løber vi den samme kode, som vores brugere run”.

Som for at flytte til IPaaS platforme og machine learning (ML), Banon siger IPaaS er meget i overensstemmelse med, hvad de gør. Progression i retning af analytics, der sker, også i Elasticsearch, med den seneste overtagelse af Prelert ML-teknologien, der har været indarbejdet i stakken. I første omgang bruges til anomalisøgning, og Banon siger, det er allerede til at se store vedtagelse, og det næste skridt er at tilføje prognoser kapaciteter.

Andre områder, der Elasticsearch vil målrette næste er anvendelsen overvågning af ydeevne og afsløring af bedrageri, sikkerhed analytics og tage visualisering op et hak. Dette er klart bevæger sig op i stakken til domæne-specifikke applikationer, som kan give et nyt sæt af udfordringer, som Elasticsearch bliver nødt til at konkurrere mod de etablerede selskaber. Banon mener dog, at det i strategien, at der har været betaler sig så langt:

“For fem år siden var vi et lille selskab med et relativt populære open source-produkt, og se hvor vi er i dag. Den måde, vi gjorde det at vi omfavne brugerne og lytte til dem, og sørg for, at når de innovere på toppen af vores platform, dette vil snart finde vej til platformen. Hvis vi, som virksomhed opfører sig på samme måde, som vi har været, har jeg ingen bekymringer.”

Tech Pro Forskning

Hvordan CXOs skal planlægge deres tilgang til tingenes internet

Internet af Ting politik

Hvordan små og mellemstore virksomheder kan maksimere fordelene ved IoT initiativer

Leje kit: IoT-udvikler

oT i den virkelige verden: top Fem use cases

Relaterede Emner:

Data Management

Digital Transformation

Robotteknologi

Tingenes Internet

Innovation

Virksomhedens Software