Elasticsearch 6.0: non di nuovo, ma molto migliorato

0
163

Zero

Shay Banon è stato chiamato una persona che ha scritto il codice più rispetto a ciò che è umanamente possibile. Questo ha portato a lui di lavorare su una soluzione per la ricerca nel suo tempo libero alla costruzione di un framework open source e di una società globale in giro che con i clienti come eBay e Verizon.

Elasticsearch è venuto un senso lungo ed Elastico, è circa molto più che di ricerca. Oggi Elastico annuncia la versione 6.0 di quello che è ora l’intero stack costruito attorno ad un nucleo premessa di ricerca, e Banon come il recentemente nominato amministratore delegato ha discusso con ZDNet il passato, il presente e il futuro di Elasticsearch e le tendenze plasmare l’industria.

Elasticsearch come un sistema di record

La nostra conversazione non ha avuto inizio con le nuove funzionalità della versione 6.0. Se fai parte di Elastico comunità, si può già sapere. Se non, non si può ottenere molto colpito a prima vista. Questo è interessante di per sé, ma abbiamo pensato che sarebbe una buona idea per fare luce su che cosa Elasticsearch può e non può fare prima di intraprendere una discussione dettagliata sulle nuove caratteristiche.

Quando Banon ha iniziato a lavorare su Elasticsearch, era tutto sulla memorizzazione di JSON e avere un potente linguaggio di ricerca. Che è stato 8 anni fa, e come lui note “NoSQL era tutta la rabbia. A me Elasticsearch è stato qualcosa che mi ha appassionato, quindi io non voglio essere parte di qualsiasi campagna pubblicitaria del ciclo. Che sarebbe spostando l’attenzione dal valore Elasticsearch può portare come una ricerca molto potente soluzione.

Persone sono state chiedendo — posso sostituire il mio MongoDB, o mio database Oracle con Elasticsearch? Può funzionare come un sistema di record? La mia risposta è sempre stata, se Elasticsearch accanto a questi sistemi, Cassandra, Hadoop o o qualsiasi altra cosa, che porterà valore. È questo angolo di come risolvere i problemi, nel quadro di una ricerca prisma che nessun altro sistema. Ma il nostro obiettivo non è quello di sostituire questi sistemi.”

Questo “sistema di registrazione” la discussione è stata di un corso in materia di Elasticsearch. Nelle versioni precedenti c’è stato un lavoro nel contesto della Jepsen progetto che ha rivelato le condizioni sotto le quali la perdita di dati in Elasticsearch può verificarsi. Anche oggi, Kyle Kingsbury, Jepsen di mastermind, dice “non vorrei utilizzare questo come un sistema di record, così si dovrebbe mettere i tuoi dati in S3 o Postgres e hanno un strumento di replica in modo che ribadisce i dati.”

image54.png

Non tutti i database è completamente affidabile. In realtà, la maggior parte non lo sono. Elasticsearch non è anche un database in senso stretto, in modo da non dovrebbe essere usato o giudicato. Immagine: Jepsen / Kyle Kingsbury

Banon sembrano essere d’accordo che a suo modo. Egli riconosce Kingsbury contributo nel segnalare le deficienze Elasticsearch sharding e dice che hanno lavorato con lui nel tentativo di risolverli, e questo lavoro ha fatto un sacco di progressi e apertamente documentate. E se qualcuno vuole utilizzare Elasticsearch come un nucleo di sistema per memorizzare le transazioni finanziarie, Banon, non consiglierei loro di fare questo.

Alla fine, Banon, ammette, Elasticsearch non è stato intorno per tutto il tempo gli Oracoli del mondo, e questo significa che è per definizione meno maturi. Naturalmente, come egli osserva, se i dati sul Elasticsearch viene perso o danneggiato, questo rende per una brutta esperienza utente, stanno lavorando sulla resistenza.

Per Banon tuttavia la resilienza non è tutto su di algoritmi distribuiti e sharding, ma anche di cose come la stabilità e l’ingombro di memoria: “se si finisce a scrivere a un sistema che fa sì che il runtime di pausa, è indistinguibile da una partizione di rete. Abbiamo investito molto in questo settore e ci sono molti miglioramenti nella 6.0.”

Elasticsearch 6.0

Un tale miglioramento Banon in evidenza si basa su qualcosa che si chiama sequenza Id. È la possibilità di avere il consenso sulla sequenza di operazioni tra una primaria e una replica shard. Banon dice questo migliora notevolmente la capacità di mantenere la coerenza tra i dati, che consente di rispondere a una lacuna Elasticsearch ha avuto storicamente.

Un’altra area che Banon in evidenza è quello che lui chiama gli interruttori di circuito. Questo è circa il miglioramento di rilevamento di richieste che finiscono per consumare un sacco di risorse in modo che possa essere isolato, senza portare giù un cluster. Dice un sacco di lavoro è andato nella capacità di rintracciare e arrestare query quando necessario, così come lavorare con Java off-memoria heap tecniche e strutture. Come risultato, il footprint di memoria oggi è molto più piccolo di quanto usato per essere.

Molti altri miglioramenti sono in quella categoria, come pure – le cose che richiedono la conoscenza di esperti non solo per l’attuazione, ma anche di comprendere e valutare l’impatto di. Caratteristiche come indice di ordinamento, che finiscono tempo di negoziazione in indicizzazione di documenti, può incrementare significativamente le prestazioni di tempi di query. Un’altra caratteristica, sparse doc valori, cambia il modo scarsamente popolati i campi sono memorizzati, con conseguente tra il 30% e il 70% di risparmio di spazio di archiviazione..

firstdiag.png

Indice di ordinamento è una nuova funzionalità di Elasticsearch 6.0. Richiede una certa abilità di ingegneria e un lungo post sul blog, ma il risultato finale è migliore performance. Immagine: Elasticsearch

Alla fine, se non passare il tempo a scavare in queste nuove funzionalità, c’è una buona probabilità che si può restare indifferenti di Elasticsearch 6.0. Anche se Banon dice di vedere la nuova versione come qualcosa che è stato progressivamente stato condiviso e spiegato alla comunità attraverso una serie di post di blog, egli prende atto del fatto che non tutti necessariamente hanno il tempo e l’energia per questo.

Per la cronaca, altre nuove funzionalità di Elasticsearch 6.0 sono sparsi in tutta l’Elastico stack, che è composto da Kibana, Battute e Logstash. Questi sono Elasticsearch soluzioni per la visualizzazione e la dashboard, l’importazione dei dati e di archiviazione del registro rispettivamente. L’Elastico stack è completato da X-Pack, premium set di caratteristiche che includono cose come il grafico di visualizzazione e di rilevamento delle anomalie tramite l’apprendimento automatico.

Ascolto degli utenti, in carica per il futuro

Elasticsearch iniziato come una modesta soluzione centrata attorno a fare Lucene, il framework open source per l’indicizzazione e la ricerca, che è molto utilizzato per questo giorno, utilizzabile per la ricerca efficiente in JSON. Discutendo con Banon la progressione che ha portato a dove Elasticsearch è oggi, è chiaro che ciò che egli vede come la chiave di Elasticsearch successo è anche il motivo per cui si può restare indifferenti con le nuove funzioni.

Per Banon è sempre stata la possibilità di collegarsi e di ascolto della comunità. “Una delle cose che ho imparato sulla costruzione di un successo azienda open source è che è necessario per essere un buon ascoltatore”, dice. “Dopo il rilascio core Elasticsearch, era chiaro che la gente voleva avere la visualizzazione e la dashboard. Così abbiamo portato Kibana in-house e di stack.

Quando ho iniziato a lavorare su Elasticsearch, non avrei mai immaginato che un giorno il salvataggio dei log vorresti essere parte di esso. Ma la gente ha iniziato a farlo, e oggi ci sono il numero di una soluzione open source e, infatti, un sistema di registrazione per questo. Le persone sono felici che la nostra soluzione funziona molto meglio di Splunk per esempio.”

lessons-learned-in-deploying-the-elk-stack-elasticsearch-logstash-and-kibana-13-638.jpg

Elasticsearch è open source e tesori del rapporto con la sua comunità. Ma non a tutti è del tutto contento ogni aspetto di esso. Immagine: Logz.io

Questa è praticamente la storia di come Elasticsearch è cresciuta, e a quanto pare continuano ad essere. Banon non credere di andare via e tornare radicalmente le cose nuove che possono essere chiedendo alla gente di scommettere su di loro, ma piuttosto nel prendere step progressivi. Elasticsearch ha abbracciato cose come il cloud, o macchina di apprendimento, ma non è che va all-in su di loro.

Quando si parla di passare al cloud, Banon dice Elasticsearch è stato progettato per funzionare con AWS dall’inizio, e questo ha dato un grande contributo al suo successo. Oggi Elasticsearch funziona anche su Azure e Google cloud, con il quale c’è anche una partnership, e con Alibaba cloud. Non ci sono molti fornitori di software di enterprise che sono grandi in Cina come che, e Banon vede questo come convalida della strategia.

Ancora, si sottolinea che per loro è tutto in questo modo gli utenti: “quando abbiamo fatto il passaggio di offrire una versione gestita in cloud 3,5 anni fa, era di non forzare i nostri utenti, ma piuttosto di essere lì per loro. Essi possono eseguire Elasticsearch su qualsiasi cloud che vogliono, o utilizzare la nostra versione gestita, o eseguire on-premise. Non vogliamo lasciare nessuno indietro, e con Elastic Cloud Enterprise si esegue lo stesso codice il nostro utenti esegui”.

Come per il passaggio alla – piattaforme e machine learning (ML), Banon dice – è molto in sintonia con ciò che fanno. La progressione verso analytics sta accadendo anche in Elasticsearch, con la recente acquisizione di Prelert della tecnologia ML incorporato nella pila. Inizialmente questo è utilizzato per il rilevamento di anomalie e Banon dice che è già vedendo gran adozione e il passo successivo è quello di aggiungere le capacità previsionali.

Altre aree che Elasticsearch saranno destinazione successiva sono le prestazioni dell’applicazione di monitoraggio e di rilevamento delle frodi, sicurezza di analisi e di assunzione di visualizzazione su una tacca. Questo è chiaramente lo spostamento dello stack di dominio-specifiche applicazioni, che possono fornire una nuova serie di sfide, come Elasticsearch dovrà competere contro incumbent. Banon tuttavia crede nella strategia che ha pagato finora fuori:

“Cinque anni fa, eravamo una piccola azienda con un relativamente popolare prodotto open source, e guarda dove siamo oggi. Il modo in cui l’abbiamo fatto è che abbiamo abbraccio utenti e ascoltare a loro, e assicurarsi che quando si innovare in cima alla nostra piattaforma, questo sarà presto trovare la sua strada verso la piattaforma. Se noi, come società, si comportano nello stesso modo che ci sono state, non ho preoccupazioni.”

Tech Pro Ricerca

Come CXOs devono pianificare il loro approccio alla IoT

Internet delle Cose della politica

Come le Pmi possono massimizzare i benefici della IoT iniziative

Assumere kit: IoT sviluppatore

oT nel mondo reale: Cinque casi di utilizzo

Argomenti Correlati:

La Gestione Dei Dati

La Trasformazione Digitale

Robotica

Internet delle Cose

L’innovazione

Enterprise Software

0