Arcadia Dati porta naturale del linguaggio di query per i dati lago

0
175

Zero

arcadia-fig-3.png

La generazione di una mappa ad albero da un normale-inglese espressione di ricerca

Credito: Arcadia Dati

Esplorazione dei dati, l’utilizzo del linguaggio naturale (“plain English”) le espressioni di query non è un concetto nuovo, ma è diventato più importante e più fattibile ultimamente. Le persone sono utilizzati per i motori di ricerca e come la metafora come le query di dati di esperienza. Prodotti come Thoughtspot e Rispondere a Razzo si specializzano in questo teaming di ricerca e il reperimento dei dati. E il Q&A funzionalità di Microsoft Power BI consente questo, sia per le query ad hoc in dashboard e anche per l’uso come strumento di authoring per la progettazione di report.

Molti di linguaggio naturale prodotti di analisi, tuttavia, richiedono che i dati siano trasferiti nella loro propri repository o strutture di indice. Ma oggi, Arcadia Dati è l’annuncio di una nuova funzione di Ricerca, in l’ultima versione della sua Arcadia prodotto Enterprise, che adatta il linguaggio naturale query paradigma di lavorare direttamente su dati di laghi.

Il basso verso il basso
In un telefono briefing con Sushil Thomas, Arcadia Dati Fondatore e amministratore delegato, e Steve Wooledge, la società VP Marketing, ho imparato che l’Arcadia di Dati funzione di Ricerca funziona in cima Hadoop-dati di base laghi nonché dei dati nel cloud, i laghi che si trovano in Amazon S3 e Microsoft Azure Dati Lago Store (ADL).

Una volta Arcadia è collegato al lago, gli utenti possono digitare nella ricerca di espressioni come “show me gli stati con la più alta popolazione nel 1910” e ottenere risultati in forma di visualizzazioni di dati. Questo funziona sia per ricerche individuali e all’interno dei cruscotti come (come mostrato nella figura in alto a questo post).

Che copre il bordo dei casi
L’esecuzione di query sui dati laghi richiede la normale gestione di alcune ambiguità:

La stessa query può applicare a più di un set di dati nel data lago. In questo caso, l’Arcadia Dati si applica il suo algoritmo di valutazione, di interrogare i set di dati che si sente è più applicabile, ma l’elenco cliccabile opzioni per gli altri (vedi figura sotto). Gli utenti che prendere un altro set di dati comporterà l’implicita influenza l’algoritmo di valutazione a favore set di dati in più nelle successive searchesCertain insiemi di dati o colonne all’interno di un set di dati potrebbe non essere appropriato per la ricerca, basata su query. Per ovviare a tali difficoltà, l’Arcadia Dati consente agli amministratori di specificare le tabelle e le colonne al loro interno, sono ricercabili. Per le colonne che sono ricercabili, le parole usate in un linguaggio naturale query potrebbe non corrispondere a quelle colonne di nomi di verbatim. Per gestire questo quandry, Arcadia Dati consente di visualizzare un elenco di sinonimi per essere inserito per ogni ricercabile colonna.

arcadia-fig-2.png

Arcadia offre opzioni per tutte le serie di dati, la visualizzazione di default, ma permettendo a tutti gli altri per essere selezionato.

Credito: Arcadia Dati

Arcadia funzionalità di Ricerca fornisce altre piacevolezze. Per esempio, come espressioni di query vengono inseriti, il completamento automatico vengono forniti suggerimenti (questo può includere l’intero espressioni di ricerca presentato come suggerimenti dopo solo una singola parola è inserito nella casella di ricerca). I risultati sono resi utilizzando Arcadia Dati determina le più idonee tipo di visualizzazione, ma gli utenti possono specificare il viz tipo vorrebbero all’interno della ricerca stessa espressione.

Probabilmente è importante evidenziare che, sebbene Arcadia ha chiamato questa nuova funzionalità di “Ricerca”, non si basa su particolari indici di ricerca, e non fa uso di tecnologie come Solr/Lucene o ElasticSearch. Invece, l’Arcadia è davvero un linguaggio naturale livello di astrazione che converte l’entrata espressione nella corrispondente query in SQL, o di un’altra lingua nativa (a seconda del set di dati di origine e formato). Anche se da Arcadia creare il proprio stile di cubo OLAP sotto il cofano per accelerare alcune query, i dati nel lago è interrogato in modo nativo, e non di indicizzazione o ELT è richiesto.

Motore di ricerca del catalogo di dati
Se ci pensate, l’Arcadia di Dati di Ricerca di funzionalità risolve molti degli stessi dati lago di casi d’uso come catalogo dati-guidato gli strumenti di query. L’idea in entrambi i casi è quello di rendere i dati nel lago più individuabile, fornendo un servizio di self-service query esperienza per gli utenti business che non hanno familiarità con ogni set di dati e il relativo schema.

I dati del catalogo approccio funziona in un top-down: prima di trovare il set di dati è necessario quindi creare la query. Arcadia Dati funzionalità di Ricerca è più basso: dire ciò che si vuole vedere e quindi il set di dati selezionati ed query predisposto per voi. Entrambi gli approcci sono validi e uno dei due può essere preferibile, a seconda delle circostanze.

Ma a volte un comando imperativo è più veloce e più facile che un esperienza di navigazione. Per gli utenti business che desiderano scendere la “pagina bianca” e iniziare a ottenere il reale utilizzo dei propri dati laghi Arcadia di Dati è una grande soluzione. Una volta che gli utenti hanno i loro cuscinetti, si potrebbe desiderare di utilizzare un catalogo dati per aiutarli ad esplorare i loro dati laghi più completo. Ci sono forti sinergie all’utilizzo.

Argomenti Correlati:

La Trasformazione Digitale

Robotica

Internet delle Cose

L’innovazione

Enterprise Software

CXO

0