Arcadia Data, der bringer naturligt sprog forespørgsel til de data sø

0
126

Nul

arcadia-fig-3.png

Generering af et træ kort fra et almindeligt dansk udtryk, søg

Kredit: Arcadia Data

Udforske data ved hjælp af naturligt sprog (“plain English”) forespørgsel udtryk er ikke et nyt begreb, men det er blevet mere relevante og mere realistisk sidst. Folk er vant til søgemaskiner og som metafor som at forespørge data oplevelse. Produkter som Thoughtspot og Svar Raket specialiserer sig i dette samarbejde for søgning og data opdagelse. Og Q&A funktion af Microsoft Power BI gør dette, både for ad hoc-forespørgsler i dashboards og endda til brug som et udviklings værktøj, når designe rapporter.

Mange naturlige sprog analytics produkter, men kræver dog, at data for at være flyttet ind i deres egne arkiver eller index-konstruktioner. Men i dag, Arcadia Data annoncerer en ny søgefunktion, i den seneste udgave af sin Arcadia Virksomhedens produkt, der tilpasser sig den naturlige sprog forespørgsel paradigme til at arbejde direkte på toppen af data søer.

Den lave ned
I en telefon briefing med Sushil Thomas, Arcadia Data ‘ s Grundlægger og administrerende DIREKTØR, og Steve Wooledge, virksomhedens Marketing VP, har jeg lært, at Arcadia Data Search-funktionen virker på toppen af Hadoop-baseret data for søer samt cloud data søer, der findes i Amazon S3 og Microsofts Azure Data Sø Butik (ADLS).

Når Arcadia er forbundet til søen, kan brugere skrive søg efter udtryk som “vis mig de stater med de højeste befolkningen i 1910”, og få resultatet tilbage i form af data visualiseringer. Dette virker både for individuelle søgninger, og inden dashboards, som vist i figuren på toppen af dette indlæg).

Dækker kanten tilfælde
Udførelse af sådanne forespørgsler over data søer kræver yndefulde håndtering af visse uklarheder:

Den samme forespørgsel kan gælde for mere end ét sæt data i data-søen. I dette tilfælde, Arcadia Data vil anvende sin egen score algoritme, forespørge data set det, man mener, er mest relevant, men notering klikbare muligheder for andre (se figur nedenfor). Brugere, der vælger en af de alternative datasæt vil implicit påvirke score algoritme til fordel, at data, der er mere på efterfølgende searchesCertain datasæt eller kolonner i et datasæt kan ikke være passende til søgning-baserede query. For at afbøde disse vanskeligheder, Arcadia Data giver administratorer mulighed for at angive, hvilke borde, og hvilke kolonner i dem, der er søgbare. For de kolonner, der er søgbare, de ord, der anvendes i et naturligt sprog, forespørgsel kan ikke matche disse kolonner’ navne ordret. Til at håndtere dette quandry, Arcadia Data giver en liste af synonymer, som opføres for hver søgbare kolonne.

arcadia-fig-2.png

Arcadia giver resultat muligheder for alle relevante data sæt, at vise et til som standard, men giver enhver af de andre til at blive valgt.

Kredit: Arcadia Data

Arcadia ‘ s Søge funktion giver andre finesser. For eksempel, som forespørgslen udtryk er indtastet, auto-complete gives forslag (dette kan omfatte hele søgning udtryk præsenteret som forslag efter kun et enkelt ord, som er indtastet i søgefeltet). Resultaterne er gjort brug af, hvad Arcadia Data, bestemmer, at være den mest hensigtsmæssige type visualisering, men brugerne kan angive, nemlig den type, de gerne vil have, inden søgningen udtryk i sig selv.

Det er nok vigtigt at pointere, at selv om Arcadia har opkaldt denne nye funktion “Søg” det betyder ikke stole på særlige søgeindekser, og det gør ikke bruge teknologier som Solr/Lucene-eller ElasticSearch. I stedet, Arcadia er virkelig at give et naturligt sprog abstraktionslag, der konverterer den indtastede udtryk i den tilsvarende forespørgsel i SQL, eller andet modersmål (afhængigt af de data, der er oprindelse og format). Selv om Arcadia ikke skabe sin egen stil af OLAP-kube under motorhjelmen til at fremskynde nogle forespørgsler, er de data i søen er der forespørges indbygget, og ingen indeksering eller ELT er påkrævet.

Søgemaskine som data katalog
Hvis du tænker over det, Arcadia Data ‘ s søgefunktion behandler mange af de samme data søen bruge de tilfælde, som gør data katalog-drevet forespørgsel værktøjer. Den idé i begge tilfælde er at gøre data i søen mere synlig, hvilket giver en self-service forespørgsel oplevelse for business-brugere, der ikke er bekendt med de enkelte datasæt og sit skema.

De data catalog tilgang virker i en top-down-mode: for det første finde ud af det datasæt, du har brug for og derefter håndværk forespørgslen imod det. Arcadia Data ‘ s Søge funktion er mere bottom-up: sig, hvad du ønsker at se, og så er de data, der vil blive valgt og udformet forespørgsel til dig. Begge tilgange er gyldig, og at den ene kan være at foretrække, afhængig af omstændighederne.

Men nogle gange er en bydende kommando er hurtigere og lettere end en oplevelse. For business-brugere, der ønsker at komme væk fra “tom side” og begynder at få reelle brug af deres data, søer, Arcadia Data har en fantastisk løsning. Når brugerne har deres lejer, som de måtte ønske at bruge en data-katalog for at hjælpe dem med at udforske deres data søer mere omfattende. Der er stærke synergier til at bruge begge dele.

Relaterede Emner:

Digital Transformation

Robotteknologi

Tingenes Internet

Innovation

Virksomhedens Software

CXO

0