Arcadia Data ger naturligt språk frågan till uppgifterna sjön

0
151

Noll

arcadia-fig-3.png

Skapa ett träd karta från en vanlig engelska uttryck sök

Kredit: Arcadia Data

Utforska data med hjälp av naturligt språk (“vanlig engelska”) fråga uttryck är inte ett nytt koncept, men det har blivit mer relevant och mer genomförbart på sistone. Människor som används för att sökmotorer och som metafor som data fråge erfarenhet. Produkter som Thoughtspot och Svar Raket som är specialiserade på detta sammanslagning av sök-och data discovery. Och Q&En funktion i Microsoft Power BI möjliggör detta, både för ad hoc-frågor i instrumentpaneler och även för att användas som ett verktyg för redigering när de utformar rapporter.

Många naturliga språk analytics produkter, krävs dock att data flyttas in i sina egna depåer eller index strukturer. Men idag, Arcadia Uppgifter är att tillkännage en ny sökfunktion, i den senaste versionen av sitt Arcadia Enterprise-produkt, som anpassar sig naturligt språk fråga paradigm för att arbeta direkt på toppen av data sjöar.

Låg ner
I en telefon genomgång med Sushil Thomas, Arcadia Data Grundare & VD och Steve Wooledge, företagets vice vd för Marknadsföring, jag har lärt mig att Arcadia Data Sök-funktionen fungerar på toppen av Hadoop-baserad data sjöar liksom cloud data sjöar som finns i Amazon S3 och Microsofts Azure-för synkronisering av Data Sjön Store (ADLS).

När Arcadia är ansluten till sjön, användare kan skriva i sök uttryck som “visa mig länderna med den högsta befolkningen i 1910” och få tillbaka resultaten i form av visualiseringar av data. Detta fungerar både för enskilda sökningar och inom instrumentpaneler som (på bilden överst i detta inlägg).

Täcker kanten fall
Verkställande sådana frågor över data sjöar kräver graciösa hantering av vissa oklarheter:

Samma fråga kan gälla mer än en uppsättning data i data sjön. I detta fall, Arcadia Data kommer att tillämpa sin egen poäng algoritm, fråga de uppgifter som det känns är i de flesta fall, men notering klickbara alternativ för den andra (se figur nedan). Användare som väljer en av de alternativa uppsättningar data implicit kommer att påverka poängsättningen algoritm för att uppgifter som mer i efterföljande searchesCertain datamängder eller kolumner i en datamängd kan inte vara lämpligt för sök-baserat fråga. För att minska dessa svårigheter, Arcadia Data gör det möjligt för administratörer att ange vilka tabeller och kolumner som inom dem, är sökbara. För de kolumner som är sökbar, de ord som används i ett naturligt språk, att frågan kan inte matcha dessa kolumner namnen ordagrant. För att hantera detta quandry, Arcadia Data ger en lista av synonymer för att skrivas in för varje sökbar kolumn.

arcadia-fig-2.png

Arcadia ger resultat alternativ för alla tillämpliga uppgifter, att visa någon som standard, men att låta någon av de andra att bli valda.

Kredit: Arcadia Data

Arcadia är Sök-funktionen ger andra finesser. Till exempel, så fråga uttryck skrivs in, auto-kompletta förslag finns (detta kan innefatta hela sökning uttryck som presenteras som förslag efter bara ett enda ord skrivs in i sökrutan). Resultaten återges med vad Arcadia Data som fastställs vara den mest lämpliga visualisering typ, men användarna kan ange dvs typ de vill inom sök uttryck i sig.

Det är nog viktigt att peka på att även om Arcadia har döpt den nya funktionen “Sök”, den behöver inte förlita sig på speciella sökning index, och det behöver inte använda teknik som Solr/Lucene eller ElasticSearch. Istället, Arcadia är verkligen att ge ett naturligt språk abstraction layer) som konverterar den in uttryck till motsvarande fråga i SQL, eller ett annat modersmål (beroende på de uppgifter som ursprung och format). Även om Arcadia inte skapa sin egen stil av OLAP-kub under huven för att påskynda vissa frågor, de data som finns i sjön är att vara ifrågasatt direkt, och ingen indexering eller ELT krävs.

Sökmotor som data katalog
Om du tycker om det, Arcadia Data Sök-funktionen tar upp många av samma uppgifter sjön användningsfall som gör data katalog som drivs frågan verktyg. Tanken är i båda fallen att göra uppgifterna i sjön mer synlig, vilket ger en self-service-fråga erfarenhet för företag användare som inte känner till varje uppsättning data och dess schema.

Data katalog strategi fungerar i en top-down mode: för det första att hitta de uppgifter som du behöver och sedan craft frågan mot det. Arcadia Data ‘ s sökfunktion är mer bottom-up: säg vad du vill se och sedan de uppgifter som kommer att väljas ut och fråga utformad för dig. Båda metoder är giltiga och har antingen den ena kan vara att föredra, beroende på omständigheter.

Men ibland ett nödvändigt kommandot är snabbare och lättare än en webbupplevelse. För affärsanvändare som vill få bort “tom sida” och börjar få riktig användning av deras uppgifter sjöar, Arcadia Data som har en bra lösning. När användarna har sina lager, de kanske vill använda ett data-katalogen för att hjälpa dem att utforska sina uppgifter sjöar mer ingående. Det finns starka synergier att använda båda.

Relaterade Ämnen:

Digital Omvandling

Robotteknik

Sakernas Internet

Innovation

Affärssystem

CXO

0