Arcadia Gegevens brengt natuurlijke taal query om de gegevens meer

0
147

Nul

arcadia-fig-3.png

Het genereren van een boom kaart van plain-English zoekopdracht

Credit: Arcadia Gegevens

Het verkennen van gegevens met behulp van natuurlijke taal (“plain English”) query expressies is geen nieuw concept, maar het is uitgegroeid tot meer relevante en meer haalbaar is de laatste tijd. Mensen worden gebruikt om de zoekmachines en net als de metafoor als gegevens opvragen ervaring. Producten zoals Thoughtspot en Antwoord Raket gespecialiseerd zijn in dit teaming van zoeken en gegevens ontdekking. En de Q&A-functie van Microsoft Power BI-maakt dit mogelijk, zowel voor ad hoc query ‘ s in dashboards en zelfs voor gebruik als een authoring tool bij het ontwerpen van rapporten.

Veel natuurlijke taal analytics producten, echter, zijn gegevens nodig zijn om verplaatst te worden in hun eigen database of index structuren. Maar vandaag, Arcadia Gegevens is de aankondiging van een nieuwe functie Zoeken, in de nieuwste release van haar Arcadia Enterprise-product, dat past in de natuurlijke taal query paradigma om rechtstreeks te werken op de top van gegevens meren.

De laag naar beneden
In een telefoon briefing met Sushil Thomas, Arcadia Gegevens, Founder & CEO, Steve Wooledge, het bedrijf VP van Marketing, leerde ik dat de Arcadia-Data Search functie werkt op de top van Hadoop-gebaseerde data meren, maar ook voor data in de cloud meren die zich bevinden in de Amazon S3 en Microsoft ‘ s Azure Gegevens Meer Opslaan (ADL).

Zodra Arcadia is aangesloten op het meer, kunnen gebruikers type in zoek uitdrukkingen als “toon mij de staten met de hoogste populatie in 1910” en de resultaten terug in de vorm van data visualisaties. Dit werkt zowel voor individuele zoekt en in dashboards zoals weergegeven in de afbeelding op de bovenkant van deze post).

Die de rand gevallen
Het uitvoeren van een dergelijke query ‘ s gegevens over meren vereist correcte afhandeling van bepaalde onduidelijkheden:

Dezelfde vraag kan van toepassing zijn op meer dan één set met gegevens wordt in de gegevens meer. In dit geval, Arcadia Gegevens van toepassing zijn eigen scoring algoritme, het opvragen van de gegevens stellen het voelt is het meest van toepassing is, maar het vermelden van aanklikbare opties voor de anderen (zie figuur hieronder). Gebruikers die kiezen een van de andere data sets impliciet invloed van de scoring algoritme om de gunst van de gegevensset meer in de volgende searchesCertain data sets of kolommen in een set met gegevens wordt mogelijk niet geschikt voor zoeken op basis van query. Voor het opvangen van deze moeilijkheden, Arcadia Gegevens kan de beheerder aangeven welke tabellen en kolommen die in hen worden gezocht. Voor de kolommen die zijn doorzoekbaar, de woorden gebruikt in een natuurlijke taal query kan niet overeenkomen met de kolommen de namen van verbatim. Om dit te verwerken quandry, Arcadia Gegevens kunt een lijst van synoniemen worden ingevoerd voor elke doorzoekbaar kolom.

arcadia-fig-2.png

Arcadia biedt gevolg opties voor alle van toepassing zijnde gegevens, met één standaard, maar waardoor geen van de anderen te worden geselecteerd.

Credit: Arcadia Gegevens

Arcadia Zoekfunctie biedt andere voordelen. Bijvoorbeeld, als de query expressies worden ingevoerd, auto-complete suggesties worden aangeboden (dit kan ook een hele zoektocht uitdrukkingen gepresenteerd als suggesties na slechts een enkel woord is ingevoerd in het zoekvak). De resultaten zijn weergegeven met behulp van wat Arcadia Gegevens bepaalt de meest geschikte visualisatie type, maar gebruikers kunnen opgeven van de viz type ze graag in de zoektocht expressie zelf.

Het is waarschijnlijk belangrijk om op te merken dat, hoewel Arcadia heeft de naam van deze nieuwe functie “Zoeken” het is niet afhankelijk van speciale zoek-indexen, en het maakt geen gebruik van technologieën zoals Solr/Lucene of ElasticSearch. In plaats daarvan, Arcadia is echt het verstrekken van een natuurlijke taal abstraction layer zet de ingevoerde uitdrukking in de bijbehorende query in SQL of een andere inheemse taal (afhankelijk van de set gegevens van de herkomst en indeling). Hoewel Arcadia heeft zijn eigen stijl van OLAP-kubus onder de motorkap te versnellen sommige query ‘ s, de gegevens in het meer wordt opgevraagd native, en geen indexering of ELT is vereist.

Zoekmachine data catalog
Als u over het denkt, Arcadia Gegevens van de Zoekfunctie van adressen veel van dezelfde gegevens meer gebruik maken van zaken als data catalog-gedreven query tools. Het idee in beide gevallen is om gegevens in het meer toegankelijker, het verstrekken van een self-service query ervaring voor zakelijke gebruikers die niet vertrouwd zijn met elke dataset en het schema.

De data catalog aanpak werkt in een top-down mode: zoek eerst de set gegevens die u nodig hebt en vervolgens maak de query ‘ s tegen. Arcadia Gegevens van de Zoekfunctie is meer bottom-up: je kunt zeggen wat je wilt zien en vervolgens de gegevens worden geselecteerd en query speciaal voor u vervaardigd. Beide benaderingen zijn geldig en kan een van beide de voorkeur, afhankelijk van de omstandigheden.

Maar soms is een dwingende opdracht is sneller en makkelijker dan een browse-ervaring. Voor zakelijke gebruikers die op zoek zijn naar de “blanco pagina” en beginnen om echt uit het gebruik van hun gegevens meren, Arcadia Gegevens heeft een geweldige oplossing. Zodra gebruikers zich te oriënteren, kunnen zij gebruik wenst te maken van een data-catalogus te helpen met het verkennen van hun gegevens meren meer uitvoerig. Er zijn sterke synergieën tot het gebruik van beide.

Verwante Onderwerpen:

Digitale Transformatie

Robotica

Het Internet van Dingen

Innovatie

Enterprise Software

CXO

0