Salesforce probeert te vervangen SQL met natuurlijke taal

0
144

0

De Salesforce-AI onderzoeksteam ontwikkelde een nieuw systeem die belooft om te helpen met zakelijke gebruikers communiceren met databases en zonder kennis van talen zoals SQL, meestal gebruikt om een query voor deze systemen.

De CRM giant ‘s Seq2SQL systeem — vastgelegd in een wetenschappelijke paper [PDF] — is een diepe neurale netwerk dat vertaalt zich in natuurlijke taal vragen aan de corresponderende SQL-query’ s. Gebruikers type in een vraag als “welke accounts hebben de laagste klanttevredenheid score”, en heb het systeem een query op de juiste database en terug met de resultaten.

Salesforce zei in zijn paper dat het model is geïnspireerd door de aanwijzer netwerken, die, in plaats van het genereren van woorden uit een vaste woordenschat, zoals de attentional volgorde-te-rij model, genereert door het selecteren van woorden uit de input reeks.

Door het toepassen van reinforcement learning, Salesforce zei dat het model in staat is geweest om het genereren van meer accurate resultaten dan attentional volgorde-naar-reeks modellen. Volgens de papieren, Seq2SQL verbeterde uitvoering juistheid van 35.9 procent tot 60,3 procent en logische vorm juistheid van 23,4 procent tot 49,2 procent.

Salesforce zei dat zijn model niet vereist om toegang tot de tabel-inhoud tijdens de inferentie.

Het bedrijf heeft ook aangekondigd de lancering van WikiSQL, een open-source dataset van meer dan 87,000 natuurlijke taal vragen, SQL-query ‘ s en SQL tabellen getrokken van 26.000-plus HTML-tabellen van Wikipedia.

HTML-tabellen werden geëxtraheerd uit Wikipedia, die vervolgens werd de basis voor willekeurig gegenereerde SQL-query ‘ s. De vragen werden gebruikt om vragen, maar die werden toen overgedragen aan de werknemers op Amazon Mechanical Turk voor het parafraseren. Twee andere werknemers werd gevraagd om te controleren of de parafrase heeft dezelfde betekenis als de gegenereerde vraag, Salesforce toegelicht in de nota.

De CRM-giant wordt niet de eerste poging om domme database opvragen; Tableau dochteronderneming ClearGraph de technologie is ook ontworpen om het gemakkelijk voor gebruikers om toegang te krijgen tot en analyseren van gegevens zonder enige technische opleiding.

Het slaat semantische gegevens in kennis grafieken, die kan uitbreiden en leren in de tijd. Bijvoorbeeld, kan een gebruiker vragen voor “de totale omzet door klanten die gekocht nietjes in New York”, dan is het filteren van de resultaten op bestellingen in de laatste 30 dagen’, dan de groep van de resultaten door “project eigenaar van de afdeling”.

Quepy, een Python framework, transformeert ook in natuurlijke taal vragen in semantische database-query ‘ s die kunnen worden gebruikt met databases zoals DBpedia. Quepy biedt momenteel ondersteuning voor SPARQL en MQL query talen.

Eerder dit jaar, Austin, Texas-op basis van het opstarten Pilosa aangekondigd de lancering van de community edition van de “distributed bitmap index” gericht op het drastisch verbeteren van het opvragen van snelheden op datasets groter dan 1TB zonder de aanschaf van extra hardware.

Meestal databases hebben twee componenten: het opslaan en ophalen. Wat Pilosa heeft gedaan, is “bevrijd” van de index — die is gebruikt voor het uitvoeren van query ‘ s op datasets — uit de opslag, het maken van een nieuw type bitmap index die loopt in het geheugen in plaats van op disk.

wat is hot op zdnet

Microsoft ‘ s messing nog steeds geloven dat het een kans heeft om in de telefoon markt?

Apple heeft betrekking op meer enterprise basen, een team met Accenture

Cyberwar: Een gids voor de angstaanjagende toekomst van online conflict

Zazzle reset “duizenden” van de rekeningen na hackers brute-force wachtwoorden

0