Doet machine learning nog mensen nodig?
Vijay Raghavan, executive vice president en chief technology officer Risk en Business Analytics voor De RELX Groep, gesprekken met Tonya Hall over een balans tussen analyse en intuïtie.
Het krijgen van een aantal leveranciers om met elkaar te praten, laat staan op de lijn, is geen sinecure. Het toevoegen van academici en onderzoekers niet per se makkelijker maken. Nu proberen toe te voegen aan de mix van een gefragmenteerde gemeenschap en langdurige onopgeloste problemen, en je krijgt het beeld van waarom grafiek gegevens standaardisatie is niet gelukt.
Ook: De AI-chip eenhoorn dat is ongeveer om de wijze alles heeft computational Grafiek in de Kern
Dit lijkt echter aan het veranderen, en dat is goed nieuws voor iedereen. We zijn nauw na de opkomst van de grafiek databases voor de afgelopen paar jaar. De sterren lijken eindelijk afstemmen voor grafiek, en de Gartners en Forresters van de wereld zijn in het oppikken van deze, ook.
Na te zijn opgenomen in Gartner ‘ s Hype Cycle in augustus 2018, Gartner ook opgenomen Grafiek trend No. 5 voor in de Top 10 van Data en Analytics-Technologie Trends voor 2019. Grafieken schitteren in het modelleren van een aantal domeinen, en zijn de beste optie om te benutten verbonden gegevens. Dus waarom duurde het zo lang voor het bereiken van de mainstream? Om een offerte collega-ZDNet medewerker en een Eicel analist Tony Baer:
“Ik voelde me altijd grafiek is beter geschikt wordt ingesloten onder de motorkap, want het was een vreemde nieuwe database zonder normen de facto of anderszins. Maar ik ben beginnen te veranderen van mijn tune — elke belangrijke data platform provider heeft nu een grafiekdatabase of API/motor.”
Bingo. Normen — de facto of anderszins. De technologie vooruitgang boekt, tot het punt waar nu met behulp van de grafiek op grote schaal haalbaar is. Maar het gaat om een stuk van de gevestigde taart zonder een manier om te kunnen samenwerken is een uitdaging. Vraag het maar aan de NoSQL menigte, die voornamelijk de vaststelling van SQL. Dus dit is waar W3C komt in..
Eigendom Grafieken en RDF, revisited
De W3C organiseerde een workshop over het Web standaardisatie voor de grafische gegevens die deze week in Berlijn, met het doel om zo veel van de grafiek van de gemeenschap samen om te bespreken en te komen tot mogelijke standaardisatie-inspanningen. De workshop was met name te danken, en gesponsord door Neo4j. Andere sponsors waren Oracle, Ontotext, en ArangoDB.
Ook: Van big data naar AI: Waar staan we nu, en wat is de weg vooruit?
Neo4j is de marktleider in grafiek databases, volgens de DB-Motoren index. We hadden een aantal gesprekken met Emil Eifrem, Neo4j ‘ s CEO, met inbegrip van vorige week, net voordat de W3C workshop, waarin Eifrem was onvermurwbaar: Standaardisatie is een topprioriteit voor de Neo4j.
De grafiek database landschap is versnipperd, met de eigenschap grafieken & RDF vertegenwoordigt verschillende manieren om het model, opslaan en opvragen van gegevens, met geen standaard manier van interoperabiliteit. Terwijl RDF is gestandaardiseerd, eigendom grafieken niet.
Dit is schadelijk voor de Grafiek database adoptie, en deskundigen, normalisatie-instellingen en leveranciers, allemaal gerealiseerd. De W3C Workshop over Web Standaardisatie voor de Grafiek Gegevens bracht een wie is wie van de graph databases in Berlijn dit probleem aan te pakken.
RDF is al ongeveer 20 jaar oud, in eerste instantie gedreven door onderzoek en de academische wereld. Gestart door WWW uitvinder Sir Tim Berners Lee ‘ s visie voor een Semantisch Web, RDF heeft een aanzienlijke stapel. Deze stack bevat dingen zoals redeneren en regels, en er zijn stabiele normen er voor een tijdje nu, met inbegrip van degenen voor serienummering, schema, en het opvragen van informatie.
Het probleem echter, is dat pragmatisme is niet altijd een kern van het probleem is, is er. Plus, tooling voor RDF is schaars en niet altijd makkelijk te gebruiken. Neem JSON-LD, bijvoorbeeld. De proppen komen met een standaard manier voor het serialiseren van RDF op basis van JSON, de meest populaire indeling voor web-ontwikkelaars, lijkt een no-brainer.
De combinatie van JSON-LD en schema.org waarschijnlijk heeft meer gedaan voor het verspreiden van het gebruik van RDF dan iets anders. Alleen het krijgen van Google en andere zoekmachines te nemen heeft geleid tot een scala van use cases. En toch, JSON-LD was zeer controversieel in zijn tijd in de RDF-gemeenschap. Dit was niet de laatste controverse de RDF gemeenschap geconfronteerd, maar het lijkt alsof de JSON-LD succes kan hebben gehad iets te leren. Maar wij zullen dat binnenkort.
Eigendom grafieken zijn er al ongeveer 10 jaar en zijn gedreven door de industrie. Als zodanig zou je kunnen zeggen, ze zijn een omgekeerd spiegelbeeld van RDF: Pragmatisme regels, tooling is er in overvloed en eenvoudig in gebruik, samenwerking en community building bieden de hoogste prioriteit, maar standaardisatie alleen kwam als een nabeschouwing op dit punt.
De meeste goederen grafiek oplossingen niet hebben van een schema, of hebben een zeer eenvoudig schema. Alleen het verkrijgen van gegevens in en uit de woning grafiek solutions is een oefening in geduld en improvisatie — geluk neerkomt op een grafiek structuur in de CSV-indeling en toewijzing van de oplossing. Er is geen standaard query-taal voor goederen grafieken. En er is niet zoiets als een abstract model, of semantiek, voor goederen grafieken op dit punt.
Een gravitatiegolf moment
Nu, dat is onherleidbaar. Voor de woning grafiek wereld, het bereiken van overeenstemming over wat gezond verstand serialisatie-formaat, met een synthese van de bestaande query talen, en het werken aan een woning grafiek model dat in staat zal stellen schema en semantiek definitie alle eruit redelijke stappen te nemen. Goed nieuws: Het lijkt erop dat is precies wat er in de agenda, zodat we kunnen verwachten dat deze stappen worden uitgevoerd.
Ook: Samenvloeiende toont open source paradigma verschuivingen, cloud, en het commerciële succes kan alle co-bestaan
Dus wat staat er op het spel voor de RDF wereld, waarin al die al bestaan? Een goed gerichte metafoor gebruikt in de W3C workshop voor het beschrijven van de status is die van een brug. Het bouwen van bruggen was het thema van het evenement. Het bouwen van bruggen tussen eigendom grafieken is één ding, maar hoe zit het slaan van bruggen tussen eigendom grafieken en RDF?
Tijdens het eigendom grafieken werk te doen in het bouwen van de pijlers voor de brug naar het RDF wereld, in RDF de pijlers zijn meestal er, behalve voor één ding: de verwerkelijking ervan. Als je niet in de RDF, verwerkelijking ervan is iets wat je hebt waarschijnlijk nog nooit van gehoord, en heb niet echt zorgen over. Maar het is de sleutel voor de bouw van de brug aan de woning grafiek wereld, en het lijkt alsof RDF is eindelijk dicht bij de afwikkeling.

Het bijwonen van de W3C workshop over grafiek standaardisatie is een interessante ervaring.
Verwerkelijking ervan is een mechanisme voor het toevoegen van eigenschappen aan RDF grafiek randen, waardoor ze rechtstreeks te vertalen zijn naar eigendom grafieken. Hoewel dit mogelijk is, tot nu toe is er niet één standaard, overeengekomen manier om dit te doen. RDF* is een voorstel hoe om dit te doen, geïntroduceerd in 2014, die is het krijgen van grip op de RDF-wereld.
Een van de uitkomsten van het W3C workshop was de vrijwel unanieme idee om dit te maken van de W3C-specificatie. Dit technisch, of red herring als sommige mensen noemen het, is afslaan van de RDF gemeenschap voor een lange tijd. Het kijken naar dit wezen eindelijk aan de zijlijn te staan, hopelijk voor een goede, doet denken aan het account gerenommeerde socioloog Harry Collins geeft op de zwaartekracht natuurkundige gemeenschap.
In zijn boek, Artifictional Intelligence, Collins begint aan een beschrijving van de manier waarop mensen betekenis construeren sociaal. Als een case-study, hij maakt gebruik van de zwaartekracht zoals gemeenschap, waar hij is ingesloten, en hun convergentie rond gravitatie golf experimenteel bewijs in 2015. Het kijken naar de RDF gemeenschap samenkomen rond RDF* is vergelijkbaar in veel opzichten.
Het is gewoon een grafiek maken van golven in de echte wereld
Het blijft te bezien of RDF* kan worden als cruciaal voor RDF en de grafiek op groot, als gravitatiegolven zijn voor de natuurkunde. Het potentieel en de dynamiek zijn er zeker, en de mensen in de W3C workshop lijken te hebben verlaten met de belofte om te blijven werken op die pilaren en bruggen.
Ook: het Begin van de reskilling revolutie zonder mij: de Toekomst van Werk trends en zachte gegevens op zachte vaardigheden
Ondertussen, echter, grafiek is het maken van golven in de echte wereld. In het einde, als Brad Bebee van AWS Neptunus het in zijn keynote, het is gewoon een grafiek. Gebruikers niet echt zorgen over de onderliggende technische; ze worden steeds up-to-speed met het feit dat “grafieken laten we integreren van gegevens als een gek.”
Neptunus is een cloud-based grafiek database van AWS, waarmee gebruikers zowel RDF en eigendom grafieken, en het zou enorm profiteren van het hebben van die bruggen. Als Bebee gewezen, Neptunus is een van de meest populaire AWS producten in 2018. Dit spreekt boekdelen, maar het is niet alles dat nieuw is in de grafiek database wereld.
Grafiek is het verkrijgen van de zwaartekracht, en het maken van golven, in de echte wereld.
Je hebt misschien gehoord over Neo4j de laatste subsidieronde: $80 miljoen euro, veruit de grootste investering in deze ruimte tot nu toe. De bespreking van het stappenplan voor het maken van de beste dit met Eifrem, drie prioriteiten werden benadrukt: Standaardisatie, ‘cloud’, en schaalvergroting. We hebben al uitgewerkt betreffende de normalisatie, dus laten we gewoon toevoegen dat er extra bruggen wordt nog gewerkt tot ISO en lopende SQL-inspanningen.
Maar wat over de cloud en schaalvergroting? Neo4j is niet voorzien van een managed cloud versie op dit punt. Dit is het krijgen van tafel stakes voor elk database-oplossing, Neo4j werkt. Eifrem zei een managed cloud versie van Neo4j gebaseerd op Kubernetes is momenteel in private beta, feedback is goed, en de algemene beschikbaarheid is binnenkort beschikbaar.
Plus, Neo4j zal het maken van een aanzienlijke hoeveelheid van de aanwervingen in de komende periode. De heel onaantrekkelijk, maar hard nodig inspanning om dit te doen en de schaal van het bedrijf, is wat het houden van Eifrem bezig. Dus niet dat veel glimmende nieuwe speelgoed te zien, voor nu, maar Eifrem gezinspeeld op meer van dit binnenkort. Ondertussen, echter, andere leveranciers zijn de intensivering van hun spel.
Case in point, RDF leveranciers het toevoegen van ondersteuning voor het eigendom van de grafieken. AWS heeft al deze, Cambridge Semantiek en Stardog zijn toe te voegen. Plus, multi-model ondersteunen, en JSON als onderdeel van dit is steeds een belangrijke functie voor tal van leveranciers. JSON-LD heeft de deur geopend, en in de afgelopen paar maanden leveranciers zoals AllegroGraph en Ontotext hebben ondersteuning toegevoegd voor JSON, ook. We zijn terug met meer diepgaande analyse van deze ruimte snel.
Vorige en aanverwante dekking:
Voor CockroachDB, transacties eerste, dan is google analytics is een functie — niet een bug
Een open-source database die is veerkrachtig, ondersteunt het automatisch geo-schalen van on-premise en in de cloud, en SQL. CockroachDB al is dat alles. Naast het stappenplan: Analytics, met Hybride Transactionele Analytical Processing.
Open source AI-chips maken van Groene Golven: het Brengen van de energie-efficiëntie te IoT architectuur
Wat als de machine learning applicaties op de rand van het mogelijke, op de grenzen van de grootte en de energie-efficiëntie? GreenWaves is dit te doen, gebaseerd op een open-source parallel ultra low power microprocessor architectuur. Hoewel het begin van de dag, de implicaties voor de IoT architectuur en energie-efficiëntie zou dramatisch zijn.
In 2019 zal nog een ‘Jaar van de Grafiek’: OpenCorporates is het bewijs No. 1
Grafiek zijn de databases crossing the chasm van reguliere use cases, het toevoegen van functies zoals machine learning aan hun arsenaal en steeds meer in de cloud en ontwikkelaar vriendelijk. Vorig jaar was het een breakout jaar, en de grafiek database groei en evolutie aan de gang is in 2019.
Verwante Onderwerpen:
Big Data Analytics
Innovatie
CXO
Kunstmatige Intelligentie
Enterprise Software
Opslag