Apple, Alibaba, Amazon, en de bende het bevorderen van de staat van de kunst, in AI, en het ontdekken van Kennis met Grafieken

0
93

Het benutten van evolutie met AI
Tonya Hall en Dr. James Veld, oprichter en CEO van LabGenius, praten over het proces van het benutten van evolutie door de kracht van AI om aangepaste DNA-moleculen.

Anchorage is misschien niet de meest goed bereikbare locatie in de wereld. Maar het blijkt dat, wanneer de mensen en de gegevens zijn goed aangesloten, locatie kunnen volgen. Anchorage was gastheer voor SIGKDD ‘ s Conference on Knowledge Discovery and Data Mining in 2019 of KDD, want het is algemeen bekend. De conferentie wordt georganiseerd door de Association for Computing Machinery (ACM)’s Special Interest Group on Knowledge Discovery and Data Mining (SIGKDD).

KDD is een van de meest bekende en populaire evenementen voor data science en AI, het aantrekken van ongeveer 3.500 onderzoekers in 2018 in Londen. Hoewel de beslissing om de host KDD 2019 in Anchorage zorgde voor wat betreft de deelname niet echt de druppel.

De 25-incarnatie van de KDD was een “wie is wie” in gegevens wetenschap en AI. KDD is opgezet door mensen die in de wetenschap en de AI voordat ze kregen hun huidige monikers en trok brede aandacht.

KDD is een ontmoetingsplaats voor onderzoek en industrie. Mensen die hun werk in KDD gaan vaak door die draaideur, met een aantal van hen dragen beide hoeden op hetzelfde moment. Case in point, de KDD toegepast gegevens wetenschap uitgenodigde sprekers track, met gegevens wetenschappers van de wil van Airbnb, Alibaba, Amazon, Apple, Facebook, Google, NASA, LinkedIn en Microsoft.

Het doel was om uit te nodigen zeer invloedrijke sprekers die hebben direct bijgedragen aan het succes van data mining toepassingen in hun respectievelijke velden. Kijkend naar de onderwerpen opgepikt door de sprekers, evenals KDD procedure, een thema begon te ontstaan.

Een van de dingen die lijken te worden “top of mind” voor deze mensen is het verleggen van de grenzen van diep leren. Deze vorm van machine learning heeft bereikt grote prestaties in de laatste paar jaar. Veel AI-onderzoekers geloven diep leren op zijn eigen zal nooit veel meer dan geavanceerde patroonherkenning: Geweldig voor gezichtsherkenning of vertaling, maar kort van ware intelligentie.

Apple integreert domein kennis in de diepe leren

Ruslan Salakhutdinov, directeur van AI onderzoek bij Apple en professor in de informatica, in de afdeling van machine learning aan de Carnegie Mellon University (CMU), gericht op dit onderwerp in zijn presentatie: het Integreren van Domein Kennis in de Diepe Leren.

De voorstelling, gebaseerd op Salakhutdinov de opmerkingen van CMU, onderzocht op welke manieren domein kennis in machine learning model architectuur en algoritmen. Drie klassen van domein kennis werden beschouwd: relationele, logische en wetenschappelijke kennis.

Logische kennis verwijst naar wat formeel heet propositional en eerste-orde logica, of in eenvoudiger termen,-op regels gebaseerde-redenering: E. g., als een object is een vleugel en een snavel, het is een vogel. Wetenschappelijke kennis, zoals Newton ‘ s Wetten van Beweging, is gecodeerd in meer complexe manieren, zoals partiële en stochastische differentiaalvergelijkingen.

Relationele kennis verwijst naar eenvoudige relaties tussen entiteiten, zoals (vader, Bob, Alice). Dit type kennis is beschikbaar via relationele databases of kennis van grafieken. Het is mogelijk het eenvoudigste, vergeleken met logische en wetenschappelijke kennis, maar dat maakt het niet eenvoudig op te nemen in machine learning.

Een deel van Salakhutdinov de presentatie gericht op begrijpend lezen en natural language processing (NLP). De huidige stand van de kunst in NLP combineert technieken handelen op ongestructureerde data (tekst) met technieken transformeren naar gestructureerde data (kennis grafieken).

Embeddings een van die technieken, in eerste instantie gebruikt voor tekst, nu ook uitgebreid en aangepast aan de grafieken. Het idee in embeddings, is de weergave van een hogere orde, structuur, machine learning algoritmen niet rechtstreeks, van een lagere orde, vector structuur die gebruikt kunnen worden door de machine learning.

Er zijn vele manieren om dit te doen, maar uiteindelijk in de tekst, als in grafieken, het doel is om in kaart soortgelijke ingangen naar soortgelijke vector waarden. Werk gepresenteerd in KDD door IBM Research en Huawei was bedoeld om de vooraf state of the art in grafiek embeddings.

Alibaba bouwt een uitgebreide grafiek neurale netwerk platform

Een andere gastspreker uitgenodigd voor KDD was Hongxia Yang, Senior Staff Gegevens Wetenschapper en Bestuurder in Alibaba Group. Yang ‘ s presentatie gericht op AliGraph, een Uitgebreide Grafiek Neurale Netwerk Platform.

Zoals opgemerkt in Alibaba ‘ s werk, een toenemend aantal van machine learning taken vereist het omgaan met grote grafiek datasets, die capture rijke en complexe relaties tussen potentieel miljarden elementen. Grafiek Neurale Netwerken (GNN) een effectieve manier om de grafiek learning probleem.

GNNs zijn neurale netwerken die werken rechtstreeks op de Grafieken. Een typische toepassing van GNN knooppunt classificatie: Elk knooppunt in een grafiek is gekoppeld aan een label, en het doel is om te voorspellen het label van de knooppunten zonder de grond-waarheid. Om te werken met GNNs -, data-wetenschappers eerst om te zetten in grafieken te belending matrixen, het houden van zowel structurele en materiële informatie zoveel mogelijk intact.

media-users-user-38794-project-341526-images-x2.png

Alibaba heeft gebouwd AliGraph, een Uitgebreide Grafiek Neurale Netwerk Platform, waardoor het de meest geavanceerde infrastructuur voor het uitvoeren van grafiek op basis van deep learning applicaties. Afbeelding: Alibaba

Echter, het leveren van efficiënte grafiek opslag en berekening mogelijkheden te vergemakkelijken GNN training en maken de ontwikkeling van nieuwe GNN algoritmen is een uitdaging. Yang gepresenteerd AliGraph, een uitgebreide grafiek neurale netwerk systeem, dat bestaat uit verspreid grafiek opslag, geoptimaliseerd sampling-exploitanten en runtime.

Het systeem wordt momenteel ingezet op Alibaba ter ondersteuning van een verscheidenheid van scenario ‘s, met inbegrip van het product aanbeveling en gepersonaliseerde zoeken op Alibaba’ s E-Commerce platform. Het kan efficiënt ondersteunen niet alleen de bestaande populaire GNNs, maar ook een reeks in-house ontwikkeld die voor verschillende scenario ‘ s.

Experimenten op een real-world dataset met 492.90 miljoen hoekpunten, 6.82 miljard randen, en de rijke eigenschappen toon AliGraph voor het uitvoeren van een orde van grootte sneller dan de bestaande werk op het vlak van grafiek gebouw: Vijf minuten versus de gerapporteerde uren van de state-of-the-art PowerGraph platform. Bij de opleiding, AliGraph loopt 40% tot 50% sneller en toont ongeveer 12-voudige snelheid met de verbeterde uitvoering.

Alibaba gebruikt grafiek partitioneren, gescheiden opslag van attributen en caching buren van belangrijke hoekpunten overwinnen van de uitdagingen voor een efficiënte grafiek toegang, vooral in een gedistribueerde omgeving van clusters. Deze zeer dichte werk schetst toekomstige richtingen in het nastreven van GNNs met meer mogelijkheden, snelheid en nauwkeurigheid, en het toevoegen van Auto-ML-functionaliteit.

Veel van de bovenstaande klinkt misschien exotisch. Exotische of niet, maar de gevolgen ervan, wanneer deze worden gebruikt in de echte wereld, zijn nogal fors. AliGraph betekent dat Alibaba lijkt te hebben momenteel de meest geavanceerde infrastructuur voor het uitvoeren van GNN toepassingen. GENI betekent dat Amazon kan het identificeren van belangrijke knooppunten in de knowledge graph beter dan wie dan ook.

Apple ‘ s ambitie in het integreren van verschillende soorten kennis in de diepe leren kan betekenen dat zij de eerste om vooraf de eenwording van diep leren en symbolische AI meer dan iemand anders. En de lijst is nog niet hier — van visionair frameworks zoals Apple om meer use-case-gerichte toepassingen.

Snapchat is met een Actie Grafiek te karakteriseren en de weersverwachting voor betrokkenheid van de gebruiker. Baidu is het gebruik van een knowledge graph van job vaardigheden, Vaardigheid-Grafiek, gebouwd voor uitgebreid met het modelleren van de relevante competenties die getoetst dient te worden in sollicitatiegesprekken. Alibaba, weer, genereert gepersonaliseerde product beschrijvingen combineren van neurale netwerken en de Chinese DBpedia knowledge base.

Wie zou gedacht hebben: Kennis op basis van R&D in China zal de wereld regeren

In een notendop, grafiek-en knowledge-based onderzoek en ontwikkeling zijn booming. Een snelle telling in KDD de procedure is te vertellen. Meer dan 300 kranten zijn veel, en we hadden slechts een overbodig te kijken naar een paar dat ons oog op viel. Maar ongeveer 20% van de 300+ – publicaties lijken te betrekken grafieken en kennis-gebaseerde systemen.

Er was iets anders dat ook onze interesse gewekt: de rijkdom van de bijdragen van China. Niet alleen Chinese organisaties, sommige die we hierboven vermeld, maar ook de Chinese onderzoekers in niet-Chinese organisaties. Dit lijkt voor het valideren van de meningen van de deskundigen: China groeit snel in de AI, ook, en is nu Nummer 1 als het nog niet.

Een ding hebben we gemerkt, hoewel nauwelijks origineel: De wisselwerking tussen onderzoek en industrie. Zoals al eerder opgemerkt, veel van het werk is gepubliceerd in KDD was een gezamenlijke inspanning waarbij het onderzoek en de industrie. En vaker wel dan niet, de onderzoekers, hetzij het schip springen op de industrie of werk in zowel het onderzoek en de industrie. Aan de ene kant, dit strips onderzoek van haar talent; aan de andere, het brengt ethos en strengheid voor de industrie.

Deze trends hebben een gemeenschappelijk kenmerk: Ze lijkt niet erg waarschijnlijk voor de meeste mensen slechts een paar jaar terug. Wie zou gedacht hebben: Kennis op basis van R&D in China lijkt zich om de wereld te regeren.

Big Data

De subtiele kunst van het echt big data: Recursie Pharma kaarten het lichaam

De gegevens en AI markt landschap 2019: De volgende golf van hybride ontstaat

Digitale transformatie: Hoe een bank is met de AI, big data en chatbots maken van nieuwe services

Hoe data management werkt bij de NASA (ZDNet YouTube)

Het opzetten van uw nieuwe iPhone is nooit gemakkelijker geweest dan dit (CNET)

Gegevens wetenschappers: Verdien de hoogste salaris in deze 5 steden (TechRepublic)

Verwante Onderwerpen:

Innovatie

Digitale Transformatie

CXO

Het Internet van Dingen

Enterprise Software

Smart Cities