Utnyttja utvecklingen med AI
Tonya Hall och Dr. James Området, grundare och VD för LabGenius, tala om arbetet med att utnyttja utvecklingen genom kraften av AI för att skapa egna DNA-molekyler.
Anchorage är kanske inte den mest väl-ansluten plats i världen. Men som det visar sig, när människor och data är väl-ansluten, plats kan följa. Anchorage var värd att SIGKDD Konferens på Kunskap och Data Mining 2019 eller KDD som det ofta kallas. Konferensen arrangeras av Association for Computing Machinery (ACM)’s Special Interest Group on Knowledge Discovery och Data Mining (SIGKDD).
KDD är en av de mest kända och populära evenemang för data vetenskap och AI, lockar runt 3.500 forskare 2018 i London. Även om beslutet att ta emot KDD 2019 i Anchorage orsakat en del farhågor, närvaro inte riktigt släppa.
Den 25: e inkarnationen av KDD var en “vem är vem” i data-vetenskap och AI. KDD bildades av människor som har varit i data-vetenskap och AI innan de fick sina nuvarande monikers och väckte stor uppmärksamhet.
KDD är en mötesplats för forskning och näringsliv. Människor som visar sitt arbete i KDD ofta gå genom de roterande dörrarna, med några av dem bär både hattar på samma gång. Den KDD data tillämpad vetenskap inbjudna talare spår, med data forskare från lik av Airbnb, Alibaba, Amazon, Apple, Facebook, Google, NASA, LinkedIn och Microsoft.
Målet var att bjuda in mycket inflytelserika talare som har direkt bidragit till framgångsrika data mining-applikationer inom sina respektive områden. Tittar på de ämnen som plockas av dessa högtalare, samt KDD förfarande, ett tema som började växa fram.
En av de saker som verkar vara top of mind för dessa människor tänjer på gränserna för djupt lärande. Denna form av lärande har nått stora framgångar under de senaste åren. Många AI-forskare som tror djupt att lära på sitt eget aldrig kommer att bli mycket mer än avancerade mönster erkännande: Bra för ansiktsigenkänning eller språk översättning, men kort av sann intelligens.
Apple integrerar domän kunskap i djupa lärande
Ruslan Salakhutdinov, chef för AI-forskning på Apple och professor i datavetenskap vid institutionen för lärande vid Carnegie Mellon University (CMU), fokuserade på detta ämne i sin presentation: att Integrera Domän Kunskap i Djupa Lärande.
Presentationen bygger på Salakhutdinov anteckningar från CMU, utforskas metoder för att införliva domän kunskap i machine learning model arkitekturer och algoritmer. Tre klasser av domänen kunskap ansågs: relationsdatabaser, logisk och vetenskaplig kunskap.
Logisk kunskap hänvisar till vad som formellt kallas uttrycker propositionella och första ordningens logik, eller i enklare termer, regelbaserade resonemang: E. g., om ett objekt har en vinge och en näbb, det är en fågel. Vetenskaplig kunskap, såsom Newtons rörelselagar, som är kodad i ett mer komplext sätt, såsom partiella och stokastiska differentialekvationer.
Relationell kunskap hänvisar till enkla relationer mellan entiteter, till exempel (far, Bob, Alice). Denna typ av kunskap som är tillgänglig via relationsdatabaser eller kunskap grafer. Det kan vara den enklaste, jämfört med logiska och vetenskapliga kunskaper, men som inte gör det enkelt att integrera i maskininlärning.
En del av Salakhutdinov presentation fokuserar på läsförståelse och natural language processing (NLP). Den nuvarande state of the art i NLP kombinerar tekniker som agerar på ostrukturerad data (text) med tekniker för att omvandla det till strukturerad data (kunskap grafer).
Embeddings är en av dessa tekniker, som initialt användes för att sms: a, nu också utvidgas och anpassas till grafer. Tanken i embeddings är att representera en högre ordningens struktur, som maskinlärande algoritmer kan inte processen direkt, till en lägre ordning, vektor struktur som kan användas av maskininlärning.
Det finns många sätt att göra detta, men i slutändan i texten, i diagrammen målet är att kartlägga liknande ingångar till liknande vektor värden. Arbetet presenteras i KDD av IBM: s Forskning och Huawei var tänkt att avancera state of the art i grafen embeddings.
Alibaba bygger en omfattande diagram neurala nätverk plattform
En annan inbjuden talare för KDD var Hongxia Yang, Senior Personal Data Scientist och Direktör i Alibaba Group. Yang presentation fokuserade på AliGraph, en Omfattande Diagram Neurala Nätverk Plattform.
Som påpekas i Alibaba ‘ s arbete, och ett ökande antal machine learning uppgifter kräver att hantera med stor graf datamängder, som fånga rika och komplexa relationer mellan potentiellt miljarder element. Diagram Neurala Nätverk (GNN) blir ett effektivt sätt att ta itu med grafen lärande problem.
GNNs är neurala nätverk som verkar direkt på Grafer. En typisk tillämpning av GNN är nod klassificering: Varje nod i en graf är associerad med en etikett, och målet är att förutsäga märkningen av noder utan mark-sanningen. Att arbeta med GNNs, data forskare först konvertera grafer för att sammanlänkning matriser, hålla både strukturella och information intakt så mycket som möjligt.

Alibaba har byggt AliGraph, en Omfattande Diagram Neurala Nätverk Plattform, vilket ger den mest avancerade infrastruktur för att köra grafen-baserade djupt lärande program. Bild: Alibaba
Men att ge effektiv diagram lagring och beräkning funktioner för att underlätta GNN utbildning och möjliggör utveckling av nya GNN algoritmer är utmanande. Yang presenteras AliGraph, en omfattande diagram neurala nätverket, som består av distribuerade diagram lagring, optimerad provtagning aktörer, och körning.
Systemet är för närvarande tillämpas på Alibaba för att stödja en mängd olika scenarier, inklusive produkt rekommendation och personlig sökning på Alibaba ‘ s E-handelsplattform. Det kan på ett effektivt stöd inte bara befintliga populära GNNs, men också en serie av internt utvecklade för olika scenarier.
Experiment på en verklig dataset med 492.90 miljoner hörn, 6.82 miljarder kanter, och rika attribut visa AliGraph att utföra en storleksordning snabbare än det nuvarande arbetet i form av diagram byggnad: Fem minuter kontra timmar rapporteras från state-of-the-art PowerGraph plattform. Vid utbildning, AliGraph går 40% till 50% snabbare och visar runt 12-tiden hastighet upp med den förbättrade runtime.
Alibaba använder diagram partitionering, separat lagring av attribut och caching grannar viktigt hörn för att övervinna utmaningar för effektiv diagram tillgång, särskilt i en distribuerad miljö med kluster. Den mycket täta arbete beskriver framtida riktningar i det fortsatta GNNs med mer precision, snabbhet och noggrannhet, och lägga till Auto-ML funktionalitet.
Mycket av ovanstående kan låta ganska exotiska. Exotiska eller inte, men deras konsekvenser, när det används i den verkliga världen, är ganska betydande. AliGraph innebär att Alibaba verkar för närvarande har den mest avancerade infrastruktur för att köra GNN-program. GENI innebär att Amazon kan identifiera viktiga noder i sin knowledge graph bättre än någon annan.
Apple har som ambition att integrera olika typer av kunskap till djupt lärande kan innebära att de är de första att avancera enandet av djupt lärande och symbolisk AI längre än någon annan. Och listan tar inte slut här-från visionära ramar som Apples mer om applikationer.
Snapchat är med hjälp av en Åtgärd Diagram för att beskriva och förutse användarnas engagemang. Baidu är med hjälp av en knowledge graph av kompetens, Skicklighet-Graf, byggd för omfattande modellering relevanta kompetenser som ska bedömas i anställningsintervjuer. Alibaba, igen, genererar personlig produkt beskrivningar kombinera neurala nätverk och den Kinesiska DBpedia knowledge base.
Vem skulle ha trott: kunskapsbaserad R&D tillverkade i Kina kommer att styra världen
I ett nötskal, graf-och kunskapsbaserad forskning och utveckling blomstrar. En snabb räkning i KDD arbete är talande. Mer än 300 papper är en hel del, och vi hade bara en överflödig titta på ett par som fångade våra ögon. Men ca 20% av de 300+ publikationer tycks innebära grafer och kunskapsbaserade system.
Det var något annat som också väckt vårt intresse: den rikedom av bidrag från Kina. Inte bara Kinesiska organisationer, något som vi nämnde ovan, men också Kinesiska forskare i icke-Kinesiska organisationer. Detta verkar bekräfta expertutlåtanden: Kina växer snabbt i AI, alltför, och är inställd på att bli Nr 1 om det inte redan finns.
En sak som vi märkt, men knappast original: samspelet mellan forskning och industri. Som vi konstaterade tidigare, mycket av det arbete som publicerades i KDD var ett gemensamt projekt som rör forskning och industri. Och mer ofta än inte, forskare antingen hoppa skepp till industrin eller arbete inom både forskning och industri. Å ena sidan, denna remsor forskning av sin talang, på den andra, det ger grundsyn och intresse för branschen.
Dessa trender har en gemensam egenskap: att De inte verkar mycket sannolikt att uppstå för de flesta människor, bara några år tillbaka. Vem skulle ha trott: kunskapsbaserad R&D tillverkas i Kina ser ut att styra världen.
Big Data
Den subtila konsten att verkligen big data: Rekursion Pharma kartor kroppen
Data och AI marknaden landskap 2019: The nästa våg av hybrid framträder
Digital förvandling: Hur en bank är med hjälp av AI, big data och chatbots för att skapa nya tjänster
Hur data management arbetar på NASA (ZDNet YouTube)
Att ställa in din nya iPhone har aldrig varit enklare än så här (CNET)
Data forskare: att Tjäna den högsta lönen i dessa 5 städer (TechRepublic)
Relaterade Ämnen:
Innovation
Digital Omvandling
CXO
Sakernas Internet
Affärssystem
Smarta Städer