Noll
Att förstå mer om diabetes är nyckeln till att behandla och förebygga sjukdom. Tysklands DZD centrum av diabetiker forskning använder grafdatabas teknik från Neo4j att lära sig mer om sjukdomen. ZDNet talade till DZD chef för data-och kunskapshantering, Dr Alexander Jarasch, för att ta reda på mer.
ZDNet: Kan du berätta för mig om din organisation?
Jarasch: Vi är en icke-vinstdrivande organisation som forskar på diabetes. Vi är inte att utveckla läkemedel, men är intresserad av forskning om förebyggande av diabetes och behandling av patienter med diabetes.
Vi kombinerar olika enheter eller för olika discipliner, vilket innebär att i sjukhus kopplar vi ihop grundforskning och lägga modeller till det. Och i denna forskning har vi använder diagram teknik.
Här i STORBRITANNIEN diabetes är kraftigt på uppgång, är det en liknande historia i Tyskland?
Det är liknande, som det är i USA. Ungefär 10 procent av befolkningen är diabetiker. Hos barn är det främst Typ 1-diabetes, och det var alltid antagit att det var äldre människor som haft Typ 2-diabetes. Men det visade sig att två tredjedelar av befolkningen med diabetes är i arbetsför ålder. Diabetes är en kritisk sjukdom för människor i arbetsför ålder. Personer med diabetes har mindre produktivitet, de är sjukt mycket tidigare, och de har massor av komplikationer som stroke eller hjärtinfarkt. Uppenbarligen är detta ett område där vi gör en hel del forskning.
Så där Neo4j programvara passar in i detta?
I biologi eller medicin, data är ansluten. Du vet att de enheter som är anslutna — de är beroende av varandra. Anledningen till att vi valde diagram teknik och Neo4j beror på att alla enheter är anslutna.
SE: Sensor skulle enterprise: IoT, ML, big data och (ZDNet särskild rapport) | Ladda ner rapporten som en PDF (TechRepublic)
Och vi har vår data i olika relationsdatabaser, men vi ville bygga ett nytt lager på toppen av dessa olika datamängder eller databaser för att få en mycket bredare kunskap om diabetes och att se den metabola sjukdomar från många olika perspektiv samtidigt.
Vilka särskilda aspekter av diabetes är det du tittar på?
Vi ansluter patienternas uppgifter, så vi har att förebygga och livsstil data ingripande från de kliniker. Vi har bio-prover-blodprov, urin, lever prover, njure prover och sånt. Då kan vi mäta specifika parametrar och djurmodeller som möss eller pre-diabetiker grisar. Sedan har vi alla de grundläggande forskning — genomik, lipidomics och så vidare. Så det finns alla typer av forskning kring specifika molekyl klasser.
Du uppenbarligen samla in en hel del data som täcker många områden. Hur gör du för att sätta upp det i en form som du kan använda?
Vi började med Neo4j ungefär ett år sedan och vi har försökt att ansluta dessa olika discipliner — sjukhus, grundläggande forskning, djurmodeller och så vidare. Vi försökte ansluta dem på ett mycket enkelt data modell som är giltig för alla olika discipliner och olika platser och vi försökte lära oss av dessa olika tekniker tillsammans på ett nytt sätt. För numera är en disciplin räcker inte längre att svara på en medicinsk fråga.

Dr Alexander Jarasch
Foto: DZD
Vilket område tycker du är mest intressant?
Personligen tycker jag att biomarkör resultaten är de mest intressanta. Du kan använda grafen teknik och mycket modern maskin-lärande metoder för att ge bättre förebyggande åtgärder eller behandlingar för patienter med diabetes. Det är vad som driver mig.
Den andra punkten — vad jag tycker är riktigt intressant-är att med graf-teknik kan du inte bara koppla data, men när jag tänker på våra läkare eller forskare som inte är vetenskapsmän, de tycker att det är mycket enklare att titta på data modeller. Det beror på att efter några korta praktiken de kan för att tolka data. Med grafen teknik är det mycket lätt att visualisera data. Vi använder visualisering i webbläsaren för Neo4j att visualisera data och upptäcka de områden som är kopplade till varandra. Användare som det eftersom det är så intuitiv.
Finns det andra aspekter som du tycker är särskilt bra?
Absolut. Särskilt när vi har dessa olika datapunkter från alla olika discipliner. Vi kan be graf: “Är någon av dessa noder som är kopplade till dessa olika noder?”
Det är mycket intressant, eftersom vissa av dessa relationer och kontakter som vi kan ha sett innan eller inte. I vissa fall är det som att länka hundratals Excel-ark eller relationella databaser till det.
Å andra sidan finns det områden där vi inte ser några anslutningar för data, men med grafen teknik det är så lätt att ansluta dem och hitta de kontakter eller relationer mellan dem.
Och detta är vad som gör det lätt eftersom så många diagram algoritmer är redan klar att använda, och du kan enkelt använda dem med [Neo4j] APOC Bibliotek eller olika chiffer frågor.
Vilka andra områden kan du använda det till?
Förutom vår organisation finns det fem andra tyska organisationer som studerar cancer, Alzheimers, infektionssjukdomar, lungsjukdomar och så vidare. Och det redan finns anslutningar mellan dessa olika sjukdomar. Och det är där du hitta kopplingar mellan Alzheimers och diabetes. Det finns också kopplingar mellan cancer och diabetes.
Vi vill också studera om en sjukdom som kommer. Där gör dessa komplikationer med diabetes kommer från och är de som rör Alzheimers sjukdom och andra komplikationer?
För detta utvecklar vi en liten prototyp med hjälp av naturligt språk bearbetning och detta är också ett mycket intressant ämne eftersom vi har en offentlig databas över peer-granskade artiklar. Det finns över 30 miljoner vetenskapliga artiklar från olika publikationer där. Naturligtvis, ingen i världen kan läsa allt detta-du kan inte vara up-to-date varje dag eller varje vecka. Så försöker vi att analysera de texter som enligt vår specifika, bio-medicinska frågor.
SE: Exomedicine anländer: Hur labs i rymden skulle kunna bana väg för hälso-och sjukvård genombrott på Jorden (cover story PDF)
Vi vill att analysera dessa texter automatiskt med behandling av naturligt språk och vi vill lära dig vissa specifika ord eller nyckelord som “gen”. Är det en gen som kallas ABC-co-förekommer i massor av texter samband med diabetes? Eller är det många gener som är co-nämns med cancer och diabetes?
När vi lär oss från dessa texter automatiskt, kan vi mata dem i vår graf för gener och proteiner och då kan vi skriva en rörledning för att studera frågor som: “Är denna gen som är relaterade till vissa uppgifter som vi har i vår organisation?”
Vi ansluter även till offentlig data med data som finns i vår organisation. Ibland, eller många gånger, denna information är skyddad genom GDPR så vi har patientdata att vi inte kan göra offentliga, men inom vår organisation kan vi länka denna data via diagram-teknik.
Detta är en hel del information. Har du någon uppfattning om storleken på de filer du arbetar med?
Det är en knepig fråga. Den minsta datamängder är en sak, men vi kan gå till vår stora filer, såsom hög upplösning microscopies, där ett dataset är mellan 40 och 200 GB, och vi har hundratals eller tusentals av dem.
Analytics i namn av medicin: grafdatabas kan visa länkar och vägar av miljontals av till synes orelaterade detaljer.
Foto: DZD
Mer på tekniken i vetenskaplig forskning
CSIRO engagerande Australier för energiforskning
Med energi som ett hett ämne i Australien, Commonwealth Scientific and Industrial Research Organisation (CSIRO) söker en bättre väg framåt för leverantörer och konsumenter.
Singapore universitet sätter upp $M 18.1 för att hjälpa studenter, forskare skapa startups
National University of Singapore (NUS) har lovat S$25 miljoner (US$18.18 miljoner euro) under fem år för att co-skapa 250 tech startups med sina doktorander och forskare.
Hur edge design och omvandlas marinbiologi forskning vid Oregon State University
Med den globala Internet of Things (IoT) marknaden förväntas överstiga $721bn fram till 2023, många organisationer kommer att vara att söka efter ett sätt att bearbeta alla sina IoT data snabbt, och på ett sätt som gör det möjligt för dem att uppnå verklig affärsnytta.
Google kan nu söka efter data. Första forskning, då världen?
Vad som brukade vara i sfären av forskare och nördar är nu brödet och smör av en ständigt växande utbud av professionella, organisationer och verktyg, för att inte tala self-service entusiaster.
Google DeepMind grundare Demis Hassabis: Tre sanningar om AI (TechRepublic)
En av skaparna av AI-forskning företaget känt för att bygga den banbrytande AlphaGo AI trollformler ut teknik genomslag och framtida utveckling.
Garvan Institute får ny superdator för genomisk forskning
Den Garvan Institute of Medical Research har meddelat att man kommer att få en ny high-performance computing (HPC) system för att stödja genetisk forskning och analys.
Forskare skapar mest kraftfulla inomhus för magnetiska fält, blåsa upp egna lab (CNET)
Titta på det nybyggda instrument går BANG, efter att generera ett magnetfält styrka på 1 200 teslas.
Relaterade Ämnen:
Digital Omvandling
Robotteknik
Sakernas Internet
Innovation
Affärssystem
CXO
0