Nul
At forstå mere om diabetes er nøglen til behandling og forebyggelse af sygdommen. Tysklands DZD centrum af diabetisk forskning er at bruge graph database-teknologi fra Neo4j for at lære mere om sygdommen. ZDNet talte til DZD er leder af data og knowledge management, Dr. Alexander Jarasch, for at finde ud af mere.
ZDNet: Kan du fortælle mig om din organisation?
Jarasch: Vi er en non-profit organisation, der laver forskning på diabetes. Vi er ikke udvikling af lægemidler, men er interesseret i forskning i forebyggelse af diabetes og behandling af diabetiske patienter.
Vi kombinerer de forskellige enheder eller forskellige discipliner, hvilket betyder, at der på hospitaler vi forbinder grundlæggende forskning og tilføje modeller til det. Og i denne forskning, vi bruger graf teknologi.
Her i UK, sukkersyge er kraftigt stigende, er det en lignende historie i Tyskland?
Det er det samme, som det er i USA. Omkring 10 procent af befolkningen er diabetikere. I børn, det er for det meste Type 1-diabetes, og det var altid antaget, at det var ældre mennesker, som havde Type 2-diabetes. Men det viste sig, at to tredjedele af befolkningen, der har diabetes, er af den erhvervsaktive alder. Diabetes er en kritisk sygdom for personer i den erhvervsaktive alder. Personer med diabetes har en mindre produktivitet, at de bliver syge på et meget tidligere tidspunkt, og de har masser af komplikationer, såsom slagtilfælde eller hjerteanfald. Det er klart, at dette er et område, hvor vi gør en masse af forskning.
Så hvor er Neo4j ‘ s software, der passer ind i dette?
I biologi eller medicin, data er tilsluttet. Du ved, at enheder, der er tilsluttet — de er afhængige af hinanden. Grunden til at vi valgte graf teknologi og Neo4j er fordi alle de enheder, der er tilsluttet.
SE: Sensoren vil virksomheden: IoT, ML, og big data (ZDNet særlige rapport) | Download rapporten som PDF (TechRepublic)
Og vi har vores data i forskellige relationelle databaser, men vi ønskede at bygge et nyt lag på toppen af disse forskellige datasæt eller databaser for at få en meget større viden om diabetes og til at se den metaboliske sygdomme fra mange forskellige perspektiver på samme tid.
Hvilke særlige aspekter af diabetes kigger du på?
Vi forbinder patienternes data, så vi har forebyggelse og livsstil intervention data fra klinikkerne. Vi har bio-prøver — prøver af blod, urin, lever prøver, nyre prøver og den slags ting. Så vi kan måle specifikke parametre og dyre-modeller som mus eller pre-diabetic svin. Så vi har alle de grundlæggende forskning — genomforskning, lipidomics, og så videre. Så det er alle typer af forskning omkring specifikke molekyle klasser.
Du selvfølgelig samle en masse af data, der dækker en masse områder. Hvordan kan du bringe det ned i en form, som du kan bruge?
Vi startede med Neo4j omkring et år siden, og vi forsøgte at forbinde disse forskellige discipliner — hospitaler, grundlæggende forskning, dyr, modeller og så videre. Vi forsøgte at forbinde dem på en meget enkel data model, der er gyldig for alle de forskellige discipliner og forskellige steder, og vi forsøgte at lære fra disse forskellige teknikker, sammen på en ny måde. Fordi i dag en disciplin er ikke længere tilstrækkeligt at besvare et biomedicinsk spørgsmål.

Dr. Alexander Jarasch
Foto: DZD
Hvilket område vil du finde de mest interessante?
Personligt, tror jeg den biomarkør resultater er de mest interessante. Du kan bruge grafen teknologi og meget moderne machine-learning teknikker til at give bedre forebyggelse eller behandling af diabetiske patienter. Det er, hvad der driver mig.
Det andet punkt, — hvad jeg synes er virkelig spændende-er, at med graf-teknologi du kan ikke kun oprette forbindelse til data, men når jeg tænker på, om vores læger eller forskere, der ikke er dataloger, de finder det meget lettere at se på data modeller. Det er fordi efter nogle korte praksis, de er i stand til at afkode data. Med graph-teknologi er det meget nemt at visualisere data. Vi bruger visualisering browser Neo4j for at visualisere data og finde de områder, der er forbundet til hinanden. Brugere kan lide det, fordi det er så intuitivt.
Er der andre aspekter, som du finder særligt nyttigt?
Helt. Især når vi har disse forskellige data point fra alle de forskellige discipliner. Vi kan bede om grafen: “der Er nogen af disse knuder er forbundet til disse forskellige noder?”
Det er meget interessant, fordi nogle af disse relationer og forbindelser, som vi måske har set før, eller ikke. I nogle tilfælde er det som forbinder hundreder og atter hundreder af Excel-ark eller relationelle databaser til det.
På den anden side, er der områder, hvor vi ikke kan se nogen forbindelser af data, men med graf teknologi det er så let at forbinde dem, og finde forbindelser eller relationer mellem dem.
Og det er det, der gør det nemt, fordi så mange graf algoritmer er allerede klar til brug, og du nemt kan bruge dem med [Neo4j] APOC Biblioteker eller forskellige cipher forespørgsler.
Hvilke andre områder, kan du bruge det til?
Udover vores organisation, at der er fem andre tyske organisationer studere kræft, Alzheimers, smitsomme sygdomme, lungesygdomme og så videre. Og der er allerede forbindelser mellem disse forskellige sygdomme. Og det er her du finder forbindelser mellem Alzheimers og diabetes. Der er også forbindelser mellem kræft og diabetes.
Vi vil også undersøge, hvor sygdommen kommer fra. Hvor kommer disse komplikationer med diabetes kommer fra, og er de er relateret til Alzheimers og andre komplikationer?
Til dette har vi udvikle en lille prototype ved hjælp af naturligt sprog forarbejdning og dette er også et meget interessant emne, fordi vi har en offentlig database af peer-reviewed artikler. Der er over 30 millioner videnskabelige elementer fra forskellige publikationer, der er der. Selvfølgelig, ingen i verden kan læse alt dette — du kan ikke være up-to-date hver dag eller hver uge. Så forsøger vi at analysere de tekster, i henhold til vores specifikke, bio-medicinske spørgsmål.
SE: Exomedicine ankommer: Hvordan labs i rummet kunne bane vejen for sundhedsydelser gennembrud på Jorden (cover story PDF)
Vi ønsker at analysere disse tekster automatisk med naturligt sprog forarbejdning og vi ønsker at lære nogle bestemte ord eller nøgle ord som “gen”. Er der et gen kaldet ABC co-optræder i masser af tekster, der er forbundet med diabetes? Eller er der for mange gener, der er co-nævnt med kræft og diabetes?
Når vi lære fra disse tekster automatisk, kan vi fodre dem ind i vores graf for gener og proteiner, og så kan vi skrive en rørledning til at undersøge spørgsmål som: “Er dette gen relateret til nogle data, som vi har i vores organisation?”
Vi har også kontakt til offentlige data med data, der er i vores organisation. Nogle gange eller mange gange, disse oplysninger er beskyttet af GDPR så vi har patientens data, at vi ikke kan gøre offentlige, men inden for vores organisation, som vi kan linke til disse data via graf teknologi.
Dette er en masse information. Har du nogen idé om størrelsen af de filer, du har med at gøre?
Det er et tricky spørgsmål. Den mindste datasæt, der er en ting, men at vi kan gå til vores store filer, såsom høj opløsning microscopies, hvor det ene datasæt er mellem 40 og 200 GB, og vi har hundredvis eller tusindvis af dem.
Analytics i navn på medicin: Graf-database kan vise links og forbindelser af millioner af tilsyneladende uafhængige oplysninger.
Foto: DZD
Mere om teknologi i videnskabelig forskning
CSIRO engagerende Australierne for energiforskning
Med energi et varmt emne i Australien, Commonwealth Scientific og Industrial Research Organisation (CSIRO) er på udkig efter en bedre vej frem for udbydere og forbrugere.
Singapore universitet lægger op til $18.1 M for at hjælpe studerende, forskere skabe nystartede
National University of Singapore (NUS) har lovet S 25 millioner dollar (US$18.18 millioner kroner) over fem år for at co-create 250 tech startups med sine studerende og videnskabelige medarbejdere.
Hvordan kant computing forvandlet marinbiologisk forskning på Oregon State University
Med det globale Internet of Things (IoT) marked forventes at overstige $721bn i 2023, er mange organisationer vil være søger efter en måde til at behandle alle deres IoT data hurtigt, og på en måde, der giver dem mulighed for at opnå reelle forretningsmæssige værdi.
Google kan nu søge efter datasæt. Første forskning, så er verden?
Hvad bruges til at være rige forskere og teknikere er nu brød og smør af en stadigt voksende vifte af fagfolk, organisationer og værktøjer, for ikke at nævne self-service-entusiaster.
Google DeepMind grundlægger Demis Hassabis: Tre sandheder om AI (TechRepublic)
En af skaberne af AI-forskning selskab, som er berømt for at opbygge banebrydende AlphaGo AI ekspliciterer den teknologi indvirkning og fremtidige udvikling.
Garvan Institute får nye supercomputer for genom-forskning
Den Garvan Institute of Medical Research har meddelt, at den vil blive modtaget en ny high-performance computing (HPC) system til støtte for genom-forskning og analyse.
Forskere skabe mest magtfulde indendørs magnetfelt, sprænge egne lab (CNET)
Se som nybygget instrument går BANG, efter at generere et magnetisk feltstyrke på 1.200 tesla.
Relaterede Emner:
Digital Transformation
Robotteknologi
Tingenes Internet
Innovation
Virksomhedens Software
CXO
0