Nul
I 2025 er det anslået, at 50 procent af verdens befolkning vil have haft deres genom sekventeret, som i henhold til Commonwealth Scientific og Industrial Research Organisation (CSIRO) transformerende bioinformatik team leader Dr. Denis Bauer betyder, at genomiske data vil blive større end de data, der opbevares af Twitter, YouTube og astronomi kombineret.
Genomics er studiet af oplysninger, der er kodet ind i en persons DNA, gør det muligt for forskerne at studere, hvordan gener betydning for sundhed og sygdom.
Genomet har en plan for hver celle i en persons krop, og med så mange oplysninger, der er kodet i genomet, det kommer ikke som nogen overraskelse, Australien ‘ s peak research organisation investerer kraftigt i at udforske dens muligheder.
Tale ved AWS Offentlige Sektor-Topmødet i Canberra på onsdag, Bauer detaljeret, hvordan CSIRO bruger Amazon Web Services infrastruktur til at bygge en genomisk program, der for blot et par år siden ville have syntes umuligt.
Hun sagde genomics producerer en svimlende 20 exabytes data per år, som også noterer sig, hvordan så store mængder af data, der bringer om tre vigtigste problemer.
“En af tekniske problemer er, at de store mængder af data, er det ikke trivielt at få fat i, specielt når vi taler om 40 gigabyte per genom, per person,” forklarede hun.
“Vi oplever også, burstable arbejdsmængder, hvor klinikere kan få adgang til denne ressource på samme tid som 10.000 andre klinikere, men i næste øjeblik kan falde til ingenting, så derfor har vi ikke ønsker at betale for en arbejdsbyrde, der kan crunch, at meget data, og så næste gang der er intet, det er bare at sidde tomgang.
“Tredje problem er, at konsolidere data fra siloer.”
Med privatliv regler mellem forskellige jurisdiktioner, Bauer sagde, at det er usandsynligt, at der kommer til at være en konsolidering af verdens genomiske data i én enkelt enhed. Hun sagde derfor, der beskæftiger sig med distribuerede systemer bliver nødt til at være noget, de involverede vænne sig til.
Den transformative bioinformatik Bauer team, der fører har chartret til at udvikle nye bioinformatiske løsninger til forskning og industri ved hjælp af det nyeste inden for cloud-og BigData infrastruktur.
Det, der specifikt fokuserer på befolkningen-skala analyse af genomics, transcriptomics, og methylomics, samt genom tekniske applikationer.
Arbejder for e-research program inden CSIRO, som er den største digital sundhed agenturet i Australien, Bauer sagde holdene er fokuseret på, hvordan sundhedsvæsenet kan forbedres gennem brug af digitale teknologier og tjenester.
Den CSIRO udgivet sin Fremtidige Sundhed [PDF] rapport i denne uge, som skitserede de organisationer, som 15-årig vision for sundhedsvæsenet i Australien.
Som titlen på den rapport, der forklarer de vigtigste idé af CSIRO er ved at Flytte Australien fokus fra sygdom, behandling, sundhed og trivsel management.
“En af de største beskeder fra dette var, at vi er nødt til at stoppe med at være reaktiv, behandle sygdomme, til at være forebyggende og fange sygdomme, før de faktisk bliver symptomatisk og et af de centrale temaer, der blev digital sundhed,” Bauer tilføjet.
Et andet tema i rapporten blev præcision medicin, og for at opfylde denne vision Bauer sagde CSIRO har udviklet VariantSpark, som er et Hadoop/Spark machine learning bibliotek for genomisk analyse af data.
“Det er bygget på Apache core, og hvad du kan gøre, er at du kan dreje op en Apache gnist klynge til at analysere dine data direkte på AWS,” forklarede hun.
“At bringe de oplysninger, som vi har fundet på de genom i den aktuelle kliniske praksis og træffe beslutninger om at det ikke er trivielt, og for at vi udviklet GenPhen-Insight, som er et værktøj, der kombinerer medicinske data, med genomiske data til at forbedre i real-time, behandling, diagnosticering og behandling af resultater og anbefalinger.
“Specielt designet til skalering til den voksende brug af genomiske data i fremtiden.”
VariantSpark bruger AWS Lambda, en on-demand serverless computing service og CSIRO er genomisk filer er alle placeret i en datalake på S3.
Se også: AWS Lambda: smart person ‘ s guide (TechRepublic)
“Vi startede ud med en infrastruktur, og derefter finjusteret, er det for at få bedre ydeevne og gøre den analyse, vi ønskede at gøre,” Bauer sagde. “Jeg er overbevist om, at når du går serverless du aldrig gå tilbage.
“Hastigheden på innovation er utrolig — du kan stå op et minimum viable product i et par sekunder, og med minimale omkostninger, og du behøver ikke at tænke på den underliggende infrastruktur.”
RELATEREDE DÆKNING
Medicinsk billedbehandling på “speed of light”: Nvidia ‘ s Clara supercomputer BRITISKE 100,000 Genom Projekt, der når halvvejs stageDubai at DNA-sekvens, der hele sit populationGarvan Institut får ny supercomputer til genomisk researchHow AI og næste generation af genomiske sekventering er at hjælpe kræft-patienter (TechRepublic)
Relaterede Emner:
Amazon
CXO
Digital Transformation
Tech-Branchen
Intelligente Byer
Cloud
0