Nul
Tegen 2025 wordt geschat dat 50 procent van de wereldbevolking zal hebben hun genoom gesequenced, die volgens de Commonwealth Scientific and Industrial Research Organisation (CSIRO) transformationele bio-informatica team leider Dr Denis Bauer betekent dat de genomische zal groter zijn dan de gegevens van Twitter, YouTube, en astronomie gecombineerd.
Genomics is de studie van de informatie die is gecodeerd in het DNA, waardoor onderzoekers bestuderen hoe genen impact op gezondheid en ziekte.
Het genoom bevat de blauwdruk voor elke cel in het lichaam en met zo veel gecodeerde informatie in het genoom, het komt als geen verrassing Australië ‘ s peak onderzoek organisatie is fors te investeren in het verkennen van de mogelijkheden.
Spreken op de AWS Publieke Sector-Top in Canberra op woensdag Bauer gedetailleerde hoe de CSIRO is via Amazon Web Services-infrastructuur om te bouwen van een genomische toepassing dat slechts een paar jaar geleden zou onmogelijk leek.
Ze zei genomics produceert maar liefst 20 exabyte aan gegevens per jaar, op te merken ook hoe dergelijke grote hoeveelheden gegevens brengt over de drie belangrijkste problemen.
“Technische problemen is dat de grote hoeveelheden data is niet triviaal vast te krijgen, met name wanneer we praten over 40 gb per genoom, per individu,” legde ze uit.
“We hebben ook de ervaring burstable workloads waar clinici kan toegang tot deze bron op hetzelfde moment als 10.000 andere artsen, maar in de volgende minuut hij zou kunnen dalen tot niets, dus daarom willen we niet te betalen voor een werk dat kan crunch die veel data en de volgende keer is er niets, het is gewoon zitten rond stationair draaien.
“Derde probleem is de consolidatie van gegevens van de silo’ s.”
Met de privacy regelgeving verschillen tussen jurisdicties, de Bauer zei dat het onwaarschijnlijk is dat er een consolidatie van de wereld genomische gegevens in één enkele entiteit. Ze zei daarom het omgaan met gedistribueerde systemen worden iets betrokkenen wennen.
De transformationele bio-informatica team dat Bauer leidt heeft het handvest tot het ontwikkelen van nieuwe bioinformatica oplossingen voor het onderzoek en de industrie met behulp van de nieuwste cloud en BigData-infrastructuur.
Het zich specifiek richt op de bevolking-schaal analyse van genomics, transcriptomics, en methylomics, evenals genome engineering toepassingen.
Werken voor de eHealth research programma binnen CSIRO, die is de grootste digitale health agency in Australië, Bauer zei de teams zijn gericht op het verbeteren van de gezondheidszorg door middel van het gebruik van digitale technologieën en diensten.
De CSIRO heeft de Toekomst van Gezondheid [PDF] verslag van deze week, waarin een beeld geschetst van de organisaties die 15 jaar visie van de gezondheidszorg in Australië.
Zoals de titel van het rapport wordt uitgelegd, is de belangrijkste idee van de CSIRO is het Verschuiven van Australië is de focus van ziekte behandeling voor de gezondheid en het welzijn van het management.
“Een van de grootste berichten van dit was dat we nodig hebben om te stoppen met reactieve, om ziektes te behandelen, wordt preventief op te vangen ziektes voordat ze eigenlijk symptomatisch en één van de belangrijkste thema’ s in digitale gezondheid,” Bauer toegevoegd.
Een ander thema in het rapport was de precisie van de geneeskunde, en te leveren op basis van deze visie Bauer zei de CSIRO heeft ontwikkeld VariantSpark, dat is een Hadoop/Spark machine learning bibliotheek voor de genomische analyse.
“Het is gebouwd op de Apache-core en wat je kunt doen is je kunt draaien tot een Apache vonk cluster bij het analyseren van uw gegevens direct op het AWS,” legde ze uit.
“De informatie die we hebben gevonden in het genoom in de huidige klinische praktijk en het maken van beslissingen op het is niet triviaal en voor dat we ontwikkeld GenPhen-Inzicht is een instrument dat een combinatie van medische gegevens met de genomische te verbeteren in real-time, behandeling de diagnose en de behandeling van de resultaten of aanbevelingen.
“Speciaal ontworpen voor het aanpassen aan de groeiende behoefte van de genomische in de toekomst.”
VariantSpark gebruikt AWS Lambda, een on-demand serverloze computing service en de CSIRO de genomische bestanden bevinden zich in een datalake op S3.
Zie ook: AWS Lambda: De smart person ‘ s guide (TechRepublic)
“We begonnen met één van de infrastructuur en vervolgens getweaked het om betere prestaties te krijgen en doen de analyse die we wilde doen,” Bauer zei. “Ik geloof sterk dat je dat een keer gaan serverloze je nooit meer terug.
“De snelheid van innovatie is ongelooflijk — je kunt opstaan van een minimale levensvatbare product in een paar seconden en met minimale kosten en hoeft u niet na te denken over de onderliggende infrastructuur.”
VERWANTE DEKKING
Medische beeldvorming op de ‘snelheid van het licht’: de Nvidia Clara supercomputerThe VERZENDING van 100.000 Genoom Project bereikt de helft van stageDubai om de DNA-sequentie van het hele populationGarvan Instituut krijgt nieuwe supercomputer voor genomische researchHow AI en de volgende generatie genome sequencing is het helpen van patiënten met kanker (TechRepublic)
Verwante Onderwerpen:
Amazon
CXO
Digitale Transformatie
Tech Industrie
Smart Cities
Cloud
0