CSIRO utilizzando serverless di calcolo per analizzare il genoma umano

0
123

Zero

Entro il 2025 si stima che il 50 per cento della popolazione mondiale avrà avuto il loro genoma sequenziato, che secondo la Commonwealth Scientific and Industrial Research Organisation (CSIRO) trasformazione di bioinformatica team leader Dr Denis Bauer significa che i dati genomici saranno superiori ai dati detenuti da Twitter, YouTube, di astronomia e di combinata.

La genomica è lo studio di informazioni codificate in un individuo del DNA, che permette ai ricercatori di studiare come i geni impatto sulla salute e sulla malattia.

Il genoma contiene il modello per ogni cella il corpo di un individuo e con tanto di informazioni codificate nel genoma non è una sorpresa Australia picco organizzazione di ricerca sta investendo pesantemente a esplorare le sue possibilità.

Parlando al AWS Settore Pubblico Vertice a Canberra mercoledì, Bauer dettagliate come il CSIRO è Amazon Web Services infrastructure per costruire un genomica applicazione che solo un paio di anni fa sarebbe sembrato impossibile.

Ha detto genomica produce un impressionante 20 exabyte di dati all’anno, notando anche come grandi quantità di dati porta a tre problemi principali.

“Uno dei problemi tecnici è che i grandi volumi di dati non è banale per ottenere una sospensione di, in particolare quando stiamo parlando di 40 gigabyte al genoma, per l’individuo”, ha spiegato.

“Abbiamo anche esperienza burstable carichi di lavoro in cui i medici possono accedere a questa risorsa, allo stesso tempo, come altri 10.000 medici, ma al minuto successivo potrebbe cadere per nulla, quindi non vogliamo pagare per un carico di lavoro che può crunch che la quantità di dati e quindi la prossima volta che non c’è niente, è solo seduti attorno al minimo.

“Terzo problema è quello di consolidare i dati da silos.”

Con le normative sulla privacy diverse tra giurisdizioni, Bauer ha detto che è improbabile che ci sarà un consolidamento del mondiale di dati genomici in un’unica entità. Lei ha detto, quindi, trattare con i sistemi distribuiti dovrà essere qualcosa di coloro che sono coinvolti.

La trasformazione di bioinformatica squadra che Bauer porta ha la carta per lo sviluppo di nuovi bioinformatica soluzioni per la ricerca e l’industria utilizzando la più recente cloud e BigData infrastrutture.

Si concentra in particolare sul livello di popolazione analisi di genomica, trascrittomica, e methylomics, così come l’ingegneria del genoma applicazioni.

Di lavoro per l’eHealth programma di ricerca all’interno di CSIRO, che è il più grande di digital dell’agenzia per la salute in Australia, Bauer ha detto che le squadre sono concentrati sul miglioramento della salute attraverso l’utilizzo di tecnologie digitali e servizi.

Il CSIRO ha pubblicato il suo Futuro di Salute [PDF] report di questa settimana, che ha delineato le organizzazioni di 15 anni di visione di assistenza sanitaria in Australia.

Come il titolo del report spiega che l’idea principale del CSIRO è Cambiata Australia attenzione dalla malattia, trattamenti per la salute e il benessere di gestione.

“Uno dei grandi messaggi di questo che abbiamo bisogno di smettere di essere reattivi, il trattamento di malattie, in fase preventiva e di contrarre malattie prima che effettivamente diventano sintomatici e uno dei temi chiave c’era digitale, la salute,” Bauer aggiunto.

Un altro tema, il rapporto era di precisione della medicina, e per mantenere questa visione Bauer ha detto il CSIRO ha sviluppato VariantSpark, che è un Hadoop/Spark machine learning library per la genomica analisi dei dati.

“È costruito su Apache core e cosa si può fare è che si può girare un Apache scintilla cluster per analizzare i vostri dati direttamente su AWS,” ha spiegato.

“Portare le informazioni che abbiamo trovato nel genoma nella reale pratica clinica e prendere decisioni su di esso non è banale e per questo abbiamo sviluppato GenPhen-Insight, che è uno strumento che combina i dati medici di dati genomici per migliorare in tempo reale, il trattamento, la diagnosi e il trattamento di esiti o raccomandazioni.

“Specificamente progettato per il ridimensionamento al bisogno crescente di dati genomici in futuro.”

VariantSpark utilizza AWS Lambda, su richiesta serverless servizio di calcolo e il CSIRO genomic del file sono tutti situati in un datalake su S3.

Vedi anche: AWS Lambda: La persona intelligente guida (TechRepublic)

“Abbiamo iniziato con una infrastruttura e poi modificato per ottenere prestazioni migliori e a fare le analisi abbiamo voluto fare”, Bauer ha detto. “Credo fortemente che una volta che si va serverless è mai indietro.

“La velocità e l’innovazione” è incredibile-si può stare fino a un minimo vitale di prodotto in un paio di secondi e con un costo minimo, e non è necessario pensare l’infrastruttura sottostante.”

RELATIVI COPERTURA

Medica per immagini a velocità della luce’: Nvidia Clara supercomputerThe UK 100.000 Progetto Genoma arriva a metà stageDubai di sequenza di DNA tutta la sua populationGarvan Istituto ottiene il nuovo supercomputer per la genomica researchHow AI e la prossima generazione di sequenziamento genomico è di aiutare i malati di cancro (TechRepublic)

Argomenti Correlati:

Amazon

CXO

La Trasformazione Digitale

Settore Tech

Smart Cities

Cloud

0