La tecnica del DNA che ha catturato i Golden State Killer è più potente di quanto si pensasse

0
139

Questo aprile, la polizia ha risolto giù un vecchio di decenni, un mistero l’identità del Golden State Killer — con un inedito tecnica del DNA. La ricerca di un esempio di corrispondenza nel database esistenti alzato a nulla, ma una ricerca su un database DNA situato a 10 a 15 possibile lontani parenti, che consentono di polizia restringere un sospetto elenco e, infine, ha dato loro il vantaggio necessario.

Era una nuova tecnica, al momento, ma dopo che l’alto profilo di successo, questa tecnica ha dimostrato di essere uno dei più nuovi e potenti strumenti di analisi forense. Nei mesi successivi, gruppi come Parabon Labs e il DNA Doe Progetto hanno identificato almeno 19 cold case campioni attraverso questo metodo, chiamato familiare di test del DNA, delle banche dati pubbliche, fornendo cruciale nuovi cavi per precedentemente insormontabili casi.

Ora, un paio di nuove scoperte che potrebbero rendere la tecnica più potente di lui. Un articolo pubblicato oggi sulla rivista Science, rileva che la stessa tecnica può span molto oltre contemporanea laboratori di realizzare, che copre quasi l’intera popolazione da un numero relativamente piccolo di base di campioni. Allo stesso tempo, i ricercatori di pubblicazione nella Cella hanno escogitato un modo per estrapolare da un incompleto campioni, la costruzione di un quadro più ampio del genoma rispetto a quanto inizialmente testato. Presi insieme, quelle tecniche che permettono ai ricercatori di identificare quasi nessuno utilizza solo esempi esistenti, spaventosamente nuovo e potente strumento per il DNA forense.

“La grossa limitazione è la copertura”

Familiare il test del DNA è una rottura convenzionale, il test del DNA, il cui aspetto positivo corrisponde, come corrispondente di DNA da una sanguinosa guanto per il DNA di una specifica sospetto. Fondamentalmente, una partita può essere effettuato solo se il sospetto di DNA possono essere raccolti, che lo rende poco pratico per la maggior parte dei casi freddi. Ma familiare DNA ricerche cercare le corrispondenze parziali, il che potrebbe indicare che il campione proviene da un fratello o un genitore, piuttosto che la stessa persona. Questo non è abbastanza per conoscere con esattezza identificare una persona, ma può dare di polizia cruciale di piombo che può portare a ulteriori test lungo la strada.

Per trovare quelli parziali, i laboratori si sono basati molto sul pubblico banche dati del DNA come GEDMatch e DNALand. Quelle ricerche, che non richiedono l’approvazione del tribunale, in quanto i dati sono già di pubblico, ma sono di portata più limitata. La più grande banca dati, GEDMatch, contiene poco meno di un milione di profili genetici, limitando notevolmente l’ambito di numerose ricerche. L’FBI Nazionale del DNA Index, al contrario, contiene più di 17 milioni di profili, ma si può accedere solo sotto giuridiche specifiche circostanze. Consumatore DNA di servizi come 23andMe e MyHeritage anche contenere significativamente più campioni, ma le loro politiche in genere di escludere l’applicazione della legge le ricerche di questo tipo.

Il risultato è una nuova spartizione per i dati, e di nuovo l’incertezza su quanto il pubblico di dati potrebbe raggiungere. “La grossa limitazione è la copertura”, dice Yaniv Erlich, un professore di informatica presso la Columbia University e Chief Science Officer di MyHeritage. “E anche se si trova un individuo, richiede una complessa analisi da quel punto.”

Un database che copre il due per cento della popolazione corrispondono a quasi chiunque

Ora, Erlich ha aderito con altri ricercatori della Columbia e della Hebrew University di esaminare esattamente quanto la copertura potrebbe raggiungere. Per la Scienza la carta, il team ha esaminato una serie di dati di 1,28 milioni di persone (in gran parte tratti dal MyHeritage database) e ha prodotto una analisi statistica che indica la probabilità che una determinata persona può essere abbinata a un parente il cui DNA è nel database. In base a questi risultati, i ricercatori hanno trovato che oltre il 60% delle ricerche è risultato sarebbe un cugino di terzo grado o di corrispondenza (la vicinanza stessa utilizzata per i Golden State Killer sospetto), dando una ragionevole possibilità di de-identificare il target. Come risultato, i ricercatori stimano un database avrebbe solo bisogno di copertura del 2% della popolazione target per un terzo-cugino-o-meglio corrispondono a quasi ogni persona. “Con la crescita esponenziale della genomica di consumo,” i ricercatori scrivono, “si ipotizza che tale database scala è prevedibile per alcuni siti web di terze parti nel prossimo futuro.”

In particolare, che la previsione si basa su una popolazione omogenea, ma la maggior parte delle collezioni di dati genetici mostrano una significativa disparità razziali. Il più importante è la legge database, che sono attratti dalla persona arrestata o condannare le popolazioni e l’inclinazione verso il nero e i popoli latini come un risultato. Consumer banche dati pubbliche e mostra il bias opposto, inclinazione verso Caucasici, che successivamente sono più probabilità di essere identificati con un familiare di ricerca, Erlich, dice.

Allo stesso tempo, un altro gruppo di scienziati sta espandendo la portata di tali tecniche anche di più. Consumer test genetici estrarre le diverse porzioni del genoma di legge di esecuzione dei test, che ha portato ad un confronto costante problema dell’intero campione non può essere ottenuto. Ma un gruppo di ricercatori della Stanford University, della University of California at Davis e l’Università del Michigan hanno sviluppato un metodo per il confronto dei risultati anche quando porzioni di genoma che non si sovrappongono, disegno note le correlazioni fra le diverse porzioni di codice genetico. Il metodo non è completamente sviluppato, ma potrebbe dare gli analisti forensi molta più flessibilità nel tipo di dati da utilizzare.

Secondo Davis, Michael Bordo, che ha lavorato sul Cell carta, la nuova ricerca suggerisce un quadro di applicazione della legge potrebbe utilizzare per iniziare a pensare di compatibilità esistenti STR database con dati SNP, ma più lavoro sarebbe necessario vedere come pratica.”