Avertissement : Cette page est une traduction automatique de cette page à l'origine en anglais. Veuillez noter puisque les traductions sont générées par des machines, pas tous les traduction sera parfaite. Ce site Web et ses pages Web sont destinés à être lus en anglais. Toute traduction de ce site et de ses pages Web peut être imprécis et inexacte, en tout ou en partie. Cette traduction est fournie dans une pratique.

Les services de l'amateur ADN peuvent être vulnérables à tailler génétique

Les services en ligne qui permettent à des usagers de télécharger la leur information génétique, généalogie de recherches et parents détruits par découverte peuvent être vulnérables à une sorte de tailler génétique, selon deux généticiens à l'Université de Californie, Davis. Un papier décrivant le travail est le 7 janvier publié dans l'eLife de tourillon.

Avec l'accroissement du contrôle à la maison d'ADN, les services en ligne tels que GEDMatch, le MyHeritage et le FamilyTreeDNA ont les places populaires étées pour que les gens téléchargent leur information génétique et pour recherchent leur généalogie. Ils ont été également employés par police pour trouver les suspects criminels par une correspondance d'ADN avec des parents.

Mais selon professeur Graham Coop et arête de Michael « Doc. » de chercheur post-doctoral au service d'Uc Davis de l'évolution et de l'écologie, quelqu'un avec un morceau des compétences en génétique et de calculer pourrait concevoir et télécharger les séquences d'ADN qui extraient bien plus de ces bases de données que quelques cousins perdus. Il peut être possible que un attaquant de retirer l'information génétique de la plupart des gens dans une base de données ou recense des gens avec des traits génétiques spécifiques tels que la maladie d'Alzheimer.

La cage et l'arête ont informé les compagnies de base de données du problème en juillet 2019 de leur permettre de caler pour mettre des contre-mesures en place avant de publier un prétirage en octobre.

Les gens abandonnent plus d'information qu'ils pensent qu'ils sont, « quand ils téléchargent à ces sites publiquement accessibles. Et à la différence des données de la carte de crédit, vous ne pouvez pas simplement annuler votre vieux génome et obtenir un neuf. »

Professeur Graham Coop, Université de Californie, Davis

Les problèmes n'affectent pas le pour-bénéfice ADN ordonnançant des compagnies telles que 23andMe, Coop a dit. Vous devez soumettre votre ADN comme un échantillon de salive pour obtenir l'accès à leurs caractéristiques génétiques. Les bases de données publiques, cependant, permettent à n'importe qui de télécharger des séquences d'ADN et de rechercher d'autres usagers avec des séquences assorties.

Identique par la condition et l'origine

Ces sites fonctionnent à l'aide du logiciel pour comparer des séquences d'ADN téléchargées par des usagers aux séquences déjà dans leur base de données. Votre génome est une mosaïque des pièces héritées de vos ancêtres. De plus grandes pièces, ou des tuiles dans la mosaïque, viennent des ancêtres récents. Pendant que les rétablissements réussissent, appariant les séquences obtiennent hachées dans de plus petites pièces. Ainsi si vous partagez de grandes accumulations de séquence d'ADN avec quelqu'un d'autre, il est susceptible vous partagent un ancêtre récent.

La cage et l'arête ont trouvé trois approches à attaquer ces bases de données. Ils appellent ces derniers le carrelage des méthodes IBS (identique par séquence), IBS sondant et amorce d'IBS.

Leurs tests ont principalement employé une collection publique de séquences d'ADN humaines procurables pour la recherche. Ils ont également effectué une validation de principe le test dans la base de données de GEDMatch mais sans agir l'un sur l'autre avec les caractéristiques de l'ADN d'autres usagers.

Dans le carrelage d'IBS, un attaquant télécharge plusieurs génomes trouvés dans les bases de données publiques de recherches et les maintient lesquels s'assortissent avec d'autres génomes dans la base de données, et où. S'ils peuvent trouver assez de tuiles assorties, ils peuvent remonter les la plupart de quelqu'un génome.

Le sondage d'IBS peut être employé pour chasser pour les gens qui transportent un variant génétique spécifique - par exemple, un gène attaché à la maladie d'Alzheimer. Pour faire ceci, l'attaquant produit un faux génome avec une séquence d'ADN qui n'est pas susceptible d'apparier n'importe qui, excepté une petite partie qui appariera le gène d'intérêt. Les correspondances de la base de données sont susceptibles d'être les gens avec ce variant génétique.

En conclusion, l'amorce d'IBS se fonde sur duper une classe des algorithmes employés pour recenser des parents. (Pas toutes les bases de données emploient ce type d'algorithme, bien que). La cage et l'arête prévoient cela avec seulement 100 séquences d'ADN téléchargées, un attaquant pourraient employer cette méthode pour obtenir la majeure partie d'information génomique dans une base de données.

La cage et l'arête ont effectué un test d'épreuve-de-concept avec la base de données de GEDMatch en décembre 2019. Fonctionnant avec seulement avec des séquences d'ADN elles avaient téléchargé et en utilisant le « mode des recherches » de GEDMatch pour pour ne pas agir l'un sur l'autre avec d'autres caractéristiques d'usagers, elles ont prouvé que l'amorce d'IBS pourrait être employée pour recenser des variants génétiques spécifiques (polymorphismes uniques de nucléotide, ou des SNP) dans la base de données.

Chacune des trois crises pourrait être effectué par quelqu'un avec la connaissance de la génétique et de calculer, tel qu'un étudiant de troisième cycle ou un amateur sérieux, mais « les bonnes nouvelles sont qu'elles sont tout à fait évitables, » Edge ont dit.

Le papier de cage et d'arête a visé une suite de direct-à-consommateur d'opérations que les services de génétique pourraient prendre pour bloquer ces crises. Tandis qu'ils ont déjà partagé l'information avec les principaux services, ils ont eu une réaction « variée », Coop a dit.

Utilisant ces services concerne forcément abandonner des données personnelles, et les millions de gens semblent disposés à faire cela en échange de rechercher des antécédents familiaux ou d'autres utilisations personnelles. Mais les usagers devraient se rendre plus compte d'exact combien d'information ils pourraient abandonner quand ils atteignent ces services.

« Nous voudrions (les services) expliquer leurs vulnérabilités et comment ils les adressent, » Coop a dit.

Source:
Journal reference:

Edge, M.D & Coop, G. (2020) Attacks on genetic privacy via uploads to genealogical databases. eLIFE. doi.org/10.7554/eLife.51810.