Мы найдем вас: поиск ДНК, используемый для обнаружения Голден Стэйт Киллер, может обнаружить около 60% белых американцев

Джозеф Де Анджело, подозреваемый убийца Голден Стэйт

Рэнди Пенч / TNS / Newscom

Мы найдем вас: поиск ДНК, используемый для обнаружения Голден Стэйт Киллер, может обнаружить около 60% белых американцев

Джоселин КайзерOct. 11, 2018, 14:00

Если вы белый, живете в Соединенных Штатах, и дальний родственник загрузил свою ДНК в базу данных публичных предков, есть большая вероятность, что интернет-сыщик сможет идентифицировать вас по образцу ДНК, который вы где-то оставили. Это заключение нового исследования, которое обнаруживает, что, комбинируя анонимный образец ДНК с некоторой базовой информацией, такой как чей-то грубый возраст, исследователи могут сузить личность этого человека до менее чем 20 человек. начиная с базы данных ДНК 1, 3 миллиона человек.

Такой поиск потенциально может позволить идентифицировать около 60% белых американцев по образцу ДНК - даже если они никогда не предоставляли свою собственную ДНК в базу данных предков. «Через несколько лет это действительно будет каждый», - говорит руководитель исследования Янив Эрлих, вычислительный генетик из Колумбийского университета.

Исследование было вызвано апрельским арестом предполагаемого «убийцы Золотого штата», калифорнийского мужчины, обвиняемого в серии изнасилований и убийств, совершенных в течение десятилетий. Чтобы найти его - и более десятка других подозреваемых в совершении преступлений с тех пор - правоохранительные органы сначала проверяют образец ДНК места преступления, который может быть старой кровью, волосами или спермой, на сотни тысяч маркеров ДНК. Знаки вдоль генома, которые различаются среди людей, но чья личность во многих случаях разделяется с кровными родственниками. Затем они загружают данные ДНК в бесплатную онлайн-базу данных GEDmatch, где каждый может поделиться своими данными с такими компаниями, которые проводят тестирование ДНК-потребителей, такими как 23andMe и Ancestry.com, для поиска родственников, представивших свою ДНК. Поиск около 1 миллиона анкет GEDMatch выявил нескольких родственников, которые были эквивалентны третьим двоюродным братьям по ДНК места преступления, связанной с убийцей Голден Стэйт. Другая информация, такая как генеалогические записи, приблизительный возраст и места совершения преступления, позволила сыновьям заселить одного человека.

Генетики быстро предположили, что этот подход может идентифицировать многих людей из неизвестной последовательности ДНК. Но чтобы определить, сколько именно, Эрлих и его коллеги более внимательно посмотрели на базу данных MyHeritage, которая содержит 1, 28 миллиона профилей ДНК людей, которые смотрят на историю своей семьи. (Эрлих является главным научным сотрудником компании по тестированию ДНК предков.) Если вы живете в Соединенных Штатах и ​​имеете европейское происхождение, то есть 60% вероятности, что у вас есть третий кузен или более близкий родственник в этой базе данных, прогнозировала команда, Их успешность была похожа, когда они искали 30 случайных профилей в GEDmatch. (Вероятность снижения до 40% для кого-либо из африканских предков к югу от Сахары в базе данных MyHeritage.)

Предполагая, что у вас есть родственник в одной из этих баз данных, каковы шансы, что полиция сможет найти вас по неопознанному образцу ДНК, как они похитили предполагаемого убийцу Голден Стэйт? Чтобы выяснить это, Эрлих и его коллеги объединили информацию из базы данных MyHeritage с родословными и демографическими данными, такими как приблизительный возраст и вероятное географическое положение. В среднем это позволило им использовать гипотетическую последовательность ДНК для размещения 17 «подозреваемых» из пула, насчитывающего около 850 человек, сообщает сегодня команда Science.

GEDmatch, вероятно, охватывает только около 0, 5% взрослого населения США, но миллионы американцев пользуются услугами по тестированию ДНК-предков. Как только показатель GEDmatch возрастет до 2%, более 90% людей европейского происхождения будут иметь троюродного брата или более близкого родственника и могут быть найдены таким образом. «Удивительно, насколько маленькой должна быть база данных», - говорит популяционный генетик Ноа Розенберг из Стэнфордского университета в Пало-Альто, штат Калифорния, который не принимал участия в работе.

Розенберг и его коллеги показали в прошлом году, что профиль в базе данных ДНК потребителя можно сопоставить с профилем того же человека в базах данных ДНК судебных органов правоохранительных органов, даже если они используют другой, меньший набор маркеров ДНК. Сегодня в Cell они сообщают, что более 30% лиц в базах данных судебной экспертизы также могут быть связаны с братьями и сестрами, родителями или детьми в базе данных потребителей. Объединение двух типов баз данных может упростить поиск подозреваемого по образцу ДНК. Связанный профиль ДНК потребителя может также раскрыть физическую внешность или медицинскую информацию для преступника или его родственников, например, гены для цвета глаз или заболевания, даже если криминалистические базы данных не должны содержать такую ​​информацию. «С ними можно сделать больше, чем было заявлено», - говорит Розенберг.

По словам Эрлиха, хотя эти исследования являются обнадеживающими новостями для раскрытия преступлений, они вызывают обеспокоенность в отношении конфиденциальности законопослушных граждан. Одно из возможных решений, предложенных его командой, заключается в том, что компании, занимающиеся тестированием ДНК потребителей, шифруют данные клиента в цифровом формате и что GEDMatch позволяет загружать только эти зашифрованные файлы. Таким образом, правоохранительные органы не могли загружать данные о последовательности ДНК из собственной лаборатории без сотрудничества с наследственной компанией. (Полиция не может просто притворяться клиентом и отправлять образцы ДНК на месте преступления таким компаниям, как 23andMe, потому что виртуальные машины компании обычно не могут обрабатывать скудные, ухудшенные образцы ДНК.)

Эрлих также считает, что американские чиновники должны пересмотреть федеральные правила, защищающие людей, которые добровольно участвуют в научных исследованиях. Недавно пересмотренное руководство для биомедицинских исследователей, названное «Общее правило», предполагает, что нельзя легко идентифицировать участника исследования по анонимному профилю ДНК. Но в своей статье команда Эрлиха использовала GEDMatch для идентификации женщины, которая участвовала в исследовании, используя ее анонимный профиль ДНК и дату рождения, которая часто является общедоступной для исследователей.

Эксперты по генетической политике согласны с тем, что необходимы изменения в том, как работают или регулируются базы данных генеалогии и фирмы, занимающиеся секвенированием ДНК. Цифровая подпись может быть «частичным решением», говорит профессор права Натали Рам из Университета Балтимора в Мэриленде. Но все игроки в индустрии секвенирования ДНК с непосредственным потребителем должны согласиться с этой схемой, отмечает она. «Если нет, мы вернемся к исходной точке».

Вместо этого она и другие недавно утверждали в Science, что штаты и Конгресс должны принять законы, ограничивающие ситуации, когда правоохранительные органы могут использовать генеалогические базы данных для поиска подозреваемых. По словам Рама, это может быть разумно для случая убийства, но не для мелкого преступления. «Нахождение правильного баланса важно».