Подготовила Елена Клещенко
Кайл Кай-Хау Фарх, исследователь Лаборатории искусственного интеллекта Illumina, и его коллеги использовали глубокое обучение для выполнения этой задачи. Нейросеть обучали на часто встречающихся генных вариантах, полученных из данных популяционного секвенирования для шести видов приматов: шимпанзе, бонобо, горилл, орагнутанов, макак резусов и мармозеток. Такой подход, по утверждению авторов, позволил идентифицировать варианты, связанные с риском заболевания, с точностью до 88%.
«Если идентичные по состоянию полиморфизмы одинаково влияют на приспособленность двух видов, то присутствие варианта с высокой аллельной частотой в популяциях шимпанзе должно указывать на доброкачественные последствия для человека, тем самым расширяя каталог известных вариантов, доброкачественность которых была установлена очищающим отбором», — поясняют авторы. Действительно, выяснилось, что среди общих для разных видов идентичных по состоянию вариантов доброкачественные варианты перепредставлены.
Исследователи использовали коллекцию аминокислотных последовательностей, полученных на основе распространенных вариантов в геномах человека и обезьян, для обучения классификатора PrimateAI, который определяет показатели высокой патогенности новых и известных вариантов. Помимо хорошо известного гена SCN2A, связанного с эпилепсией и умственной недееспособностью, команда обнаружила еще 14 кандидатных генов, возможно, ассоциированных с нарушениями когнитивных функций, используя набор миссенсов, возникших de novo у почти 4300 особей с расстройствами развития нервной системы.
«Наши результаты показывают, что систематическое секвенирование популяций приматов — эффективная стратегия для классификации миллионов вариантов человека неопределенного значения, которые в настоящее время ограничивают клиническую интерпретацию генома», — говорится в статье. Авторы добавляют, что сравнительно небольшое количество геномов обезьян дало непропорционально большой объем информации о распространенных доброкачественных вариантах. Они также отмечают, что сокращение численности приматов из-за браконьерства и разрушения их местообитаний может привести к «невосполнимой утрате генетического разнообразия».
PrimateAI — программное обеспечение с открытым исходным кодом, доступно на BaseSpace Sequence Hub Illumina и через GitHub.
Источник
Laksshman Sundaram et al. // Predicting the clinical impact of human mutation with deep neural networks // Nature Genetics (2018) DOI: 10.1038/s41588-018-0167-z
Показать все 0 комментария