С помощью нейросети специалисты изучили правила трехмерной организации генома у разных живых организмов
Российские биоинформатики разработали нейросеть, которая позволила исследовать пространственную структуру генома у разных организмов – от грибов до млекопитающих, и научилась ее предсказывать. Оказалось, что правила, по которым формируется трехмерная архитектура генома, специфичны для видов.
Трехмерная организация генома имеет важное значение для регуляции генов, поскольку взаимное расположение генов при пространственном сворачивании хроматина влияет на их активность. В 3D структуре генома выделяют определенные паттерны, такие как петли (образуемые при точечном взаимодействии пар локусов); полосы (взаимодействия одного локуса с соседними областями); фонтаны, или струи (взаимодействия, исходящие из одного диагонального локуса); отсутствие взаимодействий между геномными областями называется инсуляцией. Эти паттерны встречаются у разных видов, но их визуальное сходство может не отражать сходство биологических механизмов, которые к ним приводят. Правила сворачивания хроматина могут различаться у разных видов. Большой шаг в изучении этой проблемы был сделан с появлением нейронных сетей, которые могут предсказывать пространственную структуру генома на основе последовательности ДНК.
Такое исследование было проведено российскими учеными и опубликовано в журнале Nucleic Acids Research https://academic.oup.com/nar/article/54/2/gkaf1516/8431141?login=true. Один из первых авторов статьи, Алексей Школиков, представляет Институт общей генетики РАН, а руководителем работы стал биоинформатик и эволюционный биолог Михаил Сергеевич Гельфанд. В этой работе авторы проанализировали данные по последовательности ДНК и по трехмерной организации генома у 22 организмов, относящихся к очень разным таксономическим группам. Среди них человек, мышь, лягушка, рыбка зебрафиш, брюхоногий моллюск, пчела, муравей, дрозофила, комар, клещ, нематода, гребневик, амеба, дрожжи, растение резуховидка Таля и другие.
Авторы разработали свою собственную модель машинного обучения Chimaera, в которую на вход закладывают последовательность ДНК, а на выходе она предсказывает карту трехмерной организации генома. После того, как ее обучили на данных 22 различных организмов, ученые убедились в том, что модель позволяет количественно определять разные паттерны трехмерной архитектуры, такие как петли, инсуляцию, фонтаны, у различных видов. Они находили отдельные мотивы в последовательности ДНК, связанные с формированием тех или иных паттернов. Так, инсуляция оказалась связана с обогащением последовательности ДНК GC-парами нуклеотидов (гуанин-цитозин).
Chimaera продемонстрировала важность положения генов для структуры хроматина у большинства изученных организмов, для этого ученые использовали аннотации генов на базе данных Ensemble. Причем имеет значение не только расположение генов, но и их взаимная ориентация. По результатам своей работы они продемонстрировали, что существуют правила сворачивания хроматина, специфичные для каждого вида, то есть механизмы трехмерной организации генома действительно видоспецифичны. Авторы подчеркивают, что главное преимущество разработанной ими модели перед другими состоит в возможности интерпретации изученных правил сворачивания хроматина.
На основе выявленных закономерностей сворачивания хроматина, ученым удалось установить эволюционные взаимосвязи и построить дерево трехмерной организации генома, охватывающее живые организмы от растений до млекопитающих.
Источник:
Shkolikov A, Galitsyna A, Gelfand MS. Deciphering the 3D genome organization across species from Hi-C data. Nucleic Acids Res. 2026 Jan 14;54(2):gkaf1516. doi: 10.1093/nar/gkaf1516.
Дополнительная информация:
Алексей Школиков, факультет биоинженерии и биоинформатики МГУ, Институт общей генетики РАН, a.shkolikov(at)gmail.com
Надежда Маркина, пресс-секретарь ИОГен РАН, nmarkina@vigg.ru



