Ученые AIRI создали новую архитектуру нейронной сети DeepCT, которая может изучать сложные взаимосвязи между эпигенетическими свойствами клеток и интерпретировать варианты, найденные в геноме человека 🖇



Интерпретация некодирующих геномных вариантов является одной из важнейших задач генетики человека. Методы машинного обучения появились недавно как мощный инструмент для решения этой проблемы. Современные подходы позволяют прогнозировать транскрипционные и эпигенетические эффекты, вызванные некодирующими мутациями. Однако эти подходы требуют конкретных экспериментальных данных для обучения моделей и не могут быть распространены на типы клеток, где необходимые функции не были измерены экспериментально. 



📢 Если говорить простыми словами, то гены кодируют белки. Это понятный код, в котором при смене одной буквы меняется и белок. Ученые могут предсказывать, что именно в белке поменялось.



Но кодирующие белки последовательности – это только 2% ДНК. С остальной частью все сложнее. Она регулирует не то, какой именно по составу будет белок, а какое количество белка образуется в клетке. Это тоже важно, но код, который используется в этой части генома, пока не расшифрован. Поэтому когда ученые видят, что у человека где-то между генами поменялась одна буква, то очень сложно сказать, насколько это важно и к чему приведет.



С помощью таких нейросетей, как DeepCT, исследователи пытаются предсказывать последствия мутаций в некодирующих областях.



📄 Ссылка на препринт статьи



📹 Разбор статьи в рубрике #AIRIPublished на YouTube от исследователя Вениамина Фишмана