Ученые AIRI создали новую архитектуру нейронной сети DeepCT, которая может изучать сложные взаимосвязи между эпигенетическими свойствами клеток и интерпретировать варианты, найденные в геноме человека 🖇
Интерпретация некодирующих геномных вариантов является одной из важнейших задач генетики человека. Методы машинного обучения появились недавно как мощный инструмент для решения этой проблемы. Современные подходы позволяют прогнозировать транскрипционные и эпигенетические эффекты, вызванные некодирующими мутациями. Однако эти подходы требуют конкретных экспериментальных данных для обучения моделей и не могут быть распространены на типы клеток, где необходимые функции не были измерены экспериментально.
📢 Если говорить простыми словами, то гены кодируют белки. Это понятный код, в котором при смене одной буквы меняется и белок. Ученые могут предсказывать, что именно в белке поменялось.
Но кодирующие белки последовательности – это только 2% ДНК. С остальной частью все сложнее. Она регулирует не то, какой именно по составу будет белок, а какое количество белка образуется в клетке. Это тоже важно, но код, который используется в этой части генома, пока не расшифрован. Поэтому когда ученые видят, что у человека где-то между генами поменялась одна буква, то очень сложно сказать, насколько это важно и к чему приведет.
С помощью таких нейросетей, как DeepCT, исследователи пытаются предсказывать последствия мутаций в некодирующих областях.
📄 Ссылка на препринт статьи
📹 Разбор статьи в рубрике #AIRIPublished на YouTube от исследователя Вениамина Фишмана
Интерпретация некодирующих геномных вариантов является одной из важнейших задач генетики человека. Методы машинного обучения появились недавно как мощный инструмент для решения этой проблемы. Современные подходы позволяют прогнозировать транскрипционные и эпигенетические эффекты, вызванные некодирующими мутациями. Однако эти подходы требуют конкретных экспериментальных данных для обучения моделей и не могут быть распространены на типы клеток, где необходимые функции не были измерены экспериментально.
📢 Если говорить простыми словами, то гены кодируют белки. Это понятный код, в котором при смене одной буквы меняется и белок. Ученые могут предсказывать, что именно в белке поменялось.
Но кодирующие белки последовательности – это только 2% ДНК. С остальной частью все сложнее. Она регулирует не то, какой именно по составу будет белок, а какое количество белка образуется в клетке. Это тоже важно, но код, который используется в этой части генома, пока не расшифрован. Поэтому когда ученые видят, что у человека где-то между генами поменялась одна буква, то очень сложно сказать, насколько это важно и к чему приведет.
С помощью таких нейросетей, как DeepCT, исследователи пытаются предсказывать последствия мутаций в некодирующих областях.
📄 Ссылка на препринт статьи
📹 Разбор статьи в рубрике #AIRIPublished на YouTube от исследователя Вениамина Фишмана