Российский ИИ поможет создавать вакцины
Вы не поверите, но я снова хочу поговорить о белках. Благо, есть отличный повод — на AI Journey рассказали про ИИ-платформу для решения задач иммунологии.
Система получила название SEMA (или «Сёма», как её нежно называл Никита Иванисенко из AIRI). Платформу создала команда биоинформатики AIRI совместно со специалистами из Национального исследовательского центра эпидемиологии и микробиологии имени Н. Ф. Гамалеи, при участии Sber AI.
Как работают вакцины
Для начала немного теории, чтобы было понятнее, зачем это всё вообще нужно. Ключевым элементом вакцины является белок, который имитирует присутствие вируса в крови. При попадании этого белка в клетку вырабатываются антитела, которые способны специфически с ним связаться и нейтрализовать патоген — происходит так называемый B-клеточный ответ.
Антитела связываются не со случайными участками белка, а с теми, которые имеют предрасположенность к подобному взаимодействию. Эти участки называются B-клеточными конформационными эпитопами.
Иммунологам важно уметь предсказывать такие антитела, чтобы определять эффективность прототипов вакцин. Тут-то на помощь и приходит искусственный интеллект.
Как искусственный интеллект применяют в иммунологии
Как отметил Никита Иванисенко из AIRI, в последние два года ИИ произвёл революцию в области инженерии и предсказания свойств белков. Яркий пример такой системы — это AlphaFold (я про него уже писала, кстати, и не раз), который способен прогнозировать 3D-структуру белка по последовательности аминокислот в полимерной цепочке.
Также методы искусственного интеллекта применяются для предсказания участков связывания антител. Иммунологи «скармливают» нейросети данные о последовательности аминокислот и структуре белка, получая на выходе информацию о том, какие участки белка наиболее активно взаимодействуют с антителами, а какие имеют меньшую иммуногенность (с меньшей вероятностью будут вызывать имунный ответ). Именно эту задачу и решает SEMA.
Как работает SEMA
Для построения модели российские учёные собрали датасет на основе известных кристаллических структур. В него были включены примеры различных антигенов, которые уже связаны с антителом и для которых можно точно определить участки белка, ответственные за данное взаимодействие.
По меркам датасаентистов набор получился крошечным — всего около тысячи уникальных примеров. Этого было недостаточно для построения системы с нуля, поэтому исследователи использовали две предобученные лингвистические белковые модели:
🧬 ESM-1v (трансформер, предобученный на большом объёме белковых последовательностей)
🧬 ESM-IF1 (позволяет рассчитать геометрические характеристики белка)
Это позволило построить модель с высоким уровнем точности. По словам Иванисенко, SEMA сравнили с другими похожими инструментами и система показала куда более впечатляющие результаты.
Но и это ещё не всё
Конечно, иммунологам интересны не только B-клеточные эпитопы. Поэтому в SEMA 2.0 разработчики обещают добавить ещё несколько важных функций:
🧬Предсказание, насколько антиген будет стабилен
🧬Прогнозирование T-клеточного иммунного ответа
🧬Предсказание антител, которые смогли бы специфически взаимодействовать с эпитопом антигена
🧬Прогноз N-гликозилирования — биологической модификации, которая очень сильно влияет на иммуногенность белка
Кстати, «Сёму» можно свободно пощупать — модель доступна для тестирования всем желающим.
Вы не поверите, но я снова хочу поговорить о белках. Благо, есть отличный повод — на AI Journey рассказали про ИИ-платформу для решения задач иммунологии.
Система получила название SEMA (или «Сёма», как её нежно называл Никита Иванисенко из AIRI). Платформу создала команда биоинформатики AIRI совместно со специалистами из Национального исследовательского центра эпидемиологии и микробиологии имени Н. Ф. Гамалеи, при участии Sber AI.
Как работают вакцины
Для начала немного теории, чтобы было понятнее, зачем это всё вообще нужно. Ключевым элементом вакцины является белок, который имитирует присутствие вируса в крови. При попадании этого белка в клетку вырабатываются антитела, которые способны специфически с ним связаться и нейтрализовать патоген — происходит так называемый B-клеточный ответ.
Антитела связываются не со случайными участками белка, а с теми, которые имеют предрасположенность к подобному взаимодействию. Эти участки называются B-клеточными конформационными эпитопами.
Иммунологам важно уметь предсказывать такие антитела, чтобы определять эффективность прототипов вакцин. Тут-то на помощь и приходит искусственный интеллект.
Как искусственный интеллект применяют в иммунологии
Как отметил Никита Иванисенко из AIRI, в последние два года ИИ произвёл революцию в области инженерии и предсказания свойств белков. Яркий пример такой системы — это AlphaFold (я про него уже писала, кстати, и не раз), который способен прогнозировать 3D-структуру белка по последовательности аминокислот в полимерной цепочке.
Также методы искусственного интеллекта применяются для предсказания участков связывания антител. Иммунологи «скармливают» нейросети данные о последовательности аминокислот и структуре белка, получая на выходе информацию о том, какие участки белка наиболее активно взаимодействуют с антителами, а какие имеют меньшую иммуногенность (с меньшей вероятностью будут вызывать имунный ответ). Именно эту задачу и решает SEMA.
Как работает SEMA
Для построения модели российские учёные собрали датасет на основе известных кристаллических структур. В него были включены примеры различных антигенов, которые уже связаны с антителом и для которых можно точно определить участки белка, ответственные за данное взаимодействие.
По меркам датасаентистов набор получился крошечным — всего около тысячи уникальных примеров. Этого было недостаточно для построения системы с нуля, поэтому исследователи использовали две предобученные лингвистические белковые модели:
🧬 ESM-1v (трансформер, предобученный на большом объёме белковых последовательностей)
🧬 ESM-IF1 (позволяет рассчитать геометрические характеристики белка)
Это позволило построить модель с высоким уровнем точности. По словам Иванисенко, SEMA сравнили с другими похожими инструментами и система показала куда более впечатляющие результаты.
Но и это ещё не всё
Конечно, иммунологам интересны не только B-клеточные эпитопы. Поэтому в SEMA 2.0 разработчики обещают добавить ещё несколько важных функций:
🧬Предсказание, насколько антиген будет стабилен
🧬Прогнозирование T-клеточного иммунного ответа
🧬Предсказание антител, которые смогли бы специфически взаимодействовать с эпитопом антигена
🧬Прогноз N-гликозилирования — биологической модификации, которая очень сильно влияет на иммуногенность белка
Кстати, «Сёму» можно свободно пощупать — модель доступна для тестирования всем желающим.