DLStories

Помните AlphaFold? Это нейросеть, которая научилась определять структуру белка по последовательности аминокислот. Если пропустили — обязательно почитайте: это очень-очень важный прорыв для ИИ и биологии.

#paper #tech

Но в этом посте мы расскажем вам о другой нейросети в биологии: нейросети, которая предсказывает опасные мутации вирусов.

В чем состоит задача:

Многие болезни человечества вызваны вирусами. Против таких болезней разрабатывают вакцины. Вакцины помогают организму человека понять, как бороться с вирусом: как не дать ему проникнуть в клетки. Но есть сложность: вирусы способны мутировать. Некоторые мутации позволяют вирусам учиться избегать атаки имунной системы и сильнее проникать в клетки организма. При таких мутациях вакцины перестают действовать.

Пример: вирус COVID-19. Вы наверняка слышали о том, что в Англии и Южной Африке обнаружили мутации вируса, против которых существующие вакцины оказываются менее эффективны. По той же причине мутаций нужно делать прививку от гриппа каждый год: каждый год вирус гриппа сильно мутирует и против него нужны новые вакцины.

Отсюда возникает задача: по структуре вируса предсказывать, какие опасные мутации вируса могут возникнуть в ближайшее время.

Что обнаружили ученые:

Оказывается, биология имеет много общего с естественным языком: структура вируса очень похожа на структуру предложения.

Другими словами, иммунная система "считывает" вирус точно так же, как человек читает предложение на естественном языке.

Ученые выяснили это, обучив нейронную сеть для построения языковых моделей на мутациях вирусов. Оказалось, что сеть может успешно предсказывать мутации вирусов, которые приведут к защите вируса от иммунной системы.

У вируса, как и у предложения, есть два понятия: грамматическая корректность и смысл.

"Заразность" вируса соответствует грамматической структуре предложения: чем вирус более "грамматически правилен", тем он заразнее. Мутации же вируса соответствуют "смыслу" предложений. Те мутации, которые позволяют вирусу отражать атаки антител организма, сильно меняют "смысл" вируса.

Пример: рассмотрим предложение "Маше подарили красивую куклу". Изменим одно слово в предложении двумя способами: "Маше подарили милую куклу" и "Маше подарили ужасную куклу". Одно изменение (ужасную) меняет смысл предложения сильнее, чем другое (милую). Точно так же одни мутации изменяют вирус значительнее, чем другие.

Ученые обучили NLP модели на разных типах вирусаа ВИЧ (HIV). Точность модели составила от 0.69 до 0.85 — сильно больше случайного гадания.

Что это нам дает?

Умение предсказывать опасные мутации вирусов может помочь больницам оценивать ситуацию по заболеваниям в будущем. Например, информация о том, насколько серьезно вирус гриппа мутирует в следующем году, может помочь понять, насколько антитела людей, выработанные в этом году, помогут им в борьбе с гриппом через год.

Статью с более подробным разбором нейросети читайте тут. Также у ученых вышла статья в журнале Science.