Ну и вишенка на торте к разговору о drug discovery и AlphaFold:

TorchDrug: библиотека PyTorch для создания моделей для поиска лекарств.

#tools #ai_med



Поиск лекарств от болезней — долгий и дорогостоящий процесс. В среднем на разработку одного лекарства тратится 10 лет и 2.5 миллиарда $. Машинное обучение может помочь ускорить этот процесс, разрабатывая модели, которые смогут предсказывать структуры и свойства химических соединений. Как мы увидели из истории с AlphaFold — это более чем реально.



Однако построить и обучить модельку ML для поиска лекарств не так-то просто. Во-первых, нужно понимать, как работать с данными о молекулах: в каком виде они представлены и как их обработать перед подачей в модель. Во-вторых, нужно понимать, как соединять разные виды моделей (графовые сети, ГАНы, RL), чтобы получить интегрированное решение. Общего фреймворка работы с данными лекарств нет, и все исследователи готовят данные и обучают модели по-разному. Из-за этого становится сложно воспроизводить результаты и соединять различные подходы вместе.



Чтобы ускорить развитие технологий ML в области поиска лекарств и упростить работу ученым, PyTorch представил библиотеку TorchDrug. Она содержит в себе все необходимые функции для работы с данными: считывание, визуализация, перевод из одного представления в другое, препроцессинг и т.д. Также в ней содержатся несколько датасетов, на которых можно учить и проверять модельки, и несколько предобученных архитектур нейросетей. Ну и, конечно, функции для обучения и теста моделей.



Статья с описанием функционала и примерами работы библиотеки: тык



ML в биологии и drug discovery прямо горячей темой становится =)