AlphaFold расшифровал структуры более 200 миллионов белков — практически всех известных в природе
🐿 Белки — ключевые молекулы всех живых организмов. Их свойства и функции определяются сложной пространственной формой, которая задаётся последовательностью аминокислот, условиями сворачивания цепочки и другими факторами.
🔬 Чтобы определить механизм работы того или иного белка, до сих пор их структуры приходилось устанавливать экспериментально. Такая работа требует больших усилий и ресурсов, поэтому может занимать не один год. Однако за десятилетия биологи накопили данные почти о 200 тыс. структур, что позволило обучать этой задаче нейросети.
🧬 В конце 2020 года компания DeepMind представила AlphaFold 2, программу, которая использует нейросеть-трансформер для прогнозирования пространственной структуры белка на основе его аминокислотной последовательности. В бенчмарке CASP, позволяющем оценить точность таких предсказаний, система продемонстрировала рекордные результаты, в разы обойдя ближайших конкурентов.
📊 С тех пор она работает почти без перерыва, и в 2021 году разработчики DeepMind совместно с учёными из Европейской лаборатории молекулярной биологии (EMBL) выложили в открытый доступ датасет AlphaFold DB, содержащий предсказанные структуры примерно двух миллионов белков для 20-ти видов живых организмов, включая примерно 20 тыс. белков человека.
‼️ Теперь участники проекта объявили о завершении проекта: система AlphaFold сгенерировала структуры для более чем 200 млн белков. Как выразились сами разработчики — «всей белковой вселенной». Датасет включает информацию о белках животных, растений, грибов, бактерий и архей.
Новые данные доступны для скачивания через облачный сервис Google Cloud Public Datasets, они дополнят и самую большую в мире базу данных о белках UniProt. Это позволит сделать новые важные открытия в биологии, медицине, фармакологии.
#Нейросети, #Биотехнологии, #Биоинформатика
🐿 Белки — ключевые молекулы всех живых организмов. Их свойства и функции определяются сложной пространственной формой, которая задаётся последовательностью аминокислот, условиями сворачивания цепочки и другими факторами.
🔬 Чтобы определить механизм работы того или иного белка, до сих пор их структуры приходилось устанавливать экспериментально. Такая работа требует больших усилий и ресурсов, поэтому может занимать не один год. Однако за десятилетия биологи накопили данные почти о 200 тыс. структур, что позволило обучать этой задаче нейросети.
🧬 В конце 2020 года компания DeepMind представила AlphaFold 2, программу, которая использует нейросеть-трансформер для прогнозирования пространственной структуры белка на основе его аминокислотной последовательности. В бенчмарке CASP, позволяющем оценить точность таких предсказаний, система продемонстрировала рекордные результаты, в разы обойдя ближайших конкурентов.
📊 С тех пор она работает почти без перерыва, и в 2021 году разработчики DeepMind совместно с учёными из Европейской лаборатории молекулярной биологии (EMBL) выложили в открытый доступ датасет AlphaFold DB, содержащий предсказанные структуры примерно двух миллионов белков для 20-ти видов живых организмов, включая примерно 20 тыс. белков человека.
‼️ Теперь участники проекта объявили о завершении проекта: система AlphaFold сгенерировала структуры для более чем 200 млн белков. Как выразились сами разработчики — «всей белковой вселенной». Датасет включает информацию о белках животных, растений, грибов, бактерий и архей.
Новые данные доступны для скачивания через облачный сервис Google Cloud Public Datasets, они дополнят и самую большую в мире базу данных о белках UniProt. Это позволит сделать новые важные открытия в биологии, медицине, фармакологии.
#Нейросети, #Биотехнологии, #Биоинформатика