Елена Дружинина | Наука и бизнес

🧮 В МГУ создали нейросеть, которая станет основой поисковой системы для ученых

Российские исследователи из Института искусственного интеллекта Московского государственного университета им. М. В. Ломоносова сообщили о разработке нейросети SciRus-tiny, предназначенной для получения семантических векторных представлений (эмбеддингов) научных текстов на русском языке. Система подходит для решения широкого спектра прикладных задач — от поиска и классификации до извлечения научных терминов.

Модель SciRus-tiny обучена на массиве из 1,5 млрд токенов научных текстов на русском и английском языках. Это модель архитектуры RoBERTa, размер словаря модели составляет 50 265 токенов, а максимальная длина контекста — 2 тыс. токенов. SciRus–tiny — первое решение в семействе моделей для получения эмбеддингов научных текстов на разных языках.

Нейросеть, представленная в открытом доступе, ляжет в основу поисково-рекомендательной системы для ученых, тестирование которой начнется в 2024 году.

#наука #технологии #ИИ

Дружинина Елена | Наука и бизнес