Пишет подписчик канала, некий @seeyouall



Недавно прошел датафест длиной 3.5 недели. С момента переноса в онлайн он стал вяло-растянутым, стало сложно следить за тем что там происходит. Многие даже не знали, что Датафест вообще был. Просто появились какие-то видео , про Матрикс , про ОДС, какие-то лекции, какие доклады-то - непонятно.



Я хочу поделиться знаниями с остальными. Все лекции я конечно не смотрел, прошелся только по расписанию и выбрал исходя из заголовка. Неупорядоченный список для NLP, другое мне интеревсно в меньшей степени



1) Корпус RuCoLA: бенчмарк и способ сравнить языковые модели по-новому

2) A small BERT towards Large Medical Models

3) Современные техники обучения retrieval based моделей для поддержания диалога виртуальных ассистентов

4) mGPT: мультиязычная генеративная модель для 61 языков и ее применения k

5) Делаем суммаризацию текстов на русском языке

6) Трансформеры для обобщения поведения пользователей Яндекс Такси

7) Трансформеры для персонализации в Яндексе

8) Nearest Neighbors Language Models (part1 + part2)