AIRI Institute

Семинары AIRI по искусственному интеллекту проходят по средам раз в две недели 🖇

Делимся подробностями следующего #AIRI_Seminars:

🔵Дата и время: 15 марта в 17:00 на YouTube-канале AIRI

🔵Тема: «Нет размеченных данных? Решаем проблему с помощью активного обучения»

🔵Докладчик: Артем Шелманов, AIRI, MBZUAI

🔵Оппонент: Евгений Цымбалов, Amazon

🔵Описание: несмотря на значительный успех в создании методов обучения без учителя, экспертная разметка данных остается очень ценным источником знаний для систем ИИ. Циклическая разметка (HiL), в которой процесс ручной разметки и обучение модели чередуются, недавно стали широко распространены. Например, HiL является одним из важнейших компонентов недавно появившихся языковых моделей с дообучением на инструкции пользователей.

Во многих областях, таких как обработка медицинских или юридических документов, экспертная разметка весьма дорогая. Одним из подходов HiL, который решает эту проблему, является активное обучение (AL). В AL предсказания модели используются для выбора примеров, которые будут показываться пользователям. Выбираются только те примеры, которые являются информативными для обучения последующих версий модели. AL может сократить объем ручного труда в ходе разметки, необходимый для достижения определенного уровня производительности модели, в несколько раз. Это особенно важно в таких областях, где краудсорсинг проблематичен. AL как концепция была предложена довольно давно. Тем не менее, из-за ряда препятствий, на практике AL используется мало.

В этом докладе исследователи представят результаты нескольких работ, опубликованных в EACL, ACL, NAACL и других конференциях, которые обходят некоторые серьезные препятствия на пути к созданию надежных технологий разметки с помощью AL.

📹 Cсылка на плейлист с прошедшими семинарами.