
Семинары AIRI по искусственному интеллекту проходят по средам раз в две недели 🖇
Делимся подробностями следующего #AIRI_Seminars:
🔵 Дата и время: 15 марта в 17:00 на YouTube-канале AIRI
🔵 Тема: «Нет размеченных данных? Решаем проблему с помощью активного обучения»
🔵 Докладчик: Артем Шелманов, AIRI, MBZUAI
🔵 Оппонент: Евгений Цымбалов, Amazon
🔵 Описание: несмотря на значительный успех в создании методов обучения без учителя, экспертная разметка данных остается очень ценным источником знаний для систем ИИ. Циклическая разметка (HiL), в которой процесс ручной разметки и обучение модели чередуются, недавно стали широко распространены. Например, HiL является одним из важнейших компонентов недавно появившихся языковых моделей с дообучением на инструкции пользователей.
Во многих областях, таких как обработка медицинских или юридических документов, экспертная разметка весьма дорогая. Одним из подходов HiL, который решает эту проблему, является активное обучение (AL). В AL предсказания модели используются для выбора примеров, которые будут показываться пользователям. Выбираются только те примеры, которые являются информативными для обучения последующих версий модели. AL может сократить объем ручного труда в ходе разметки, необходимый для достижения определенного уровня производительности модели, в несколько раз. Это особенно важно в таких областях, где краудсорсинг проблематичен. AL как концепция была предложена довольно давно. Тем не менее, из-за ряда препятствий, на практике AL используется мало.
В этом докладе исследователи представят результаты нескольких работ, опубликованных в EACL, ACL, NAACL и других конференциях, которые обходят некоторые серьезные препятствия на пути к созданию надежных технологий разметки с помощью AL.
📹 Cсылка на плейлист с прошедшими семинарами.
Делимся подробностями следующего #AIRI_Seminars:
Во многих областях, таких как обработка медицинских или юридических документов, экспертная разметка весьма дорогая. Одним из подходов HiL, который решает эту проблему, является активное обучение (AL). В AL предсказания модели используются для выбора примеров, которые будут показываться пользователям. Выбираются только те примеры, которые являются информативными для обучения последующих версий модели. AL может сократить объем ручного труда в ходе разметки, необходимый для достижения определенного уровня производительности модели, в несколько раз. Это особенно важно в таких областях, где краудсорсинг проблематичен. AL как концепция была предложена довольно давно. Тем не менее, из-за ряда препятствий, на практике AL используется мало.
В этом докладе исследователи представят результаты нескольких работ, опубликованных в EACL, ACL, NAACL и других конференциях, которые обходят некоторые серьезные препятствия на пути к созданию надежных технологий разметки с помощью AL.
📹 Cсылка на плейлист с прошедшими семинарами.