Мой доклад на DataFest про детекцию генерированного научного контента и Research Integrity

#ml #science



Продолжается DataFest. Short notice: сегодня в 17:45 мск можно заглянуть в SpatialChat (пароль festparroteverywhere23) в комнату NLP и послушать мой доклад. Он называется "Обзор детекции синтетического (в том числе ML-генерированного) текста", но в этом посте немного уточню: детекция синтетического текста – очень широкая тема, здесь и chatGPT vs human, и fake news, и парафразирование для обхода антиплагиата. Я сделаю бОльший упор на мой опыт в теме – доклад будет частично по мотивам этого поста про организацию соревновния при COLING 2022 (спойлер: тема сложная, а соревнование вышло так себе), а также про некоторые возможные применения в Research Integrity (вот релевантый пост). На ютуб-трансляцию не успел попасть, но запись доклада в SpatialChat должна быть.