Kali Novskaya

#reviewer2 #nlp

Шутки в сторону, сегодня с коллегами ведем туториал по Artificial Text Detection на конференции INLG (15th International Natural Language Generation Conference)

Суть задачи: так как генерация текстов с помощью нейронных сетей неизбежно становится все лучше и лучше, все более актуальной становится задача детектирования "нечеловеческих" текстов.

По сути, чем лучше тексты "искусственные", тем сложнее становится задача.

Задача может быть как в формате бинарной классификации, так и мультиклассовой: отличить тексты, полученные генерацией, суммаризацией, переводом, переносом стиля и т.д. от натуральных текстов.

Когда в таких текстах есть ошибки, улавливаемые глазом, задача очевидна.

А вот когда ошибок нет?

Наши статьи по теме:

○ Findings of the The RuATD Shared Task 2022 on Artificial Text Detection in Russian arxiv

○ Artificial Text Detection via Examining the Topology of Attention Maps arxiv

Слайды будут тут: https://artificial-text-detection.github.io/