Первый постер, который я увидела на EMNLP 2022, был посвящен исследованию срачей (по-научному, interpersonal conflicts 🧐).
https://arxiv.org/abs/2208.08758
Авторы статьи изучили канал с говорящим названием r/amitheasshole, в котором люди описывают свою конфликтную ситуацию и спрашивают реддито-жителей, правы ли они в данной ситуации или нет. В ответ люди получают комментарии с бинарным ответом, asshole они в данной ситуации или нет плюс опциональное докидывание какашек в виде развернутых комментариев в произвольной форме. Из всего этого был создан датасет, в котором описание ситуации является примером, а количество баллов asshole/not asshole - меткой, плюс для оценки силы одобрения/неодобрения сохранена доп информация в виде развернутых комментариев, аннотации разных аспектов конфликта и т.д.
На этом датасете авторы обучили трансформер SBERT, который предсказывает, обрсрут ли кожаного в данном сабреддите или нет, на основании описания его конфликтной ситуации, и если да, то насколько яростно. Все описанные конфликты были кластеризованы на несколько групп с помощью Shallow ML, и для каждого кластера конфликтов качество работы SBERT оценивалось отдельно.
Авторы надеются, что этот датасет поможет лучше научить модели понимать социальные нормы.
#объяснения_статей #конференции
https://arxiv.org/abs/2208.08758
Авторы статьи изучили канал с говорящим названием r/amitheasshole, в котором люди описывают свою конфликтную ситуацию и спрашивают реддито-жителей, правы ли они в данной ситуации или нет. В ответ люди получают комментарии с бинарным ответом, asshole они в данной ситуации или нет плюс опциональное докидывание какашек в виде развернутых комментариев в произвольной форме. Из всего этого был создан датасет, в котором описание ситуации является примером, а количество баллов asshole/not asshole - меткой, плюс для оценки силы одобрения/неодобрения сохранена доп информация в виде развернутых комментариев, аннотации разных аспектов конфликта и т.д.
На этом датасете авторы обучили трансформер SBERT, который предсказывает, обрсрут ли кожаного в данном сабреддите или нет, на основании описания его конфликтной ситуации, и если да, то насколько яростно. Все описанные конфликты были кластеризованы на несколько групп с помощью Shallow ML, и для каждого кластера конфликтов качество работы SBERT оценивалось отдельно.
Авторы надеются, что этот датасет поможет лучше научить модели понимать социальные нормы.
#объяснения_статей #конференции