На связи Антон Ермилов из ML-команды Yandex Cloud!



Недавно мы разработали нейросеть-эмпата: с её помощью компании могут создавать голосовых помощников и виртуальных операторов колл-центров, которые будут распознавать человеческие эмоции. Эта модель учитывает не только текст, но и характеристики голоса — его тембр, высоту и так далее.



➡️ Подробнее об этом можете почитать здесь



Для определения эмоций мы использовали трансформерную архитектуру нейросетей, — аналогичную той, что помогает нам в распознавании речи. В процессе работы над разметкой данных оказалось, что тяжелее всего даётся классификатор негатива. Было трудно определить, в каких голосовых записях есть отрицательный окрас: одни сотрудники считывали негатив, другие были уверены, что всё в порядке.



Наша команда подготовила несколько голосовых сообщений, в которых мы передали такие «сомнительные» случаи.



Как считаете, эмоции на этих записях негативные или нет? 🧐