Yandex Cloud

Хотим рассказать вам об одном из наших сервисов — технологии распознавания и синтеза речи SpeechKit, разработка которой продолжается с 2013 года. Именно на основе SpeechKit работает Алиса — голосовой помощник Яндекса и приложение «Яндекс.Разговор: помощь глухим», чей код мы выложили в открытый доступ.

Одна из основных целей — это естественное звучание получившейся речи, которое стало возможным благодаря формированию речи из миллиона отдельно записанных фонем. Интонация и настроение задаются нейросетью, которую мы учили на примерах из реальной жизни. Также предоставляется возможность синтеза речи в реальном времени. Уже сейчас вы сможете разработать программное обеспечение с потоковым воспроизведением.

Для обмена данными с сервисом предусмотрен HTTP API: вам не придется разворачивать и поддерживать свою инфраструктуру, чтобы в сжатые сроки реализовывать нужные функции, а наша собственная позволит обработать огромное количество одновременных обращений.

Самыми популярными вариантами использования SpeechKit являются:

1. Автоматизация первой линии колл-центра и обзвон ваших клиентов;

2. Внедрение управления голосом на сайте или в приложении;

3. Нужда в ознакомлении с текстом на слух (TTS) или же наоборот (STT).

Возможности ограничены лишь вашей фантазией 🙂

Тарифы представлены в открытом виде на нашем сайте. Конечная стоимость формируется по длительности записи (STT), а когда на вход подаётся текст (TTS) — по количеству символов. Это позволит вам построить точные прогнозы расходов.