Хотим рассказать вам об одном из наших сервисов — технологии распознавания и синтеза речи SpeechKit, разработка которой продолжается с 2013 года. Именно на основе SpeechKit работает Алиса — голосовой помощник Яндекса и приложение «Яндекс.Разговор: помощь глухим», чей код мы выложили в открытый доступ.
Одна из основных целей — это естественное звучание получившейся речи, которое стало возможным благодаря формированию речи из миллиона отдельно записанных фонем. Интонация и настроение задаются нейросетью, которую мы учили на примерах из реальной жизни. Также предоставляется возможность синтеза речи в реальном времени. Уже сейчас вы сможете разработать программное обеспечение с потоковым воспроизведением.
Для обмена данными с сервисом предусмотрен HTTP API: вам не придется разворачивать и поддерживать свою инфраструктуру, чтобы в сжатые сроки реализовывать нужные функции, а наша собственная позволит обработать огромное количество одновременных обращений.
Самыми популярными вариантами использования SpeechKit являются:
1. Автоматизация первой линии колл-центра и обзвон ваших клиентов;
2. Внедрение управления голосом на сайте или в приложении;
3. Нужда в ознакомлении с текстом на слух (TTS) или же наоборот (STT).
Возможности ограничены лишь вашей фантазией 🙂
Тарифы представлены в открытом виде на нашем сайте. Конечная стоимость формируется по длительности записи (STT), а когда на вход подаётся текст (TTS) — по количеству символов. Это позволит вам построить точные прогнозы расходов.
Одна из основных целей — это естественное звучание получившейся речи, которое стало возможным благодаря формированию речи из миллиона отдельно записанных фонем. Интонация и настроение задаются нейросетью, которую мы учили на примерах из реальной жизни. Также предоставляется возможность синтеза речи в реальном времени. Уже сейчас вы сможете разработать программное обеспечение с потоковым воспроизведением.
Для обмена данными с сервисом предусмотрен HTTP API: вам не придется разворачивать и поддерживать свою инфраструктуру, чтобы в сжатые сроки реализовывать нужные функции, а наша собственная позволит обработать огромное количество одновременных обращений.
Самыми популярными вариантами использования SpeechKit являются:
1. Автоматизация первой линии колл-центра и обзвон ваших клиентов;
2. Внедрение управления голосом на сайте или в приложении;
3. Нужда в ознакомлении с текстом на слух (TTS) или же наоборот (STT).
Возможности ограничены лишь вашей фантазией 🙂
Тарифы представлены в открытом виде на нашем сайте. Конечная стоимость формируется по длительности записи (STT), а когда на вход подаётся текст (TTS) — по количеству символов. Это позволит вам построить точные прогнозы расходов.