Синтез речи с переменными для обзвонов и IVR

Синтез, который умеет менять слова в аудиозаписи в реальном времени и озвучивать переменные голосом диктора. Естественно и без склеек!

Вебинар

Озвучка переменных в обзвонах и IVR: быстро, качественно, естественно

Как выбрать три опции из трех с гибридным синтезом

Смотреть запись

Что такое пользовательские переменные

Пользовательские переменные — это любые слова, номера, буквы, не предусмотренные в сценарии диалога. Они зависят от контекста, поэтому не озвучены диктором заранее.

Если во фразе несколько переменных, то вариантов озвучки всей реплики могут быть сотни — предзаписью эту задачу не решить. Чтобы робот мог произнести фразу с переменными голосом того же диктора, с его интонацией, а реплика при этом звучала естественно, без заметных склеек, нужна специальная технология. Такая технология есть у Just AI — гибридный синтез пользовательских переменных.

Чем полезен гибридный синтез

Технология позволяет отказаться от склеек аудио и озвучивать голосом диктора любые переменные вне зависимости от их количества. Реплики будут звучать естественно, даже если переменные станут известны только в момент звонка.

Для бизнеса

Повышает конверсию

Экономит время оператора

Ускоряет запуск проекта

Повышает конверсию

Реплики с переменными звучат естественно — клиенту комфортно говорить с роботом. Это влияет на конверсию диалогов при исходящих звонках.

Экономит время оператора

При входящих звонках качественный синтез помогает роботу довести разговор с клиентом до конца. Это снижает процент переводов на оператора.

Ускоряет запуск проекта

Гибридный синтез можно использовать с любыми голосами из каталога Just AI. Не нужно искать профессионального диктора и тратить время на обучение моделей для синтеза.

Для разработчика сценария

Озвучка любых переменных

Упрощенная работа над сценарием

Поддержка и сопровождение

Озвучка любых переменных

Можно озвучивать любые переменные и сущности, которые не были записаны диктором изначально.

Упрощенная работа над сценарием

Разработку сценария облегчает интерфейс управления и тестирования реплик, а про склейку аудиофайлов можно забыть.

Поддержка и сопровождение

Just AI проконсультирует по использованию технологии, возьмет на себя коммуникации с диктором и поможет запустить проект.

Примеры гибридного синтеза

Введите значения в поля и прослушайте результат синтеза

Имя пользователя

Добрый день, Введите Имя Ваш заказ готов.

Идет синтез...

0:00
/
0:00

Адрес

Ближайший к вам банкомат находится по адресу: Введите адрес

Идет синтез...

0:00
/
0:00

Название и стоимость услуги

В обновленном тарифе вам предоставляются Введите числоЕдиница измерения и безлимитный трафик в мессенджерах даже при нуле. Стоимость тарифа составляет Введите числоЕдиница измерения

Идет синтез...

0:00
/
0:00

Номер заказа и время доставки

Ваш заказ номер Введите номер будет доставлен Введите срок

Идет синтез...

0:00
/
0:00

Отличия гибридного синтеза от TTS и озвучки диктором

Решение

Параметры

Гибридный синтез

Постоянная часть сценария озвучивается диктором, а все переменные — гибридным синтезом

TTS

Весь сценарий озвучивается TTS (Text-to-Speech)

Диктор + TTS

Постоянная часть сценария и некоторые переменные озвучиваются диктором, а все остальные переменные — с помощью TTS. Все аудиодорожки склеиваются в единую фразу.

Скорость и простота озвучки

Средне*

Диктор озвучивает сценарий, а озвучка переменных происходит автоматически.

*При условии, что для диктора создана модель гибридного синтеза

Просто

Озвучка роботизированным голосом происходит автоматически. Но добиться натурального звучания реплики, эмоций и интонаций сложно.

Средне

На озвучку объемных справочников (городов, имен, адресов) уходит много времени. Дополнительно требуется технология склейки аудиодорожек: диктор и TTS для неозвученных переменных.

Простота управления тональностью речи

Средне

Чтобы изменить интонацию, диктору нужно записать шаблонные реплики заново.

Невозможно

Настройки интонации и эмоций недоступны.

Сложно

Для внесения изменений диктор должен записать заново весь набор реплик (все вариации с учетом переменных). TTS настроек тональности не имеет.

Насколько режет слух

Не режет

Синтез подстраивается под живую и динамичную речь диктора, поэтому переменные звучат естественно.

Сильно режет

Роботизированный голос сразу слышно. TTS не способен передавать эмоции и интонации живого человека.

Сильно режет

Места склейки аудиозаписей заметны на слух, потому что озвучка переменных (TTS) сильно отличается от голоса диктора.

Вывод

Гибридный синтез для естественного общения с клиентами

Гибридный синтез ускорит запуск и упростит поддержку телефонного проекта. Все изменения в сценарии, новые реплики и новые ветки не требуют переобучения основной AI-модели гибридного синтеза. А пользовательские переменные будут звучать органично.

Скорость и простота озвучки

Гибридный синтез

Постоянная часть сценария озвучивается диктором, а все переменные — гибридным синтезом

Средне*

Диктор озвучивает сценарий, а озвучка переменных происходит автоматически.

*При условии, что для диктора создана модель гибридного синтеза

TTS

Весь сценарий озвучивается TTS (Text-to-Speech)

Просто

Озвучка роботизированным голосом происходит автоматически. Но добиться натурального звучания реплики, эмоций и интонаций сложно.

Диктор + TTS

Постоянная часть сценария и некоторые переменные озвучиваются диктором, а все остальные переменные — с помощью TTS. Все аудиодорожки склеиваются в единую фразу.

Средне

На озвучку объемных справочников (городов, имен, адресов) уходит много времени. Дополнительно требуется технология склейки аудиодорожек: диктор и TTS для неозвученных переменных.

Простота управления тональностью речи

Гибридный синтез

Средне

Чтобы изменить интонацию, диктору нужно записать шаблонные реплики заново.

TTS

Невозможно

Настройки интонации и эмоций недоступны.

Диктор + TTS

Сложно

Для внесения изменений диктор должен записать заново весь набор реплик (все вариации с учетом переменных). TTS настроек тональности не имеет.

Насколько режет слух

Гибридный синтез

Не режет

Синтез подстраивается под живую и динамичную речь диктора, поэтому переменные звучат естественно.

TTS

Сильно режет

Роботизированный голос сразу слышно. TTS не способен передавать эмоции и интонации живого человека.

Диктор + TTS

Сильно режет

Места склейки аудиозаписей заметны на слух, потому что озвучка переменных (TTS) сильно отличается от голоса диктора.

Вывод

Гибридный синтез для естественного общения с клиентами

Гибридный синтез ускорит запуск и упростит поддержку телефонного проекта. Все изменения в сценарии, новые реплики и новые ветки не требуют переобучения основной AI-модели гибридного синтеза. А пользовательские переменные будут звучать органично.

Попробуйте гибридный синтез в своем проекте

Используйте в JAICP

Документация

Встраивайте по API

Документация

Сколько стоит внедрение гибридного синтеза

Наш диктор

Озвучка проекта нашим диктором = 3 000 рублей в час (≈ 10 реплик)

Стоимость каждой синтезированной реплики = 12 копеек

Ваш диктор

Стоимость проекта обсуждается индивидуально, включая скидки на стоимость синтезированной реплики

Спасибо за заявку!

Наш менеджер скоро свяжется с вами.

Отлично!

Вы подписались на видеоподкаст «Conversations with…». Теперь вы первым узнаете о выходе нового эпизода!