Использование гибридного синтеза при озвучивании сценария с помощью аудиозаписей позволяет роботу воспроизводить значение переменной тем же голосом, который звучит в исходном аудиофайле. Подробности о том, что такое гибридный синтез, а также ограничения и рекомендации по его использованию читайте в статье Гибридный синтез.
При записи аудиофайла учитывайте, что если диктор на записи будет говорить слишком быстро или слишком медленно, то синтез подстроится и будет произносить значения переменных с такой же скоростью, из-за чего переменные могут исказиться.
Обработайте аудиофайл с помощью любого аудиоредактора, например, Audacity:
2.1. Удалите тишину в начале и в конце записи. Это поможет избежать появления нежелательного шума в процессе синтеза.
2.2. Определите фрагмент аудиозаписи, который нужно заменить на значение переменной.
2.3. Определите точное время начала и длительность этого фрагмента в миллисекундах. Для этого выделите нужный фрагмент и выставите режим измерения Начало и длина выделения. Эти данные пригодятся для последующей разметки переменной в редакторе сценария.
При неточности более чем ~50мс могут возникать искажения и паузы в синтезе.
Перейдите в раздел Сценарии ботов в личном кабинете платформы.
Откройте нужный сценарий в редакторе сценариев.
Кликните на стартовый блок. Справа откроется окно с его настройками.
Выберите Тип аудио — Аудиозаписи, а Тип голоса — Гибридный синтез в разделе Озвучание.
Создайте переменную, значение которой нужно синтезировать. Например, значение переменной можно получить из ответа клиента. В таком случае выполните следующее:
5.1. Кликните на стрелку, выходящую из соответствующего блока Вопрос. Справа откроется окно со свойствами стрелки.
5.2. Введите желаемое название переменной в поле Название переменной в разделе Сохранить ответ. Название указывается без фигурных скобок.
Кликните на блок, в котором необходимо озвучить переменные. Справа откроется окно с его настройками.
Напишите полную транскрибацию фразы, произносимой в этом блоке, в поле Сообщение и замените в ней нужное слово на имя переменной в фигурных скобках. Если транскрибация будет отличаться от аудиозаписи, робот все равно будет пытаться озвучить текст, что может привести к неточностям синтеза. Если пропустить слово в транскрибации, то оно не будет озвучено.
Включите переключатель Гибридный синтез ниже в настройках блока. Поле Запись станет активным.
Нажмите на поле Запись, а затем на .
Выберите подготовленный ранее аудиофайл и нажмите кнопку Открыть. Загруженный аудиофайл будет прикреплен к блоку.
Разметьте звуковую дорожку в разделе Управление переменными, используя значения, полученные в шаге 3 в разделе Подготовка аудиофайла. Для этого:
11.1. Укажите время начала синтеза значения переменной в поле Начало. Значение задается относительно начала звуковой дорожки в миллисекундах.
11.2. Укажите длительность синтеза переменной в миллисекундах в поле Длина.
При разметке звуковой дорожки перед синтезируемой переменной и после нее необходимо делать отступ в 50 мс. Например, если во фразе синтезируемую переменную можно начать произносить с 2500 мс и она будет произноситься 1000 мс, то в поля Начало и Длина необходимо вписать 2450 и 1050 соответственно.
При изменении текста в блоке данные параметры будут сброшены и их потребуется ввести заново.
Если оба значения будут равны нулю, то при сохранении сценария будет возникать ошибка.
Если синтез звучит неестественно, делает ненужные паузы или, наоборот, паузы между естественной речью и синтезом отсутствуют, попробуйте отредактировать разметку переменной в разделе Гибридный синтез — Управление переменными в настройках блока, в котором используется гибридный синтез.
Смещайте разметку шагами не более 100мс, после чего сохраните сценарий и послушайте, как ведет себя синтез.
Для точной настройки можно делать смещения на 10-20мс.