WebSound.ru Home
    Главная | Комментарии | Архив выпусков | Форум и чат | AudioTag.info | Музоблог | reTracked | Авторский блог  



  Поиск:

Поиск по WebSound.Ru:
Поиск в Интернете:
Powered by




  Партнеры, реклама:




Audio watermarking
TrustedAudio.com



 

Грамотное озвучание русскоязычных текстов

Тема синтеза речи на сколько актуальна, на столько же бедна новостями, в особенности когда речь заходит о русском языке. Я уже неоднократно писал на эту тему, и вынужден заметить, что ситуация по-прежнему не меняется: качественных TTS-движков для русского языка нет.

Поэтому умельцам-энтузиастам приходится решать эту проблему подручными средствами. Как известно, движков для русской речи есть несколько. Основные их них - это движки Realspeak, Digalo и Sakrament. Качество речи в них не на столько плохое, на сколько плохое прочтение слов. Тут мы как бы разделяем синтез речи на две задачи: синтез звуков и правильное прочтение и разбор текстов. Синтез звуков - это лишь половина проблемы. Красивая речь характеризуется естественными звуками гласных и согласных, а также переходами между звуками, слогами, словами и правильной интонацией. Так вот, основная проблема существующих (уже давно) русскоговорящих движков - плохое прочтение. Т.е. в принципе, используя звукосинтезирующие возможности этих движков, при условии специальной предподготовки текстов, их можно заставить читать вполне неплохо. В этом направлении и отправился наш читатель Михаил Блюдников.

Михаил создал программу, которая осуществляет предварительную подготовку тестов перед прочтением их с использованием движков Realspeak Scansoft Katerina и Digalo Nikolai. Идея проста, процитирую описание автора программы:

Она позволяет расставить ударения (поддерживается формат двух наиболее популярных движков Realspeak Scansoft Katerina и Digalo Nikolai), при этом во-первых, используется большой словарь (больше 2.5 млн словоформ), но и работает алгоритм определения омонимов (слов с одинаковым написанием, но разным ударением).
* Омонимы вида нОги/ногИ, дОма/домА и т.п. распознаются на основе структуры предложений (ошибки бывают, но гораздо реже, чем без этой программы).
* Омонимы других типов выбираются по частоте встречаемости в русском языке и контексту.
* Кроме расстановки ударения, программа может так же озвучивать тексты (с помощью установленных в системе голосовых движков стандарта SAPI4/SAPI5) и записывать аудиокниги.
Очень интересная возможность программы - озвучивание сценариев (на разные голоса). При этом есть возможность вставлять дополнительные паузы, wav-файлы. В режиме записи сценария в аудиокнигу (wav-файл) можно также вводить дополнительные, непредусмотренные голосовым движком возможности - изменять частоту в больших пределах. Тем самым, даже один голосовой движок можно заставить говорить по-разному.

Программа, разработанная Михаилом, бесплатна и предоставляется в свободное пользование всем желающим.

Домашняя страничка программы, откуда её можно скачать: http://www.bludnikov.ru/soft.htm

Вашими мыслями вы можете делиться в комментариях к заметке.



 

Читать весь 169-й номер 
Перейти в архив выпусков WebSound.Ru 



Ниже располагаются комментарии к этой заметке

Пожалуйста, обратите внимание! Если вы хотите что-то сообщить автору WebSound.Ru, лучше сделать это не здесь, а направить ваше сообщение по e-mail. Пожалуйста, составляйте свои комментарии в вежливой форме. Не засоряйте сайт бессодержательными и невежливыми сообщениями.


comments powered by Disqus