WebSound.ru Home
    Главная | Комментарии | Архив выпусков | Форум и чат | AudioTag.info | Музоблог | reTracked | Авторский блог  



  Поиск:

Поиск по WebSound.Ru:
Поиск в Интернете:
Powered by




  Партнеры, реклама:




Audio watermarking
TrustedAudio.com



 

Синтез речи

Очень редко, к сожалению, удается поговорить о синтезе речи. Ситуация в этой области довольно плачевная. Движки для синтеза речи существуют, но их немного, конкуренция слабая, поэтому развиваются они довольно медленно, да и вообще, всё что есть - в основном для английского языка. Современные движки являются гибридом чистого синтеза и готовых речевых фрагментов. Поэтому многие из современных движков (от AT&T, например) - просто огромного размера.

С русским языком все очень грустно. Я вообще не слышал о каких-то новинках для русского языка в последнее время. Довольно развитая речевая система имеется в Windows Vista (особенно в части распознавания речи), но там все для английского языка. Для русского я пока ничего не нашел.

В этой связи хотелось бы поговорить о том, что же имеется и, так сказать, доморощенных разработчиков. Есть ли вообще какие-то частные, пусть и простенькие, но собственные разработки?

Есть немного. Мне удалось обнаружить всего 3 проекта по синтезу речи, доступных с исходными кодами. Все три - в основном для английской речи.

Первая разработка - движок eSpeak. Его домашняя страничка располагается вот здесь: http://espeak.sourceforge.net/index.html. Как я понял, разработка была заброшена уже довольно давно. Но все-таки кое-какие наработки есть, есть и код, написанный на С++. На домашней страничке можно скачать сам синтезатор, документацию к нему и один (очень скудный) пример.

Еще один проект, уже гораздо серьезнее, называется незамысловато - Tet2Speech. Страничка проекта располагается тут: http://text2speech.sourceforge.net/. Движок написан на C# и на текущий момент работает только под Windows, однако предполагается его портирование и под Линукс. Проект, в отличие от предыдущего, вполне живой и обновляется довольно часто. Качество речи этого движка вполне приличное. Жаль, что поддерживается только английский язык. На страничке проекта можно скачать как программу, так и ее исходный код.

Есть и еще одна, более всеобъемлющая разработка. Festival - это универсальный голосовой движок, изначально разрабатываемый в Единбургском Университете. Разработка эта довольно старая, но очень комплексная, поэтому позволяющая ее расширения и модернизацию, вплоть до мультиязычности. Пакет является открытым и под определенными условиями распространяется с исходным кодом.
Страничка: http://www.cs.cmu.edu/~awb/festival_demos/index.html.
На основе Festival было создано его расширение под названием Festvox. Его страничка располагается тут: http://www.festvox.org/. Движок обеспечивает довольно пристойное качество речи. Пример можно самостоятельно сгенерировать прямо онлайн: http://www.festvox.org/voicedemos.html.

Так или иначе, это все, что мне удалось раздобыть. Ни один из представленных выше проектов по качеству речи не дотягивает и близко к коммерческим конкурентам. Про русский язык - и речи нет... :-)

Если вам есть, что добавить по этому поводу - пишите.

Вашими мыслями вы можете делиться в комментариях к заметке.



 

Читать весь 165-й номер 
Перейти в архив выпусков WebSound.Ru 



Ниже располагаются комментарии к этой заметке

Пожалуйста, обратите внимание! Если вы хотите что-то сообщить автору WebSound.Ru, лучше сделать это не здесь, а направить ваше сообщение по e-mail. Пожалуйста, составляйте свои комментарии в вежливой форме. Не засоряйте сайт бессодержательными и невежливыми сообщениями.


comments powered by Disqus