Речевой движок: различия между версиями

Материал из LingvoWiki
Перейти к навигацииПерейти к поиску
(Новая страница: «'''Речевой движок''' или '''голосовой движок''' ({{Lang-en|speech engine}}) — программа, [[синтез речи|синт…»)
 
 
(не показано 10 промежуточных версий 2 участников)
Строка 1: Строка 1:
'''Речевой движок''' или '''голосовой движок''' ({{Lang-en|speech engine}}) — программа, [[синтез речи|синтезирующая речь]].
+
'''Речевой движок''', '''голосовой движок''' или '''синтезатор речи''' ({{Lang-en|speech engine}}) — программа, [[синтез речи|синтезирующая речь]].
  
В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе.
+
В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе обращаться ко всем поддерживающим его движкам (хотя реально это не всегда возможно, так как не все программы поддерживают полный набор функций Speech API, и, например, некоторые движки не работают в программе «Говорилка»).
  
В Linux основной программой синтеза речи является Festival. Также существует его легковесная альтернатива Flite. FreeTTS — это версия Flite, портированная на платформу Java.
+
В Linux основной программой синтеза речи является Festival. Также существует его легковесная альтернатива Flite. FreeTTS — это версия Flite, портированная на платформу Java. К сожалению, качество свободных синтезаторов уступает современным коммерческим продуктам.
 +
 
 +
== Обзор существующих движков ==
 +
Большая часть современных разработок ведётся на платформе Windows с использованием Microsoft Speech API 5, хотя существуют и разработки для мобильных устройств. Для русского языка существуют такие речевые движки:
 +
* '''[http://www.loquendo.com/en/technology/TTS.htm Loquendo TTS]''' (голоса ''Ольга'' и ''Дмитрий'')
 +
* '''Acapela Alyona TTS''' (голос ''Алёна'') и '''Digalo 2000 Russian TTS'''/'''Acapela''' ('''Elan''') '''SpeechCube 5.1''' (голос ''Николай'', устаревший движок) от компании [http://www.acapela-group.com Acapela Group]
 +
* '''Nuance&nbsp;TTS''' (бывший '''''ScanSoft&nbsp;RealSpeak''''') (голоса ''Катерина'' и ''Милена'' [новый]) от компании [http://www.nuance.com Nuance Communications] (бывшая ScanSoft<ref>В сентябре 2005 года произошло слияние компаний в одну.</ref>)
 +
* '''Sakrament''' (голоса ''Вика'', ''Ирина'', ''Ольга'', ''Юлия'', ''Вячеслав'' и ''Юрий'') от белорусской комании «[http://www.sakrament.com Сакрамент ИТ]»; есть версии для мобильных устройств (Symbian Edition, PDA Edition и Smartphone Edition)
 +
* '''Nokia Text-To-Speech''' (голос ''Ольга'') для чтения SMS на мобильных телефонах
 +
 
 +
=== Устаревшие движки ===
 +
* '''Lermnont&Hauspie TTS 3000''' Russian (голоса ''Светлана'' и ''Борис'')
 +
* '''ViknoTTS''' (голос ''Олег'') — устаревшая разработка, о которой, впрочем, стоит упомянуть, так как это единственный русский голосовой движок, созданный на общественных началах как полностью свободное ПО.
 +
<!-- Надо ещё разобраться, что есть название голоса, что — название движка, а что — название программы, которая всем этим добром пользуется
 +
Да и названия компаний тоже путаются. Плюс торговые марки, чтоб их! -->
 +
 
 +
== Примечания ==
 +
<references/>
  
 
== Ссылки ==
 
== Ссылки ==
 
* [http://lingvoforum.net/index.php?topic=25705.0 Тема «Речевой движок» на Лингвофоруме]
 
* [http://lingvoforum.net/index.php?topic=25705.0 Тема «Речевой движок» на Лингвофоруме]
 
* [http://lingvoforum.net/index.php?topic=23706.0 Тема «Голосовые технологии» на Лингвофоруме]
 
* [http://lingvoforum.net/index.php?topic=23706.0 Тема «Голосовые технологии» на Лингвофоруме]
 +
* [http://mytts.forum2x2.ru/ Обзор различных речевых движков, в т.ч. русских и украинских]
 
* [http://festlang.berlios.de/docu/doku.php?id=russianru Вроде festival по-русски; кто-то смотрел?]
 
* [http://festlang.berlios.de/docu/doku.php?id=russianru Вроде festival по-русски; кто-то смотрел?]
 +
 +
[[Категория:Компьютерная лингвистика]]
 +
[[Категория:Речь]]

Текущая версия на 05:43, 7 марта 2011

Речевой движок, голосовой движок или синтезатор речи (англ. speech engine) — программа, синтезирующая речь.

В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе обращаться ко всем поддерживающим его движкам (хотя реально это не всегда возможно, так как не все программы поддерживают полный набор функций Speech API, и, например, некоторые движки не работают в программе «Говорилка»).

В Linux основной программой синтеза речи является Festival. Также существует его легковесная альтернатива Flite. FreeTTS — это версия Flite, портированная на платформу Java. К сожалению, качество свободных синтезаторов уступает современным коммерческим продуктам.

Обзор существующих движков

Большая часть современных разработок ведётся на платформе Windows с использованием Microsoft Speech API 5, хотя существуют и разработки для мобильных устройств. Для русского языка существуют такие речевые движки:

  • Loquendo TTS (голоса Ольга и Дмитрий)
  • Acapela Alyona TTS (голос Алёна) и Digalo 2000 Russian TTS/Acapela (Elan) SpeechCube 5.1 (голос Николай, устаревший движок) от компании Acapela Group
  • Nuance TTS (бывший ScanSoft RealSpeak) (голоса Катерина и Милена [новый]) от компании Nuance Communications (бывшая ScanSoft[1])
  • Sakrament (голоса Вика, Ирина, Ольга, Юлия, Вячеслав и Юрий) от белорусской комании «Сакрамент ИТ»; есть версии для мобильных устройств (Symbian Edition, PDA Edition и Smartphone Edition)
  • Nokia Text-To-Speech (голос Ольга) для чтения SMS на мобильных телефонах

Устаревшие движки

  • Lermnont&Hauspie TTS 3000 Russian (голоса Светлана и Борис)
  • ViknoTTS (голос Олег) — устаревшая разработка, о которой, впрочем, стоит упомянуть, так как это единственный русский голосовой движок, созданный на общественных началах как полностью свободное ПО.

Примечания

  1. В сентябре 2005 года произошло слияние компаний в одну.

Ссылки