Речевой движок: различия между версиями

Материал из LingvoWiki
Перейти к навигацииПерейти к поиску
м (кавычки и мобителефоны)
м
Строка 1: Строка 1:
 
'''Речевой движок''' или '''голосовой движок''' ({{Lang-en|speech engine}}) — программа, [[синтез речи|синтезирующая речь]].
 
'''Речевой движок''' или '''голосовой движок''' ({{Lang-en|speech engine}}) — программа, [[синтез речи|синтезирующая речь]].
  
В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе.
+
В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе обращаться ко всем поддерживающим его движкам (хотя реально это не всегда возможно, так как не все программы поддерживают полный набор функций Speech API, и, например, некоторые движки не работают в программе «Говорилка»).
  
В Linux основной программой синтеза речи является Festival. Также существует его легковесная альтернатива Flite. FreeTTS — это версия Flite, портированная на платформу Java.
+
В Linux основной программой синтеза речи является Festival. Также существует его легковесная альтернатива Flite. FreeTTS — это версия Flite, портированная на платформу Java. К сожалению, качество свободных синтезаторов уступает современным коммерческим продуктам.
  
 
== Обзор существующих движков ==
 
== Обзор существующих движков ==
 
Большая часть современных разработок ведётся на платформе Windows с использованием Microsoft Speech API 5, хотя существуют и разработки для мобильных устройств. Для русского языка существуют такие речевые движки:
 
Большая часть современных разработок ведётся на платформе Windows с использованием Microsoft Speech API 5, хотя существуют и разработки для мобильных устройств. Для русского языка существуют такие речевые движки:
 
* '''[http://www.loquendo.com/en/technology/TTS.htm Loquendo]''' (голоса Ольга и Дмитрий)
 
* '''[http://www.loquendo.com/en/technology/TTS.htm Loquendo]''' (голоса Ольга и Дмитрий)
* '''Acapela Alyona TTS''' (голос Алёна) и '''Digalo 2000 Russian TTS'''/'''Acapela''' ('''Elan''') '''SpeechCube 5.1''' (голос Николай, устаревший движок) от компании [http://www.acapela-group.com Acapela Group]
+
* '''Acapela Alyona TTS''' (голос ''Алёна'') и '''Digalo 2000 Russian TTS'''/'''Acapela''' ('''Elan''') '''SpeechCube 5.1''' (голос ''Николай'', устаревший движок) от компании [http://www.acapela-group.com Acapela Group]
* '''Nuance&nbsp;TTS''' (бывший '''''ScanSoft&nbsp;RealSpeak''''') (голоса Катерина и Милена [новый]) от компании [http://www.nuance.com Nuance Communications] (бывшая ScanSoft<ref>В сентябре 2005 года произошло слияние компаний в одну.</ref>)
+
* '''Nuance&nbsp;TTS''' (бывший '''''ScanSoft&nbsp;RealSpeak''''') (голоса ''Катерина'' и ''Милена'' [новый]) от компании [http://www.nuance.com Nuance Communications] (бывшая ScanSoft<ref>В сентябре 2005 года произошло слияние компаний в одну.</ref>)
* '''Sakrament''' (голоса Вика, Ирина, Ольга, Юлия, Вячеслав и Юрий) от белорусской комании «[http://www.sakrament.com Сакрамент ИТ]»; есть версии для мобильных устройств (Symbian Edition, PDA Edition и Smartphone Edition)
+
* '''Sakrament''' (голоса ''Вика, Ирина, Ольга, Юлия, Вячеслав'' и ''Юрий'') от белорусской комании «[http://www.sakrament.com Сакрамент ИТ]»; есть версии для мобильных устройств (Symbian Edition, PDA Edition и Smartphone Edition)
* Nokia Text-To-Speech (голос Ольга) для чтения SMS на мобильных телефонах
+
* '''Nokia Text-To-Speech''' (голос ''Ольга'') для чтения SMS на мобильных телефонах
  
 
=== Устаревшие движки ===
 
=== Устаревшие движки ===
* '''L&H TTS 3000''' Russian (голоса Светлана и Борис)
+
* '''Lermnont&Hauspie Text-To-Speech 3000''' Russian (голоса ''Светлана'' и ''Борис'')
* '''ViknoTTS''' (голос Олег) — устаревшая разработка, о которой, впрочем, стоит упомянуть, так как это единственный русский голосовой движок, созданный на общественных началах как полностью свободное ПО.
+
* '''ViknoTTS''' (голос ''Олег'') — устаревшая разработка, о которой, впрочем, стоит упомянуть, так как это единственный русский голосовой движок, созданный на общественных началах как полностью свободное ПО.
 
<!-- Надо ещё разобраться, что есть название голоса, что — название движка, а что — название программы, которая всем этим добром пользуется
 
<!-- Надо ещё разобраться, что есть название голоса, что — название движка, а что — название программы, которая всем этим добром пользуется
 
Да и названия компаний тоже путаются. Плюс торговые марки, чтоб их! -->
 
Да и названия компаний тоже путаются. Плюс торговые марки, чтоб их! -->

Версия 10:54, 25 июня 2010

Речевой движок или голосовой движок (англ. speech engine) — программа, синтезирующая речь.

В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе обращаться ко всем поддерживающим его движкам (хотя реально это не всегда возможно, так как не все программы поддерживают полный набор функций Speech API, и, например, некоторые движки не работают в программе «Говорилка»).

В Linux основной программой синтеза речи является Festival. Также существует его легковесная альтернатива Flite. FreeTTS — это версия Flite, портированная на платформу Java. К сожалению, качество свободных синтезаторов уступает современным коммерческим продуктам.

Обзор существующих движков

Большая часть современных разработок ведётся на платформе Windows с использованием Microsoft Speech API 5, хотя существуют и разработки для мобильных устройств. Для русского языка существуют такие речевые движки:

  • Loquendo (голоса Ольга и Дмитрий)
  • Acapela Alyona TTS (голос Алёна) и Digalo 2000 Russian TTS/Acapela (Elan) SpeechCube 5.1 (голос Николай, устаревший движок) от компании Acapela Group
  • Nuance TTS (бывший ScanSoft RealSpeak) (голоса Катерина и Милена [новый]) от компании Nuance Communications (бывшая ScanSoft[1])
  • Sakrament (голоса Вика, Ирина, Ольга, Юлия, Вячеслав и Юрий) от белорусской комании «Сакрамент ИТ»; есть версии для мобильных устройств (Symbian Edition, PDA Edition и Smartphone Edition)
  • Nokia Text-To-Speech (голос Ольга) для чтения SMS на мобильных телефонах

Устаревшие движки

  • Lermnont&Hauspie Text-To-Speech 3000 Russian (голоса Светлана и Борис)
  • ViknoTTS (голос Олег) — устаревшая разработка, о которой, впрочем, стоит упомянуть, так как это единственный русский голосовой движок, созданный на общественных началах как полностью свободное ПО.

Примечания

  1. В сентябре 2005 года произошло слияние компаний в одну.

Ссылки