Речевой движок: различия между версиями
Demetrius (обсуждение | вклад) |
Hellerick (обсуждение | вклад) |
||
(не показаны 3 промежуточные версии 1 участника) | |||
Строка 1: | Строка 1: | ||
− | '''Речевой движок''' | + | '''Речевой движок''', '''голосовой движок''' или '''синтезатор речи''' ({{Lang-en|speech engine}}) — программа, [[синтез речи|синтезирующая речь]]. |
В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе обращаться ко всем поддерживающим его движкам (хотя реально это не всегда возможно, так как не все программы поддерживают полный набор функций Speech API, и, например, некоторые движки не работают в программе «Говорилка»). | В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе обращаться ко всем поддерживающим его движкам (хотя реально это не всегда возможно, так как не все программы поддерживают полный набор функций Speech API, и, например, некоторые движки не работают в программе «Говорилка»). | ||
Строка 7: | Строка 7: | ||
== Обзор существующих движков == | == Обзор существующих движков == | ||
Большая часть современных разработок ведётся на платформе Windows с использованием Microsoft Speech API 5, хотя существуют и разработки для мобильных устройств. Для русского языка существуют такие речевые движки: | Большая часть современных разработок ведётся на платформе Windows с использованием Microsoft Speech API 5, хотя существуют и разработки для мобильных устройств. Для русского языка существуют такие речевые движки: | ||
− | * '''[http://www.loquendo.com/en/technology/TTS.htm Loquendo TTS]''' (голоса Ольга и Дмитрий) | + | * '''[http://www.loquendo.com/en/technology/TTS.htm Loquendo TTS]''' (голоса ''Ольга'' и ''Дмитрий'') |
* '''Acapela Alyona TTS''' (голос ''Алёна'') и '''Digalo 2000 Russian TTS'''/'''Acapela''' ('''Elan''') '''SpeechCube 5.1''' (голос ''Николай'', устаревший движок) от компании [http://www.acapela-group.com Acapela Group] | * '''Acapela Alyona TTS''' (голос ''Алёна'') и '''Digalo 2000 Russian TTS'''/'''Acapela''' ('''Elan''') '''SpeechCube 5.1''' (голос ''Николай'', устаревший движок) от компании [http://www.acapela-group.com Acapela Group] | ||
* '''Nuance TTS''' (бывший '''''ScanSoft RealSpeak''''') (голоса ''Катерина'' и ''Милена'' [новый]) от компании [http://www.nuance.com Nuance Communications] (бывшая ScanSoft<ref>В сентябре 2005 года произошло слияние компаний в одну.</ref>) | * '''Nuance TTS''' (бывший '''''ScanSoft RealSpeak''''') (голоса ''Катерина'' и ''Милена'' [новый]) от компании [http://www.nuance.com Nuance Communications] (бывшая ScanSoft<ref>В сентябре 2005 года произошло слияние компаний в одну.</ref>) | ||
− | * '''Sakrament''' (голоса ''Вика, Ирина, Ольга, Юлия, Вячеслав'' и ''Юрий'') от белорусской комании «[http://www.sakrament.com Сакрамент ИТ]»; есть версии для мобильных устройств (Symbian Edition, PDA Edition и Smartphone Edition) | + | * '''Sakrament''' (голоса ''Вика'', ''Ирина'', ''Ольга'', ''Юлия'', ''Вячеслав'' и ''Юрий'') от белорусской комании «[http://www.sakrament.com Сакрамент ИТ]»; есть версии для мобильных устройств (Symbian Edition, PDA Edition и Smartphone Edition) |
* '''Nokia Text-To-Speech''' (голос ''Ольга'') для чтения SMS на мобильных телефонах | * '''Nokia Text-To-Speech''' (голос ''Ольга'') для чтения SMS на мобильных телефонах | ||
Строка 27: | Строка 27: | ||
* [http://mytts.forum2x2.ru/ Обзор различных речевых движков, в т.ч. русских и украинских] | * [http://mytts.forum2x2.ru/ Обзор различных речевых движков, в т.ч. русских и украинских] | ||
* [http://festlang.berlios.de/docu/doku.php?id=russianru Вроде festival по-русски; кто-то смотрел?] | * [http://festlang.berlios.de/docu/doku.php?id=russianru Вроде festival по-русски; кто-то смотрел?] | ||
+ | |||
+ | [[Категория:Компьютерная лингвистика]] | ||
+ | [[Категория:Речь]] |
Текущая версия на 05:43, 7 марта 2011
Речевой движок, голосовой движок или синтезатор речи (англ. speech engine) — программа, синтезирующая речь.
В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе обращаться ко всем поддерживающим его движкам (хотя реально это не всегда возможно, так как не все программы поддерживают полный набор функций Speech API, и, например, некоторые движки не работают в программе «Говорилка»).
В Linux основной программой синтеза речи является Festival. Также существует его легковесная альтернатива Flite. FreeTTS — это версия Flite, портированная на платформу Java. К сожалению, качество свободных синтезаторов уступает современным коммерческим продуктам.
Обзор существующих движков
Большая часть современных разработок ведётся на платформе Windows с использованием Microsoft Speech API 5, хотя существуют и разработки для мобильных устройств. Для русского языка существуют такие речевые движки:
- Loquendo TTS (голоса Ольга и Дмитрий)
- Acapela Alyona TTS (голос Алёна) и Digalo 2000 Russian TTS/Acapela (Elan) SpeechCube 5.1 (голос Николай, устаревший движок) от компании Acapela Group
- Nuance TTS (бывший ScanSoft RealSpeak) (голоса Катерина и Милена [новый]) от компании Nuance Communications (бывшая ScanSoft[1])
- Sakrament (голоса Вика, Ирина, Ольга, Юлия, Вячеслав и Юрий) от белорусской комании «Сакрамент ИТ»; есть версии для мобильных устройств (Symbian Edition, PDA Edition и Smartphone Edition)
- Nokia Text-To-Speech (голос Ольга) для чтения SMS на мобильных телефонах
Устаревшие движки
- Lermnont&Hauspie TTS 3000 Russian (голоса Светлана и Борис)
- ViknoTTS (голос Олег) — устаревшая разработка, о которой, впрочем, стоит упомянуть, так как это единственный русский голосовой движок, созданный на общественных началах как полностью свободное ПО.
Примечания
- ↑ В сентябре 2005 года произошло слияние компаний в одну.