Речевой движок
Материал из LingvoWiki
Речевой движок или голосовой движок (англ. speech engine) — программа, синтезирующая речь.
В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе.
В Linux основной программой синтеза речи является Festival. Также существует его легковесная альтернатива Flite. FreeTTS — это версия Flite, портированная на платформу Java.
Обзор существующих движков
Для русского языка существуют такие речевые движки:
- Loquendo (голоса Ольга и Дмитрий)
- Acapela Alyona TTS (голос Алёна) и Digalo 2000 Russian TTS/Acapela (Elan) SpeechCube 5.1 (голос Николай, устаревший движок) от компании Acapela Group
- Nuance TTS (бывший ScanSoft RealSpeak) (голоса Катерина и Милена [новый]) от компании Nuance Communications (бывшая ScanSoft[1])
- Sakrament (голоса Вика, Ирина, Ольга, Юлия, Вячеслав и Юрий) от белорусской комании "Сакрамент ИТ"
Устаревшие движки
- L&H TTS 3000 Russian (голоса Светлана и Борис)
- ViknoTTS (голос Олег) — устаревшая разработка, о которой, впрочем, стоит упомянуть, так как это единственный русский голосовой движок, созданный на общественных началах как полностью свободное ПО.
Примечания
- ↑ В сентябре 2005 года произошло слияние компаний в одну.