Речевой движок

Материал из LingvoWiki
Перейти к навигацииПерейти к поиску

Речевой движок или голосовой движок (англ. speech engine) — программа, синтезирующая речь.

В операционных системах семейства Windows для написания речевых движков используется программный интерфейс Microsoft Speech API, который позволяет любой программе.

В Linux основной программой синтеза речи является Festival. Также существует его легковесная альтернатива Flite. FreeTTS — это версия Flite, портированная на платформу Java.

Обзор существующих движков

Для русского языка существуют такие речевые движки:

  • Loquendo (голоса Ольга и Дмитрий)
  • Acapela Alyona TTS (голос Алёна) и Digalo 2000 Russian TTS/Acapela (Elan) SpeechCube 5.1 (голос Николай, устаревший движок) от компании Acapela Group
  • Nuance TTS (бывший ScanSoft RealSpeak) (голоса Катерина и Милена [новый]) от компании Nuance Communications (бывшая ScanSoft[1])
  • Sakrament (голоса Вика, Ирина, Ольга, Юлия, Вячеслав и Юрий) от белорусской комании "Сакрамент ИТ"

Устаревшие движки

  • L&H TTS 3000 Russian (голоса Светлана и Борис)
  • ViknoTTS (голос Олег) — устаревшая разработка, о которой, впрочем, стоит упомянуть, так как это единственный русский голосовой движок, созданный на общественных началах как полностью свободное ПО.

Примечания

  1. В сентябре 2005 года произошло слияние компаний в одну.

Ссылки