Синтез речи

Материал из LingvoWiki
Перейти к навигацииПерейти к поиску

Синтез речи — подраздел компьютерной лингвистики, который рассматривает преобразование текста в текстовом виде в звуковое представление.

Синтез речи применяется тогда, когда получателем информации является человек, например, в информационно‑справочных системах.

Виды синтеза речи

Компилятивный синтез речи

Компилятивный синтез речи предполагает составление фраз из заранее подготовленных частей. Такой метод позволяет получить результаты высокого качества, однако применим только в случаях, когда количество вариантов сообщения сравнительно ограничено.

Примером компилятивного синтеза речи являются объявления в транспорте: фразы «Осторожно, двери закрываются», «Следующая остановка:», «Остановка…» и названия остановок записаны диктором заранее и лишь соединяются вместе для оповещения по команде водителя или кондуктора.

Фонетический синтез речи

Синтез речи по фонетическим правилам позволяет озвучить любой текст. Слова в таком случае формируются из отдельных единиц. В качестве таких единиц могут выступать элементы различных уровней языка: аллофоны, дифоны (все переходы от одного аллофона к другому), сочетания нескольких аллофонов, слоги (как фонологическое единство) и более крупные единицы.

Фонетический синтез речи уступает в качестве компилятивному, однако он гораздо более гибок. Низкое качество обусловлено тем, что акустические качества фонем и фонемных сочетаний при программном синтезе постоянны, в то время как в живой речи они варьируют, что и порождает такие явления, как диалектный акцент или индивидуальную манеру речи, выговор.