Синтез речи
Синтез речи — подраздел компьютерной лингвистики, который рассматривает преобразование текста в текстовом виде в звуковое представление.
Синтез речи применяется тогда, когда получателем информации является человек, например, в информационно‑справочных системах.
Виды синтеза речи
Компилятивный синтез речи
Компилятивный синтез речи предполагает составление фраз из заранее подготовленных частей. Такой метод позволяет получить результаты высокого качества, однако применим только в случаях, когда количество вариантов сообщения сравнительно ограничено.
Примером компилятивного синтеза речи являются объявления в транспорте: фразы «Осторожно, двери закрываются», «Следующая остановка:», «Остановка…» и названия остановок записаны диктором заранее и лишь соединяются вместе для оповещения по команде водителя или кондуктора.
Фонетический синтез речи
Синтез речи по фонетическим правилам позволяет озвучить любой текст. Слова в таком случае формируются из отдельных единиц. В качестве таких единиц могут выступать элементы различных уровней языка: аллофоны, дифоны (все переходы от одного аллофона к другому), сочетания нескольких аллофонов, слоги (как фонологическое единство) и более крупные единицы.
Фонетический синтез речи уступает в качестве компилятивному, однако он гораздо более гибок. Низкое качество обусловлено тем, что акустические качества фонем и фонемных сочетаний при программном синтезе постоянны, в то время как в живой речи они варьируют, что и порождает такие явления, как диалектный акцент или индивидуальную манеру речи, выговор.