Синтез речи: различия между версиями
Demetrius (обсуждение | вклад) (дык хай жа хоць будзе) |
Bhudh (обсуждение | вклад) (Развернул чуток.) |
||
Строка 1: | Строка 1: | ||
'''Синтез речи''' — подраздел [[Компьютерная лингвистика|компьютерной лингвистики]], который рассматривает преобразование текста в текстовом виде в звуковое представление. | '''Синтез речи''' — подраздел [[Компьютерная лингвистика|компьютерной лингвистики]], который рассматривает преобразование текста в текстовом виде в звуковое представление. | ||
− | Синтез речи применяется тогда, когда | + | Синтез речи применяется тогда, когда получателем информации является человек, например, в информационно‑справочных системах. |
== Виды синтеза речи == | == Виды синтеза речи == | ||
Строка 8: | Строка 8: | ||
Компилятивный синтез речи предполагает составление фраз из заранее подготовленных частей. Такой метод позволяет получить результаты высокого качества, однако применим только в случаях, когда количество вариантов сообщения сравнительно ограничено. | Компилятивный синтез речи предполагает составление фраз из заранее подготовленных частей. Такой метод позволяет получить результаты высокого качества, однако применим только в случаях, когда количество вариантов сообщения сравнительно ограничено. | ||
− | Примером компилятивного синтеза речи являются объявления в белорусском транспорте: фразы | + | Примером компилятивного синтеза речи являются объявления в <!--белорусском -->транспорте: фразы «Осторожно, двери закрываются<!--Асцярожна, дзверы зачыняюцца. Наступны прыпынак: -->», «Следующая остановка:», «Остановка…» и названия остановок записаны диктором заранее и лишь соединяются вместе для оповещения по команде водителя или кондуктора. |
− | === | + | === Фонетический синтез речи === |
− | Синтез речи по правилам позволяет озвучить любой текст. Слова в таком случае формируются из отдельных единиц. В качестве таких единиц могут выступать элементы различных уровней языка: [[Аллофон|аллофоны]], | + | Синтез речи по фонетическим правилам позволяет озвучить любой текст. Слова в таком случае формируются из отдельных единиц. В качестве таких единиц могут выступать элементы различных уровней языка: [[Аллофон|аллофоны]], [[дифон]]ы (все переходы от одного аллофона к другому), сочетания нескольких аллофонов, [[Слог|слоги]] (как фонологическое единство) и более крупные единицы. |
− | |||
− | |||
+ | Фонетический синтез речи уступает в качестве компилятивному, однако он гораздо более гибок. Низкое качество обусловлено тем, что акустические качества фонем и фонемных сочетаний при программном синтезе постоянны, в то время как в живой речи они варьируют, что и порождает такие явления, как диалектный [[акцент]] или индивидуальную манеру речи, выговор. | ||
[[Категория:Компьютерная лингвистика]] | [[Категория:Компьютерная лингвистика]] |
Текущая версия на 16:10, 26 июня 2010
Синтез речи — подраздел компьютерной лингвистики, который рассматривает преобразование текста в текстовом виде в звуковое представление.
Синтез речи применяется тогда, когда получателем информации является человек, например, в информационно‑справочных системах.
Виды синтеза речи
Компилятивный синтез речи
Компилятивный синтез речи предполагает составление фраз из заранее подготовленных частей. Такой метод позволяет получить результаты высокого качества, однако применим только в случаях, когда количество вариантов сообщения сравнительно ограничено.
Примером компилятивного синтеза речи являются объявления в транспорте: фразы «Осторожно, двери закрываются», «Следующая остановка:», «Остановка…» и названия остановок записаны диктором заранее и лишь соединяются вместе для оповещения по команде водителя или кондуктора.
Фонетический синтез речи
Синтез речи по фонетическим правилам позволяет озвучить любой текст. Слова в таком случае формируются из отдельных единиц. В качестве таких единиц могут выступать элементы различных уровней языка: аллофоны, дифоны (все переходы от одного аллофона к другому), сочетания нескольких аллофонов, слоги (как фонологическое единство) и более крупные единицы.
Фонетический синтез речи уступает в качестве компилятивному, однако он гораздо более гибок. Низкое качество обусловлено тем, что акустические качества фонем и фонемных сочетаний при программном синтезе постоянны, в то время как в живой речи они варьируют, что и порождает такие явления, как диалектный акцент или индивидуальную манеру речи, выговор.