Mystem: различия между версиями
м (убрали...) |
м (немножко сладкой семантики) |
||
Строка 1: | Строка 1: | ||
− | ''mystem'' (вероятно, от {{lang-en|my stemmer}}) — [[has функция::морфологический анализ]]атор для [[has поддержка языка::Русский язык|русского языка]] от компании [[Яндекс]]. Позволяет привести слова к начальной форме, узнать их грамматические характеристики и частоту встречаемости в русском тексте. В версии 1.0 также существовала возможность провести морфологический анализ и [[has поддержка языка::Английский язык|английского]] текста. По состоянию на июль 2012 года возможности скачать программу с официального сайта уже нет. | + | {{Недоступное ПО|вместо={{#ask: [[Категория:Программное обеспечение]] [[Категория:Доступные ресурсы]] [[has функция::Морфологический анализ]] [[has поддержка языка::Русский язык]] | intro=программы с аналогичной функциональностью:  }}}} |
+ | ''mystem'' (вероятно, от {{lang-en|my stemmer}}) — [[has функция::морфологический анализ]]атор для [[has поддержка языка::Русский язык|русского языка]] от компании [[Яндекс]]. Позволяет [[has функция::Леммантизация|привести слова к начальной форме]], узнать их грамматические характеристики и частоту встречаемости в русском тексте. В версии 1.0 также существовала возможность провести морфологический анализ и [[has поддержка языка::Английский язык|английского]] текста. По состоянию на июль 2012 года возможности скачать программу с официального сайта уже нет. | ||
− | Программа бесплатна для некоммерческого использования. Существуют версии для [[has платформа::Windows]], [[has платформа::Linux]], [[has платформа::FreeBSD]] и [[has платформа::MacOS X]]. | + | Программа была бесплатна для некоммерческого использования. Существуют версии для [[has платформа::Windows]], [[has платформа::Linux]], [[has платформа::FreeBSD]] и [[has платформа::MacOS X]]. |
Анализатор mystem используется в продуктах компании [[has автор::Яндекс]], он лёг в основу анализатора для [[Национальный корпус русского языка|Национального корпуса русского языка]]<ref>«Программное обеспечение для морфологической разметки Корпуса разработано Д. В. Панкратовым, А. Е. Поляковым и В. А. Титовым на базе программ автоматического морфологического анализа русских письменных текстов Mystem (разработка компании Яндекс) и Dialing (коллектив авторов под руководством А. В. Сокирко)» ([http://www.ruscorpora.ru/corpora-about.html О проекте. Национальный корпус русского языка])</ref> | Анализатор mystem используется в продуктах компании [[has автор::Яндекс]], он лёг в основу анализатора для [[Национальный корпус русского языка|Национального корпуса русского языка]]<ref>«Программное обеспечение для морфологической разметки Корпуса разработано Д. В. Панкратовым, А. Е. Поляковым и В. А. Титовым на базе программ автоматического морфологического анализа русских письменных текстов Mystem (разработка компании Яндекс) и Dialing (коллектив авторов под руководством А. В. Сокирко)» ([http://www.ruscorpora.ru/corpora-about.html О проекте. Национальный корпус русского языка])</ref> | ||
Строка 19: | Строка 20: | ||
* [http://company.yandex.ru/technology/mystem «О программе mystem»] на сайте компании Яндекс | * [http://company.yandex.ru/technology/mystem «О программе mystem»] на сайте компании Яндекс | ||
* [http://download.yandex.ru/company/iseg-las-vegas.pdf Segalovich I. «A fast morphological algorithm with unknown word guessing induced by a dictionary for a web search engine.», MLMTA-2003] (документ, описывающий принцип работы анализатора) | * [http://download.yandex.ru/company/iseg-las-vegas.pdf Segalovich I. «A fast morphological algorithm with unknown word guessing induced by a dictionary for a web search engine.», MLMTA-2003] (документ, описывающий принцип работы анализатора) | ||
− | |||
[[Категория:Программное обеспечение]] | [[Категория:Программное обеспечение]] | ||
[[Категория:Компьютерная лингвистика]] | [[Категория:Компьютерная лингвистика]] |
Версия 17:35, 9 июля 2012
Недоступное программное обеспечение Описанный в данной статье программный продукт на данный момент недоступен, статья имеет в первую очередь историческую ценность. Вместо него можно использовать {{#ask: has функция::Морфологический анализ has поддержка языка::Русский язык | intro=программы с аналогичной функциональностью: }}. |
mystem (вероятно, от англ. my stemmer) — has функция::морфологический анализатор для русского языка от компании Яндекс. Позволяет привести слова к начальной форме, узнать их грамматические характеристики и частоту встречаемости в русском тексте. В версии 1.0 также существовала возможность провести морфологический анализ и английского текста. По состоянию на июль 2012 года возможности скачать программу с официального сайта уже нет.
Программа была бесплатна для некоммерческого использования. Существуют версии для has платформа::Windows, has платформа::Linux, has платформа::FreeBSD и has платформа::MacOS X.
Анализатор mystem используется в продуктах компании has автор::Яндекс, он лёг в основу анализатора для Национального корпуса русского языка[1]
Принципы работы
Программа использует словарь часто встречаемых русских слов, а для остальных предлагает гипотетическую начальную форму.
Классификация словоформ
Принципы классификации словоформ значительно отличаются от общепринятых:
- в одну парадигму включены многие глаголы совершенного и несовершенного вида, отличающиеся суффиксом (закрывать{закрывать}, закрыть{закрывать})
- времена делятся на прошедшее и непрошедшее
Источники
- ↑ «Программное обеспечение для морфологической разметки Корпуса разработано Д. В. Панкратовым, А. Е. Поляковым и В. А. Титовым на базе программ автоматического морфологического анализа русских письменных текстов Mystem (разработка компании Яндекс) и Dialing (коллектив авторов под руководством А. В. Сокирко)» (О проекте. Национальный корпус русского языка)
Ссылки
- «О программе mystem» на сайте компании Яндекс
- Segalovich I. «A fast morphological algorithm with unknown word guessing induced by a dictionary for a web search engine.», MLMTA-2003 (документ, описывающий принцип работы анализатора)