Mystem: различия между версиями

Материал из LingvoWiki
Перейти к навигацииПерейти к поиску
м (так вернее)
м
Строка 1: Строка 1:
 
{{Недоступное ПО|вместо={{#ask: [[Категория:Программное обеспечение]] [[Категория:Доступные ресурсы]] [[has функция::Морфологический анализ]] [[has поддержка языка::Русский язык]] | intro=программы с подобной функциональностью:  }}}}
 
{{Недоступное ПО|вместо={{#ask: [[Категория:Программное обеспечение]] [[Категория:Доступные ресурсы]] [[has функция::Морфологический анализ]] [[has поддержка языка::Русский язык]] | intro=программы с подобной функциональностью:  }}}}
''mystem'' (вероятно, от {{lang-en|my stemmer}}) — [[has функция::морфологический анализ]]атор для [[has поддержка языка::Русский язык|русского языка]] от компании [[Яндекс]]. Позволяет [[has функция::Леммантизация|привести слова к начальной форме]], узнать их грамматические характеристики и частоту встречаемости в русском тексте. В версии 1.0 также существовала возможность провести морфологический анализ и [[has поддержка языка::Английский язык|английского]] текста. По состоянию на июль 2012 года возможности скачать программу с официального сайта уже нет.
+
''mystem'' (вероятно, от {{lang-en|my stemmer}}) — [[функция::морфологический анализ]]атор для [[поддержка языка::Русский язык|русского языка]] от компании [[Яндекс]]. Позволяет [[функция::Леммантизация|привести слова к начальной форме]], узнать их грамматические характеристики и частоту встречаемости в русском тексте. В версии 1.0 также существовала возможность провести морфологический анализ и [[поддержка языка::Английский язык|английского]] текста. По состоянию на июль 2012 года возможности скачать программу с официального сайта уже нет.
  
Программа была бесплатна для некоммерческого использования. Существуют версии для [[has платформа::Windows]], [[has платформа::Linux]], [[has платформа::FreeBSD]] и [[has платформа::MacOS X]].
+
Программа была бесплатна для некоммерческого использования. Существуют версии для [[платформа::Windows]], [[платформа::Linux]], [[платформа::FreeBSD]] и [[платформа::MacOS X]].
  
Анализатор mystem используется в продуктах компании [[has автор::Яндекс]], он лёг в основу анализатора для [[Национальный корпус русского языка|Национального корпуса русского языка]]<ref>«Программное обеспечение для морфологической разметки Корпуса разработано Д. В. Панкратовым, А. Е. Поляковым и В. А. Титовым на базе программ автоматического морфологического анализа русских письменных текстов Mystem  (разработка компании Яндекс) и Dialing  (коллектив авторов под руководством А. В. Сокирко)» ([http://www.ruscorpora.ru/corpora-about.html О проекте. Национальный корпус русского языка])</ref>
+
Анализатор mystem используется в продуктах компании [[автор::Яндекс]], он лёг в основу анализатора для [[Национальный корпус русского языка|Национального корпуса русского языка]]<ref>«Программное обеспечение для морфологической разметки Корпуса разработано Д. В. Панкратовым, А. Е. Поляковым и В. А. Титовым на базе программ автоматического морфологического анализа русских письменных текстов Mystem  (разработка компании Яндекс) и Dialing  (коллектив авторов под руководством А. В. Сокирко)» ([http://www.ruscorpora.ru/corpora-about.html О проекте. Национальный корпус русского языка])</ref>
  
 
== Принципы работы ==
 
== Принципы работы ==

Версия 08:38, 26 июля 2012

Important.png Недоступное программное обеспечение
Описанный в данной статье программный продукт на данный момент недоступен, статья имеет в первую очередь историческую ценность.
Вместо него можно использовать {{#ask: has функция::Морфологический анализ has поддержка языка::Русский язык | intro=программы с подобной функциональностью: }}.

mystem (вероятно, от англ. my stemmer) — функция::морфологический анализатор для русского языка от компании Яндекс. Позволяет привести слова к начальной форме, узнать их грамматические характеристики и частоту встречаемости в русском тексте. В версии 1.0 также существовала возможность провести морфологический анализ и английского текста. По состоянию на июль 2012 года возможности скачать программу с официального сайта уже нет.

Программа была бесплатна для некоммерческого использования. Существуют версии для платформа::Windows, платформа::Linux, платформа::FreeBSD и платформа::MacOS X.

Анализатор mystem используется в продуктах компании автор::Яндекс, он лёг в основу анализатора для Национального корпуса русского языка[1]

Принципы работы

Программа использует словарь часто встречаемых русских слов, а для остальных предлагает гипотетическую начальную форму.

Классификация словоформ

Принципы классификации словоформ значительно отличаются от общепринятых:

  • в одну парадигму включены многие глаголы совершенного и несовершенного вида, отличающиеся суффиксом (закрывать{закрывать}, закрыть{закрывать})
  • времена делятся на прошедшее и непрошедшее

Источники

  1. «Программное обеспечение для морфологической разметки Корпуса разработано Д. В. Панкратовым, А. Е. Поляковым и В. А. Титовым на базе программ автоматического морфологического анализа русских письменных текстов Mystem (разработка компании Яндекс) и Dialing (коллектив авторов под руководством А. В. Сокирко)» (О проекте. Национальный корпус русского языка)

Ссылки