Cjklib

Материал из LingvoWiki
Версия от 22:35, 10 мая 2011; Demetrius (обсуждение | вклад) (хочу попробовать поиграться с этой библиотекой, но пока что нет времени)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к навигацииПерейти к поиску

cjklib — библиотека на языке Python для работы с китайскими иероглифами для китайского, японского, корейского и вьетнамского языков. В состав библиотеки входит большая база данных о символах. Автор проекта — has автор::Кристоф Бургмер.

Вся функциональсть библиотеки доступна как из языка Python. Вместе с библиотекой поставляется программа cjknife, предоставляющая те же функции с интерфейсом командной строки. Библиотека успешно работает в has платформа::Windows и has платформа::Linux.

Поддерживает следующие функции:

  • Работа с чтениями иероглифов для китайского (has поддержка языка::путунхуа, кантонского, шанхайского), японского и корейского
    • Поиск иероглифов с определённым чтением
    • Получение чтения для иероглифа
    • Преобразование различных транскрипций (например, из ютпхиня в йельскую и обратно)
  • Графическое разбиение иероглифов
    • Разбиение иероглифа на составные части
    • Поиск иероглифов с определёнными компонентами
  • Поиск в словарях (поддерживаются словари в форматах CEDICT и EDICT; словари загружаются отдельно)
    • Автоматическая загрузка словарей из интернета (в поставку библиотеки не входят)

Применения

Данная библиотека используется в следующих проектах:

  • В словаре Eclectus ([1]), ещё одном проекте Кристофа Бургмера
  • В системе рукописного ввода иероглифов Tegaki ([2]) для настройке данных о разбиении иероглифов
  • В дополнении Pinyin Toolkit для системы интервального повторения Anki
  • В методе ввода Vim 中文输入法 для редактора vim

Ссылки