Cjklib: различия между версиями
Материал из LingvoWiki
Перейти к навигацииПерейти к поискуFujhi (обсуждение | вклад) м |
Fujhi (обсуждение | вклад) м |
||
Строка 9: | Строка 9: | ||
** Преобразование различных транскрипций (например, из ютпхиня в йельскую и обратно) | ** Преобразование различных транскрипций (например, из ютпхиня в йельскую и обратно) | ||
* [[has функция::Графическое разбиение иероглифов]] | * [[has функция::Графическое разбиение иероглифов]] | ||
− | ** Разбиение иероглифа на составные части (используются [[Данные о | + | ** Разбиение иероглифа на составные части (используются [[Данные о компонентах иероглифов Гэвина Грувера|данные Гэвина Грувера]]) |
** Поиск иероглифов с определёнными компонентами | ** Поиск иероглифов с определёнными компонентами | ||
* Поиск в словарях (поддерживаются словари в форматах CEDICT и EDICT; словари загружаются отдельно) | * Поиск в словарях (поддерживаются словари в форматах CEDICT и EDICT; словари загружаются отдельно) |
Версия 16:18, 16 июля 2012
cjklib — библиотека на языке Python для работы с китайскими иероглифами для китайского, японского, корейского и вьетнамского языков. В состав библиотеки входит большая база данных о символах. Автор проекта — has автор::Кристоф Бургмер.
Вся функциональсть библиотеки доступна как из языка Python. Вместе с библиотекой поставляется программа cjknife, предоставляющая те же функции с интерфейсом командной строки. Библиотека успешно работает в has платформа::Windows и has платформа::Linux. В качестве хранилища данных может использоваться библиотека SQLite 3 или MySQL.
Поддерживает следующие функции:
- Работа с чтениями иероглифов для китайского (has поддержка языка::путунхуа, кантонского, шанхайского), японского и корейского
- Поиск иероглифов с определённым чтением
- Получение чтения для иероглифа
- Преобразование различных транскрипций (например, из ютпхиня в йельскую и обратно)
- has функция::Графическое разбиение иероглифов
- Разбиение иероглифа на составные части (используются данные Гэвина Грувера)
- Поиск иероглифов с определёнными компонентами
- Поиск в словарях (поддерживаются словари в форматах CEDICT и EDICT; словари загружаются отдельно)
- Автоматическая загрузка словарей из интернета (в поставку библиотеки не входят)
Применения
Данная библиотека используется в следующих проектах:
- В словаре Eclectus ([1]), ещё одном проекте Кристофа Бургмера
- В системе рукописного ввода иероглифов Tegaki ([2]) для настройке данных о разбиении иероглифов
- В дополнении Pinyin Toolkit для системы интервального повторения Anki
- В методе ввода Vim 中文输入法 для редактора vim