Tatoeba

Материал из LingvoWiki
Версия от 07:06, 15 октября 2010; Demetrius (обсуждение | вклад) (Чанг выставила статистику; тут она будет не лишней)
Перейти к навигацииПерейти к поиску

Tatoeba (от яп. たとえば например) — многоязычный корпус предложений, пополняемый сообществом пользователей. Все предложения из корпуса доступны для загрузки под свободной лицензией CC-BY.

История проекта

Администратор и создатель корпуса — француженка Хо Нгок Фуонг Чанг (Ho Ngoc Phuong Trang). Позже к ней присоединился второй администратор, Симон Аллан, также француз.

Основную часть корпуса до сих пор составляют предложения на английском и на японском, импортированные из корпуса Ясухито Танаки, являющегося общественным достоянием. Большая часть переводов с японского на французкий была импортирована с сайта TokiDoki.fr.

Первоначально заявлялось, что корпус Tatoeba является общественным достоянием. Однако, так как проект находится во Франции, где отсутствует возможность объявить свою работу общественным достоянием, 12 декабря 2009 года было принято решение распространять корпус по свободной лицензией Creative Commons Attribution[1].

В результате соглашения с ассоциацией Shtooka к некоторым предложениям появились аудиозаписи.

Поддерживаемые языки

На данный момент (14 октября) проект поддерживает 71 язык[2], причём наибольшее количество предложений на следующих языках:

На следующих языках есть больше десяти тысяч предложений: польский (более 16 000), русский (более 15 000), испанский (более 14 000), китайский язык (путунхуа; более 14 000), украинский (более 13 000).

На следующих языках есть более тысячи предложений: итальянский, голландский, португальский, литературный арабский, исландский, хинди, шанхайский китайский язык, уйгурский, турецкий, вьетнамский, норвежский (букмол), белорусский, иврит, гуандунский китайский язык.

Посещаемость

В сентябре сайт посетило 22 тысячи человек, которые просмотрели на нём 369 тысяч страниц[4].

Источники

Ссылки