Tatoeba: различия между версиями

Материал из LingvoWiki
Перейти к навигацииПерейти к поиску
м (Категория:Лингвистические сайты)
(Чанг выставила статистику; тут она будет не лишней)
Строка 6: Строка 6:
 
Основную часть корпуса до сих пор составляют предложения на английском и на японском, импортированные из [[Корпус Ясухито Танаки|корпуса Ясухито Танаки]], являющегося общественным достоянием. Большая часть переводов с японского на французкий была импортирована с сайта [http://tokidoki.fr/ TokiDoki.fr].
 
Основную часть корпуса до сих пор составляют предложения на английском и на японском, импортированные из [[Корпус Ясухито Танаки|корпуса Ясухито Танаки]], являющегося общественным достоянием. Большая часть переводов с японского на французкий была импортирована с сайта [http://tokidoki.fr/ TokiDoki.fr].
  
Первоначально заявлялось, что корпус Tatoeba является общественным достоянием. Однако, так как проект находится во Франции, где отсутствует возможность объявить свою работу общественным достоянием, 12 декабря 2009 года было принято решение распространять корпус по свободной лицензией Creative Commons Attribution<ref>[http://blog.tatoeba.org/2009/12/tatoeba-update-dec-12th-2009.html Tatoeba Project Blog: Tatoeba update (Dec 12th, 2009]</ref>.
+
Первоначально заявлялось, что корпус Tatoeba является общественным достоянием. Однако, так как проект находится во Франции, где отсутствует возможность объявить свою работу общественным достоянием, 12 декабря 2009 года было принято решение распространять корпус по свободной лицензией Creative Commons Attribution<ref>[http://blog.tatoeba.org/2009/12/tatoeba-update-dec-12th-2009.html Tatoeba Project Blog: Tatoeba update (12 декабря 2009)]</ref>.
  
 
В результате соглашения с ассоциацией [[Shtooka]] к некоторым предложениям появились аудиозаписи.
 
В результате соглашения с ассоциацией [[Shtooka]] к некоторым предложениям появились аудиозаписи.
  
 
== Поддерживаемые языки ==
 
== Поддерживаемые языки ==
* Более 100 000 предложений: [[английский язык]], [[японский язык]]
+
На данный момент (14 октября) проект поддерживает 71 язык<ref>[http://blog.tatoeba.org/2010/10/some-stats.html Tatoeba Project Blog: Some stats (14 октября 2010)]</ref>, причём наибольшее количество предложений на следующих языках:
* Более 10 000 предложений: [[китайский язык]], [[немецкий язык]], [[польский язык]], [[французкий язык]]
+
* [[Английский язык]] (занял первое место по количеству предложений 4 сентября 2010 года<ref>[http://tatoeba.org/eng/wall/show_message/2662#message_2662]</ref>)
* Более 5 000 предложений: [[итальянский язык]], [[испанский язык]], [[русский язык]]
+
* [[Японский язык]] (в данный момент добавляется не очень много предложений, однако за счёт предложений из корпуса профессора Танаки язык долгое время был на первом месте по количеству предложений)
* Более 3 000 предложений:  [[голландский язык]], литературный [[арабский язык]], [[португальский язык]]
+
* [[Французкий язык]]
* Более 1 000 предложений: [[исландский язык]], [[норвежский язык]] (букмол), [[уйгурский язык]], [[украинский язык]]
+
* [[Эсперанто]]
* Более 500 предложений: [[гуандунский китайский язык]], [[финский язык]], [[шанхайский китайский язык]], [[шведский язык]], [[эсперанто]]
+
* [[Немецкий язык]]
* Более 100 предложений: [[баскский язык]], [[болгарский язык]], [[вьетнамский язык]], [[грузинский язык]], египетский [[арабский язык]], [[индонезийский язык]], [[иврит]], [[корейский язык]] [[румынский язык]], [[турецкий язык]]
+
 
 +
На следующих языках есть больше десяти тысяч предложений: [[Польский язык|польский]] (более 16 000), [[Русский язык|русский]] (более 15 000), [[Испанский язык|испанский]] (более 14 000), [[китайский язык]] (путунхуа; более 14 000), [[Украинский язык|украинский]] (более 13 000).
 +
 
 +
На следующих языках есть более тысячи предложений: [[Итальянский язык|итальянский]], [[Голландский язык|голландский]], [[Португальский язык|португальский]], литературный [[Арабский язык|арабский]], [[Исландский язык|исландский]], [[хинди]], [[шанхайский китайский язык]], [[Уйгурский язык|уйгурский]], [[Турецкий язык|турецкий]], [[Вьетнамский язык|вьетнамский]], [[Норвежский язык|норвежский]] (букмол), [[Белорусский язык|белорусский]], [[иврит]], [[гуандунский китайский язык]].
 +
 
 +
== Посещаемость ==
 +
В сентябре сайт посетило 22 тысячи человек, которые просмотрели на нём 369 тысяч страниц<ref>[http://blog.tatoeba.org/2010/10/some-stats.html Tatoeba Project Blog: Some stats (14 октября 2010)]</ref>.
  
 
== Источники ==
 
== Источники ==

Версия 07:06, 15 октября 2010

Tatoeba (от яп. たとえば например) — многоязычный корпус предложений, пополняемый сообществом пользователей. Все предложения из корпуса доступны для загрузки под свободной лицензией CC-BY.

История проекта

Администратор и создатель корпуса — француженка Хо Нгок Фуонг Чанг (Ho Ngoc Phuong Trang). Позже к ней присоединился второй администратор, Симон Аллан, также француз.

Основную часть корпуса до сих пор составляют предложения на английском и на японском, импортированные из корпуса Ясухито Танаки, являющегося общественным достоянием. Большая часть переводов с японского на французкий была импортирована с сайта TokiDoki.fr.

Первоначально заявлялось, что корпус Tatoeba является общественным достоянием. Однако, так как проект находится во Франции, где отсутствует возможность объявить свою работу общественным достоянием, 12 декабря 2009 года было принято решение распространять корпус по свободной лицензией Creative Commons Attribution[1].

В результате соглашения с ассоциацией Shtooka к некоторым предложениям появились аудиозаписи.

Поддерживаемые языки

На данный момент (14 октября) проект поддерживает 71 язык[2], причём наибольшее количество предложений на следующих языках:

На следующих языках есть больше десяти тысяч предложений: польский (более 16 000), русский (более 15 000), испанский (более 14 000), китайский язык (путунхуа; более 14 000), украинский (более 13 000).

На следующих языках есть более тысячи предложений: итальянский, голландский, португальский, литературный арабский, исландский, хинди, шанхайский китайский язык, уйгурский, турецкий, вьетнамский, норвежский (букмол), белорусский, иврит, гуандунский китайский язык.

Посещаемость

В сентябре сайт посетило 22 тысячи человек, которые просмотрели на нём 369 тысяч страниц[4].

Источники

Ссылки