Tatoeba

Ikona zeměkoule infoboxu
Tatoeba
Logo webových stránek
Sbírka příkladů vět
jazyky 345 (k říjnu 2019)
položky více než 7,9 milionu (k říjnu 2019)
uživatel přes 44 500 (k říjnu 2019)
Registrace nepoužívá se, vyžaduje se pouze pro spolupráci
On-line 2006
http://tatoeba.org/deu

Tatoeba je projekt, jehož název pochází z japonštiny a znamená „například“.

Tatoeba se skládá z velkého soupisu příkladných vět, které byly přeloženy téměř do všech dostupných jazyků. Funguje jako vícejazyčný překladový slovník , ve kterém nenajdete překlad slova, ale úplné věty v autentickém národním jazyce, ve kterém se hledané slovo vyskytuje. Každý registrovaný uživatel může přidávat věty i překládat věty. Korpus textu neobsahuje chyby, takže každý uživatel může překládat věty v jakémkoli jazyce bez ohledu na to, zda jazykem mluví nebo ne. Věty jsou postupně doplňovány zvukovými soubory.

Textová sbírka Tatoeba je založena na korpusu Tanaka , velké sbírce paralelních vět v japonštině a angličtině. Od roku 2006 bylo pod vedením Trang Ho přidáno mnoho dalších jazyků.

struktura

Grafická struktura Každý uzel představuje větu a každá šipka představuje spojení mezi dvěma větami. Jsou-li dvě věty přímo spojeny, mají stejný význam.

Kolekce vět je strukturována jako graf s uzly a šipkami: každý uzel představuje větu a každá šipka představuje spojení mezi dvěma větami. Jsou-li dvě věty přímo spojeny, mají stejný význam.

síť

Síť nabízí řadu způsobů, jak vyhledat a upravit věty. Každý registrovaný uživatel může přidávat, překládat, komentovat, přidávat klíčová slova a v případě potřeby upravovat nové věty. Ukázkové věty jsou uspořádány pod sebou ve všech dostupných jazycích.

Ceny

Tatoeba obdržela grant od Mozilla Drumbeat v prosinci 2010.

Některé práce na infrastruktuře Tatoeba byly financovány z Google Summer of Code, 2014.

V květnu 2018 získal projekt grant ve výši 25 000 USD z programu Mozilla Open Source Support (MOSS).

V srpnu 2019 získal projekt grant 15 000 USD z programu Mozilla Open Source Support (MOSS).

statistika

Na konci října 2019 bylo zastoupeno 345 jazyků. Z celkového počtu více než 7,9 milionu trestů bylo přibližně 1 236 000 napsáno v angličtině a 312 000 ve španělštině. Němčina je na 6. místě se 481 000 tresty.

Použití offline

Lze stáhnout data oddělená tabulátorem z Tatoeby, která lze použít pro import do Anki a podobného softwaru.

webové odkazy

Individuální důkazy

  1. yoyodyne - Od zítřka začíná budoucnost. »Nejlepší projekty Drumbeat: Tatoeba - bezplatná a otevřená databáze vět. 2. ledna 2011, zpřístupněno 31. října 2019 .
  2. Google Summer of Code 2014 Organization Association Tatoeba. Citováno 31. října 2019 .
  3. ^ Trang: Cena MOSS pro Tatoeba. Citováno 31. října 2019 .
  4. ^ Trang: Druhé ocenění MOSS. Citováno 1. listopadu 2019 .