Tatoeba
Tatoeba | |
---|---|
Sbírka příkladů vět | |
jazyky | 345 (k říjnu 2019) |
položky | více než 7,9 milionu (k říjnu 2019) |
uživatel | přes 44 500 (k říjnu 2019) |
Registrace | nepoužívá se, vyžaduje se pouze pro spolupráci |
On-line | 2006 |
http://tatoeba.org/deu |
Tatoeba je projekt, jehož název pochází z japonštiny a znamená „například“.
Tatoeba se skládá z velkého soupisu příkladných vět, které byly přeloženy téměř do všech dostupných jazyků. Funguje jako vícejazyčný překladový slovník , ve kterém nenajdete překlad slova, ale úplné věty v autentickém národním jazyce, ve kterém se hledané slovo vyskytuje. Každý registrovaný uživatel může přidávat věty i překládat věty. Korpus textu neobsahuje chyby, takže každý uživatel může překládat věty v jakémkoli jazyce bez ohledu na to, zda jazykem mluví nebo ne. Věty jsou postupně doplňovány zvukovými soubory.
Textová sbírka Tatoeba je založena na korpusu Tanaka , velké sbírce paralelních vět v japonštině a angličtině. Od roku 2006 bylo pod vedením Trang Ho přidáno mnoho dalších jazyků.
struktura
Kolekce vět je strukturována jako graf s uzly a šipkami: každý uzel představuje větu a každá šipka představuje spojení mezi dvěma větami. Jsou-li dvě věty přímo spojeny, mají stejný význam.
síť
Síť nabízí řadu způsobů, jak vyhledat a upravit věty. Každý registrovaný uživatel může přidávat, překládat, komentovat, přidávat klíčová slova a v případě potřeby upravovat nové věty. Ukázkové věty jsou uspořádány pod sebou ve všech dostupných jazycích.
Ceny
Tatoeba obdržela grant od Mozilla Drumbeat v prosinci 2010.
Některé práce na infrastruktuře Tatoeba byly financovány z Google Summer of Code, 2014.
V květnu 2018 získal projekt grant ve výši 25 000 USD z programu Mozilla Open Source Support (MOSS).
V srpnu 2019 získal projekt grant 15 000 USD z programu Mozilla Open Source Support (MOSS).
statistika
Na konci října 2019 bylo zastoupeno 345 jazyků. Z celkového počtu více než 7,9 milionu trestů bylo přibližně 1 236 000 napsáno v angličtině a 312 000 ve španělštině. Němčina je na 6. místě se 481 000 tresty.
Použití offline
Lze stáhnout data oddělená tabulátorem z Tatoeby, která lze použít pro import do Anki a podobného softwaru.
webové odkazy
Individuální důkazy
- ↑ yoyodyne - Od zítřka začíná budoucnost. »Nejlepší projekty Drumbeat: Tatoeba - bezplatná a otevřená databáze vět. 2. ledna 2011, zpřístupněno 31. října 2019 .
- ↑ Google Summer of Code 2014 Organization Association Tatoeba. Citováno 31. října 2019 .
- ^ Trang: Cena MOSS pro Tatoeba. Citováno 31. října 2019 .
- ^ Trang: Druhé ocenění MOSS. Citováno 1. listopadu 2019 .