Shoda (věda o textu)

Pod Concordance (sahající až do lat . Concordare „match“) odkazuje na vědy o textu tradičně abecední seznam klíčových slov a frází, které se používají v písemné práci. Termín pochází z biblických studií , dnes hraje zásadní roli také v literární vědě a v příbuzných oborech a v poslední době také v korpusové lingvistice , podoblasti lingvistiky . V druhém případě může shoda ovlivnit také slova a fráze pocházející z ústních textů.

Dnes jsou konkordance obvykle elektronicky vytvářeny seznamy přístupů, které obvykle vyplývají z hledání slova nebo fráze, ale ve skutečnosti z hledání libovolného definovatelného řetězce znaků. V souladu se obvykle uvádí nejbližší jazykové prostředí hledaného výrazu, takzvaný kontext , například celá věta, ve které se hledané slovo vyskytuje.

Pojmy registr a index nebo index verborum („index slov“) se používají jako synonyma pro shodu . V korpusu a výpočetní lingvistice se termín Klíčové slovo v kontextu a jeho zkratka KWIC ustálil také jako výrazy pro hledaný výraz zobrazený v shodě.

Tvorba

Z tištěné védské verbální shody

Před dobou moderního zpracování dat bylo vytváření shody velmi pracné a časově náročné, a proto nákladné. Proto byly konkordance vytvářeny pouze pro díla, která byla zvlášť zajímavá, jako jsou náboženské texty ( Bible , Korán , Rigveda ) nebo pro díla velkých spisovatelů (např. William Shakespeare ). Již ve středověku byly vytvořeny sbírky dokumentů pro Bibli, ale také pro kanonické texty používající latinský výraz concordantia .

Typologicky existují dodnes dvě varianty:

  • Slovní konkordance dávají abecední pořadí všech vyskytujících se slov a idiomů s uvedením textové pasáže
  • Skutečné konkordance poskytují obsahovou kompilaci všech pasáží týkajících se konkrétní myšlenky nebo objektu.

Jelikož jsou nejdůležitější literární díla nyní k dispozici v digitalizované podobě, konkordance se nyní obvykle vytvářejí pomocí softwaru , který umožňuje pohodlné vyhledávání slov a frází - podobně jako u vyhledávače v síti WWW ( fulltextové vyhledávání ). Existuje již velké množství různých produktů určených pro různé účely - například pro Bibli celou řadu biblických programů a pro korpusovou lingvistiku, například „ WordSmith “. Takový software může být volitelně také provozovatelný online. Tomuto principu odpovídá i fulltextové vyhledávání v mnoha dalších digitalizovaných textech, jako jsou slovníky , encyklopedie a literární sbírky. V korpusové lingvistice, jejíž rozmach byl umožněn pouze moderní digitální technologií, se konkordance získávají buď z textových korpusů speciálně určených pro konkrétní výzkumný projekt, nebo z předem připravených textových sbírek, které jsou často přístupné také online.

Rané elektronicky vytvořené konkordance byly publikovány v tištěné podobě, například na řeckých básnících Hesiodovi a Homérovi z roku 1977. Tito již měli podobu reprezentace, která je dnes běžná v počítačových konkordancích . V tomto případě referenční bod obsahuje jeden řádek a příslušný hledaný výraz je uprostřed. V dnešní elektronické konkordanci však lze často změnit zobrazený rozsah textu obklopujícího hledaný výraz (například libovolný počet řádků, celá věta nebo celý odstavec).

Rozdíly mezi tradičně a elektronicky vytvářenými konkordancemi

S elektronicky vyrobenými konkordancemi lze překonat několik omezení předchozích konkordinací. Změnilo se zejména zaměření na jednotlivá slova:

  • Jednotlivá slova byla tradičně vybírána pro jejich vyhledávání v korpusu na základě hodnocení obsahu daným osobou - dnes cizím pohledem.
  • Jednotlivá slova byla redukována ze své současné podoby na základní formu, tj. Konjugované a odmítnuté tvary slov do příslušné základní podoby. Dnes jsou zaměřeny také konkrétní tvary slov.
  • Výchozím bodem hledání nemusí být pouze jedno slovo, ale jako kritérium hledání lze definovat celý text. Protože jednotlivá slova jsou vždy vložena do slovních řetězců a lze automaticky zkontrolovat, zda se jedno slovo v určitém řetězci ve zbytku korpusu stále používá častěji. Pohled jde od gramatických konstrukcí přes prázdné fráze, vzorce až po citace a plagiátorství.

Konkordance vytvořené pomocí moderní technologie již v několika ohledech neodpovídají konvenčnímu modelu tištěné konkordance:

  • Úplnost: Elektronicky vyrobené konkordance vždy uvádějí seznam dokumentů v korpusu v plném rozsahu - pokud není zamýšleno jinak.
  • Kritérium vyhledávání: Konvenční konkordance jsou založeny na hledání termínů souvisejících s obsahem , zatímco konkordance z digitálních korpusů uvádějí jednotlivé tvary slov (i když dotyčný termín a jeho slovní forma mohou být také písemně identické). Zda a jak lze a má být vytvořen most ke konvenční shodě (zahrnutí významů) ( lemmatizace klíčového slova ), je v současné době stále metodickým problémem filologické oblasti.
  • Možnosti vyhledávání: Na rozdíl od klasické metody vyhledávání nabízejí digitální korpusy velmi flexibilní strukturu vyhledávání. V nich například můžete hledat nejen jednotlivé tvary slov, ale také libovolné řetězce slov (které nemusí nutně být frází v gramatickém smyslu), jakož i kombinace slov, které nemusí v textovém korpusu vypadat jako řetěz.

Concordance software

Z elektronicky vytvořené shody slova „Nationalrat“ ve stenografických zápisech z jednání Rakouské národní rady

Pro účely jazykové analýzy existuje řada různých softwarových produktů. Kromě takzvaných taggerů (pro anotující korpusy) a analyzátorů (pro jejich syntaktickou analýzu) existuje řada konkordantorů pro generování konkordancí z korpusu , které jsou velmi odlišně navrženy a navrženy tak, aby splňovaly příslušné požadavky jednotlivých oblastí vědeckého výzkumu.

Například konkordanční program CoMOn , který primárně vyhovuje filologickým potřebám, umožňuje kontrolu úplného samostatného textu s až několika tisíci znaky, zda nemá vztah k okolnímu korpusu se do určité míry liší. Program také automaticky rozpozná, do jaké délky řetězce slov odpovídají. Programy jako Wordsmith Tools nebo AntConc, které se používají hlavně v lingvistice , nabízejí nejen generování shody, ale také řadu dalších funkcí, jako jsou analýzy kolokace , lemmatizace, extrakce klíčových slov nebo výstup statistických údajů o korpusu, například relace typu a symbolu .

použití

V závislosti na vědní disciplíně, výzkumné otázce , typu použitého softwaru a designu konkordance (korpus vybraného textu, jednotlivý výraz nebo fráze, rozsah uvažovaného lingvistického kontextu) lze konkordance použít odlišně. Se seznamem určitého jednotlivého výrazu lze určit například

  • V biblických studiích (prostřednictvím biblických konkordancí ) se na určitých místech vyskytuje určitý termín v různých vydáních Bible, ze kterých lze vyvodit závěry o praxi překladu do různých jazyků
  • v literárních studiích, jak často, ve kterých dílech a v jakých kontextech hledaný výraz používá určitý spisovatel, který je považován za součást určitého jazyka typického pro danou osobu ( idiolekt )
  • ve slovníku pravopisu, ve kterém různé významy určité slovo se objeví v určitém jazyce, ze kterého lze odvodit rozsah významů určitého termínu a - také důležité pro historickou lingvistiku - je možné popsat jevy jazykové změny v průběhu času
  • V obecné lingvistice, ve které se skloňované tvary nebo kterými jinými slovy se obvykle používá určité slovo, které lze použít například k prokázání jiného použití v písemném a ústním jazyce
  • Ve výzkumu výuky jazyků je míra , v jaké se určitý výraz často používá gramaticky správně nebo nesprávně, když se učí cizí jazyk, což má vliv například na konstrukci učebních materiálů.

Pomocí moderní technologie lze také vytvářet shody libovolných definovaných skupin několika jazykových znaků nebo slov ( N-gramů ). Tímto způsobem lze určit, zda a ve kterých textech se přednostně vyskytují kombinace slov (kolokace). Tímto způsobem lze rozeznat idiomatické výrazy, použití formulačních jazyků, citace, narážky atd., Což je předmětem zvláštního zájmu v příslušných vědeckých oborech.

Viz také

literatura

Individuální důkazy

  1. ^ Joseph R. Tebben: Hesiodova shoda. Počítačová shoda s Hesiodem , Olms, Hildesheim 1977, ISBN 3-487-06268-2
  2. ^ Joseph R. Tebben: Homerova shoda. Počítačová shoda s Homeric Hymns , Olms, Hildesheim 1977, ISBN 3-48706270-4

webové odkazy

Wikislovník: Shoda  - vysvětlení významů, původu slov, synonym, překladů
Software ke stažení (výběr)
Online software (výběr)