Zipfův zákon
Zákon Zipf (po George Kingsley Zipfovi , který tento zákon stanovil ve třicátých letech 20. století) je model, který umožňuje ten, jehož hodnotu lze odhadnout z jejich hodnosti pro určité velikosti, které jsou umístěny v hierarchii. Časté používání je zákon v lingvistice (lingvistice), zejména v korpusové lingvistice a kvantitativní lingvistice , kde pokračuje jako četnost slov v textu, aby se řadí do vztahu. Zipfův zákon znamenal počátek kvantitativní lingvistiky.
Je založen na mocenském zákoně, který je matematicky popsán Paretovým rozdělením nebo Zipfovým rozdělením .
Snadná distribuce zipu
Zjednodušené tvrzení Zipfova zákona zní: Pokud jsou prvky množiny - například slova textu - řazeny podle jejich četnosti, je pravděpodobnost jejich výskytu nepřímo úměrná místu na seznamu četností (zde se nazývá „hodnost "zkráceně):
Normalizační faktor pro prvky je prostřednictvím harmonické řady
dané a lze je zadat pouze pro konečné množiny. Z toho vyplývá:
Rozdělení pravděpodobnosti
Zipfův zákon má původ v lingvistice. Říká, že některá slova se objevují mnohem častěji než jiná a distribuce je podobná hyperbole . Například ve většině jazyků, čím jsou delší, tím méně často se objevují slova. Pořadí parametru pořadí n lze popsat jako kumulativní množství: Pořadí je synonymem počtu všech prvků, které mají stejnou velikost nebo větší než . Pro hodnost 1 existuje přesně jeden prvek, a to největší. Pro pozice 2 jsou dva, a to první a druhý prvek, pro 3 tři a tak dále.
Zipf má jednoduchý inverzní vztah k hodnosti: . V původní podobě je Zipfův zákon bez parametrů, to je .
Distribuce Zipf odpovídá Paretovu distribuci s vyměněnou souřadnicí a úsečkou :
- .
Oba jsou kumulativní distribuční funkce, které se řídí mocenským zákonem. Exponent funkce distribuční hustoty je odpovídajícím způsobem:
a pro jednoduchý případ :
- .
Příklady
Distribuce frekvencí slov v textu (levá grafika) zhruba kvalitativně odpovídá jednoduchému distribuci Zipf.
Zákon Zipf udává exponent kumulativního distribuční funkce předtím: .
Hodnota přizpůsobení pro kmitočty slova je však ekvivalentní exponentu Paretova rozdělení a exponentu funkce hustoty distribuce energie .
Distribuce písmenných frekvencí se také podobá distribuci Zipf. Statistiky založené na 20–30 písmenech však nestačí k přizpůsobení kurzu výkonovou funkcí.
Další příklad z článku Pareto Distribution se zabývá rozložením velikostí měst. I zde lze vidět spojení v jednotlivých zemích (např. V Německu), které se podle všeho řídí mocenským zákonem, ale s nápadnými odchylkami. Grafika vpravo porovnává aproximaci Zipf s naměřenými hodnotami. Lineární průběh logaritmického rozdělení podporuje předpoklad mocenského zákona. Na rozdíl od Zipfova domněnky nemá exponent hodnotu 1, ale hodnotu 0,77, což odpovídá exponentu distribuce hustoty výkonu . Tato teorie, podle které se počet obyvatel a velikosti měst, které se vyvíjejí nezávisle na sobě, přesto vyvíjejí podle nadřazeného zákona, se také používá ke stanovení očekávané velikosti lokalit .
Význam distribuce Zipf spočívá v rychlém kvalitativním popisu distribucí z nejrůznějších oblastí, zatímco Paretovo rozdělení zpřesňuje exponenta distribuce.
Například databáze je příliš malá na to, aby vyhovovala při určování počtu obyvatel pouze sedmi měst. Zákon Zipf poskytuje přibližné:
Pozice n | město | Obyvatelé | 1 / pozice | p ( n ) | p ( n ) lidí | Odchylka v procentech% |
---|---|---|---|---|---|---|
1 | Berlín | 3522896 | 1 | 0,39 | 3531136.31 | -0,23 |
2 | Hamburg | 1626220 | 0,5 | 0,19 | 1765568,15 | -8,57 |
3 | Mnichov | 1206683 | 0,33 | 0,13 | 1177045,44 | 2.46 |
4. místo | Kolín nad Rýnem | 946280 | 0,25 | 0,1 | 882784.08 | 6,71 |
5 | Frankfurt | 635150 | 0.2 | 0,08 | 706227,26 | -11,19 |
6. | Dortmund | 594058 | 0,17 | 0,06 | 588522,72 | 0,93 |
7. | jíst | 624445 | 0,14 | 0,06 | 504448.04 | 19,22 |
Důvody vzniku distribucí energie jsou diskutovány pod klíčovými slovy power law , scale law or self-organization .
Viz také
- Bradfordův zákon
- George Udny Yule (Yule Distribution)
literatura
- Helmut Birkhan : „Zipfscheův zákon“, slabý minulý čas a germánský zvukový posun (= Rakouská akademie věd. Filozoficko-historická třída. Zprávy ze zasedání. 348). Vydavatelství Rakouské akademie věd, Vídeň 1979, ISBN 3-700-10285-2 .
- David Crystal : Cambridge encyklopedie jazyka . Campus-Verlag, Frankfurt am Main a kol.1993 , ISBN 3-593-34824-1 .
- Xavier Gabaix : Zipfův zákon pro města: vysvětlení. In: The Quarterly Journal of Economics. 114, č. 3, 1999, str. 739-767, doi : 10,1162 / 003355399556133 .
- Henri Guiter , Michail V. Arapov (ed.): Studies on Zipf's Law (= Quantitative Linguistics. Vol. 16). Studienverlag Brockmeyer, Bochum 1982, ISBN 3-88339-244-8 .
- Matteo Marsili, Yi-Cheng Zhang: Interagující jednotlivci vedoucí k Zipfovu zákonu. In: Physical Review Letters. Vol.80, No. 12, 1998, str. 2741-2744, doi : 10,1103 / PhysRevLett.80,2741 .
- George Kingsley Zipf: Psycho-biologie jazyka. Úvod do dynamické filologie. Mifflin, Boston MA 1935, (The MIT Press, Cambridge MA 1968).
- George Kingsley Zipf: Lidské chování a princip nejmenšího úsilí. Úvod do ekologie člověka. Addison-Wesley, Cambridge MA 1949.
webové odkazy
- Rozsáhlá bibliografie ( Memento od 1. listopadu 2012 v internetovém archivu )
- Zipfův zákon a tvorba hudebního kontextu
- Zipfův zákon na příkladu německé slovní zásoby
- Zipf, Power-zákony a Pareto
- Použití hermetického čítače kmitočtu slov k ilustraci Zipfova zákona
- B. McCOWAN a kol .: Vhodné použití Zipfova zákona ve studiích komunikace na zvířatech . ANIMAL BEHAVIOR, 2005, 69, F1 - F7 (PDF; 167 kB)
- Zipfův zákon v hlavních faktorech Fibonacciho čísel
- Zipfův zákon v logistické rovnici
- Tobias Just a Patrick Stephan: Zipfův zákon a jeho důsledky pro městské regiony (PDF; 283 kB)
Individuální důkazy
- ↑ Christian Schluter, Mark Trede, 12. září 2013: Gibrat, Zipf, Fisher a Tippett: Přehodnoceno rozložení velikosti a růstu města (PDF; 494 kB; 29 stránek) nebo v internetovém archivu ( Memento od 10. června 2016 v Internet Archive ), zpřístupněno 29. července 2018.