Kvantitatívna lingvistika

z Wikipédie, slobodnej encyklopédie
Skočit na navigaci Skočit na vyhledávání

Kvantitatívna lingvistika je poddisciplínou všeobecnej jazykovedy, presnejšie poddisciplínou matematickej lingvistiky. Predmetom kvantitatívnej jazykovedy je akvizícia, zmena, používanie a štruktúra prirodzeného jazyka. Skúma jazyky používajúc kombinatoriku, teóriu pravdepodobnosti, diferenčné a diferenciálne rovnice a testuje výsledky pomocou štatistických metód.[1] Jej hlavným cieľom je formulovať zákony jazyka[2], aby mohla vybudovať teóriu jazyka, chápanú ako systém usúvzťažnených jazykových zákonov. Tento cieľ si postavila od počiatku predovšetkým synergetická lingvistika.

Kvantitatívna lingvistika sa opiera empiricky o výsledky jazykovej štatistiky, ktorú možno považovať buď za štatistiku jazykov alebo za štatistiku ľubovoľných jazykových javov. Táto oblasť nemusí mať bezpodmienečne nejaké teoretické nároky. Dôležité dáta dodávajú aj korpusová a počítačová lingvistika.

Počiatky kvantitatívnej lingvistiky možno nájsť už v gréckej a indickej antike. Jednou z tradícií je aplikácia kombinatoriky na jazykové javy [3], druhá spočíva na elementárnych štatistických výberoch, ktoré možno nájsť pod heslami kolometria a stichometria.[4]

Jazykové zákony v kvantitatívnej lingvistike[upraviť | upraviť zdroj]

Pod zákonom sa v kvantitatívnej lingvistike rozumie všeobecná výpoveď (t.j. platná pre všetky jazyky splňujúce isté podmienky, odvodená z teoretických predpokladov, formulovaná matematicky, usúvzťažnená s inými zákonmi a empiricky dostatočne overená, pričom nebola ani raz zamietnutá. K úlohe zákonov poznamenáva Köhler: „…vlastnosti jazykových prvkov a ich vzťahy podliehajú všeobecným zákonom, ktoré sa dajú rigorózne matematicky formulovať, tak ako to poznáme z prírodných vied. Pritom si treba uvedomiť, že ide o stochastické zákony; nie sú splnené v každom jednotlivom prípade (čo nie je ani možné, ani nutné), ale predpisujú pravdepodobnosti, s ktorými isté javy alebo pomery v základnom súbore nastávajú. Ku všetkým uvedeným príkladom sa dajú ľahko nájsť odchýlky, ktoré sa jednotlivo neprehrešujú proti daným zákonom, lebo odchýlky od štatistických priemerov sú nielen prípustné, ale aj potrebné a sú kvantitatívne presne určené. Táto situácia sa v podstate neodlišuje od situácie v prírodných vedách, v ktorých staré deterministické predstavy už vymreli a boli nahradené tiež štatisticko-probabilistickými modelmi.“[5]

Niektoré jazykové zákony[upraviť | upraviť zdroj]

Existuje celý rad návrhov na jazykové zákony, napríklad:

  • Zákon diverzifikácie: Ak jazykové kategórie ako slovné druhy alebo flektívne koncovky vykazujú rôzne formy, tak sa dá ukázať, že početnosti, s ktorými sa tieto formy vyskytujú v textoch, sa riadia zákonmi.
  • Zákon rozdelenia početností jednotiek rozličnej dĺžky alebo všeobecnejšie, rozličnej komplexity. Ak skúmame, ako často sú jednotky istého druhu v texte alebo v slovníku zastúpené, tak zistíme, že sa správajú podľa istých pravdepodobnostných rozdelení. K dispozícii sú rozsiahle výskumy:
    • k zákonu rozdelenia dĺžok morf
    • k zákonu rozdelenia rytmických jednotiek rozličných dĺžok
    • k zákonu rozdelenia dĺžok viet
    • k zákonu rozdelenia znakov písma rozličnej komplexity
    • k zákonu rozdelenia slabičných dĺžok
    • k zákonu rozdelenia slovných dĺžok

Tomuto zákonu dĺžky podliehajú aj iné jazykové jednotky ako dĺžky kláuz, fráz, hrebov[6], rečových aktov[7], podobne platí aj pre rozdelenie dĺžky hlások.[8]

  • Martinov zákon: ak skúmame, ktoré slovo je ako heslo schopné zachytiť iné slovo, a pokračujeme v hľadaní ďalšieho vysvetľujúceho slova pre toto heslo, dôjdeme k celému radu hesiel. Ak to urobíme pre veľa slov, dostaneme hierarchiu stále všeobecnejších slov, ktorých je vždy menej. Medzi rovinami tejto hierarchie vládnu zákonité vzťahy.
  • Menzerathov zákon, v jazykovede tiež Menzerath-Altmannov zákon: tento zákon tvrdí, že čím viac komponentov má nejaká jednotka, tým kratšími sa stávajú komponenty.
  • Rangovo-frekvenčný zákon, týkajúci sa rozličných jazykových javov. Ak skúmame vo veľkom korpuse textov, ktoré slovo je najčastejšie, druhé najčastejšie atď., tak dostaneme isté poradie slov podľa frekvencie. Pre takéto poradie boli v literatúre navrhnuté rozličné matematické modely. Túto metódu možno v podstate aplikovať na ľubovoľné jazykové jednotky. Tu uvedieme len niektoré príklady:
    • Frekvencie hlások, foném, písmen: Jednotky sa zoradia podľa početnosti, s akou sa vyskytujú v texte alebo v slovníku.[9]
    • Asociácie slov: skúma sa, ktoré slová asociujú s tým, ktoré bolo predložené pokusnej osobe ako stimul.[10]
    • Početnosti slov: slová z korpusu sa zoradia do rangového poradia podľa početnosti.
  • Zákon jazykových zmien: rast slovníka, prjímanie pôžičiek (cudzích slov), zmeny vo flektívnom systéme a mnohé iné zmeny v jazyku sa riadia týmto zákonom, ktorý sa v jazykovede nazýva Piotrovkého zákonom a zodpovedá zákonom rastu v iných vedách (por. logistickú rovnicu). Tento zákon sa presadzuje aj pri učení sa jazyka, takže ho možno považovať aj za zákon osvojovania si jazyka.
  • Zákon textových pasáží: ak sa v texte stanovia rovnako dlhé pasáže, tak možno ukázať, že početnosť jazykových jednotiek v týchto pasážach je rozdelená zákonito.
  • Zipfov zákon, lepšie povedané Zipfove zákony: vo všeobecnosti platí, že súčin rangu a frekvencie vo frekvenčnom slovníku je približne konštantný. Hovoríme o Zipfových zákonoch preto, lebo to nie je jediný zákon, ktorý Zipf navrhol.

Na druhej strane sa možno pýtať, ktoré zákony možno očakávať pri určitých jazykových jednotkách. Altmann to rozvinul na príklade kompozít. V tomto prípade sa našiel celý rad hypotéz, ktoré ešte čakajú na overenie. Jeden z výsledkov je napríklad skutočnosť, že kratšie slová sa častejšie podieľajú na tvorení derivátov a kompozít ako dlhšie.[11] Aj polysémia slov ovplyvňuje mieru tvorenia kompozít.[12]

Výskum štýlu[upraviť | upraviť zdroj]

Výskum literárnych a aj neliterárnych štýlov môže používať štatistika; ale okrem toho sa môže venovať aj výskumu pôsobenia zákonov v istých štýloch. V takých prípadoch podporuje kvantitatívna lingvistika štylistiku pri hľadaní objektívnych poznatkov a pomáha jej vysvetliť štylistické javy aspoň čiastočne opieraním sa o jazykové zákony. K základným predpokladom kvantitatívnej lingvistiky patrí, že pripúšťa napr. pre rozdelenie slovných dĺžok existenciu rozličných modelov alebo aspoň existenciu odlišných parametrov pre odlišné druhy textov a jazykov. Ak tieto výskumy platia hlavne pre literárne texty, tak je kvantitatívna štylistika (štýlometria) poddisciplínou kvantitatívnej lingvistiky.

Známi autori:

  • Gabriel Altmann (1931)
  • Hans Arens (1911–2003)[13]
  • Rolf Harald Baayen (1958)[14]
  • Otto Behaghel (1854–1936); viď aj Behaghelove zákony
  • Adolf Busemann (Psychologe) (1887–1967)[15]
  • Sergej Grigor'evič Čebanov (1898–1965)
  • Moritz Wilhelm Drobisch (1802–1896)
  • Sheila Embleton (1954)[16]
  • William Palin Elderton (1877–1962)[17]
  • Ernst Wilhelm Förstemann (1822–1906)[18]
  • Wilhelm Fucks (1902–1990)[19]
  • Georg von der Gabelentz (1840–1893)[20]
  • Hans Goebl (1943)
  • Peter Grzybek[21]
  • Pierre Guiraud (1912–1983)
  • Gustav Herdan (1897–1968)
  • Luděk Hřebíček (1934)
  • Friedrich Wilhelm Kaeding (1843–1928)
  • Emmerich Kelih (1964)[22]
  • Karl Knauer (1906–1966)[23]
  • Reinhard Köhler (1951)[24]
  • Werner Lehfeldt (1943)[25]
  • Gottfried Wilhelm Leibniz (1646–1716)[26]
  • Viktor Vasiľevič Levickij (1938)[27]
  • Karl Marbe (1869–1953)[28]
  • Helmut Meier (1897–1973)
  • Paul Menzerath (1883–1954)[29]
  • Sizuo Mizutani (1926)[30]
  • Augustus De Morgan (1806–1871)
  • Charles Muller (1909)[31]
  • Raijmund G. Piotrowski (1922–2009)[32]
  • Anatolij A. Polikarpov
  • Ioan-Iovitz Popescu (1932)[33]
  • Burghard Rieger (1937)
  • August Schleicher (1821–1868)[34]
  • L.A. Sherman
  • Juhan Tuldava (1922–2003)[35]
  • Albert Thumb (1865–1915)
  • Bohumil Trnka (1895–1984)[36]
  • George Kingsley Zipf (1902–1950); v. tiež: Zipfov zákon
  • Eberhard Zwirner (1899–1984); v. tiež: zákon pasáží

Referencie[upraviť | upraviť zdroj]

  1. Burghard Rieger: Warum mengenorientierte Textwissenschaft? Zur Begründung der Statistik als Methode in: Gunzenhäuser, R. (Hrsg.): Mathematisch orientierte Textwissenschaft (Zeitschrift für Literaturwissenschaft und Linguistik 8), Athenäum, Frankfurt/M. 1972, S. 11-28
  2. Reinhard Köhler: Gegenstand und Arbeitsweise der Quantitativen Linguistik. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quan¬titative Linguistik - Quantitative Linguistics. Ein internationales Hand¬buch. de Gruyter, Berlin/ New York 2005, S. 1-16. ISBN 3-11-015578-8
  3. N.L. Biggs: The Roots of Combinatorics. In: Historia Mathematica 6, 1979, S. 109-136.
  4. Adam Pawłowski: Prolegomena to the History of Corpus and Quantitative Linguistics. Greek Antiquity. In: Glottotheory 1, 2008, S. 48-54.
  5. Pre prameň v. odkaz 1, s. 1.
  6. v k tomu Luděk Hřebíček
  7. http://lql.uni-trier.de/index.php/Speech_act_length
  8. http://lql.uni-trier.de/index.php/Vowel_duration
  9. http://lql.uni-trier.de/index.php/Phoneme_frequency
  10. http://lql.uni-trier.de/index.php/Word_associations
  11. http://lql.uni-trier.de/index.php/Compounds:_further_hypotheses
  12. http://lql.uni-trier.de/index.php/Compounds_and_polysemy
  13. Karl-Heinz Best: Hans Arens (1911–2003). In: Glottometrics 13, 2006, S. 75–79.
  14. http://www.ualberta.ca/~baayen/
  15. http://www.glottopedia.org/index.php/Adolf_Busemann_(de)
  16. http://www.yorku.ca/embleton/
  17. Best, Karl-Heinz (2009): William Palin Elderton (1877–1962). Glottometrics 19, p. 99–101.
  18. Karl-Heinz Best: Ernst Wilhelm Förstemann (1822–1906). In: Glottometrics 12, 2006, S. 77–86
  19. Dieter Aichele: Das Werk von W. Fucks. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik – Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, S. 152–158. ISBN 3-11-015578-8
  20. http://www.glottopedia.de/index.php/Georg_von_der_Gabelentz
  21. http://www.uni-graz.at/peter.grzybek/site.php?show=1
  22. http://www.uni-graz.at/emmerich.kelih/site.php?show=1
  23. Karl-Heinz Best: Karl Knauer (1906–1966. In: Glottometrics 12, 2006, S. 86–94
  24. http://www.uni-trier.de/index.php?id=11131
  25. http://www.uni-goettingen.de/de/51122.html
  26. http://www.glottopedia.de/index.php/Gottfried_Wilhelm_Leibniz
  27. Festschrift zum 70. Geburtstag: Problems of General, Germanic and Slavic Linguistics. Papers for 70-th Anniversary of Professor V. Levickij. Edited by Gabriel Altmann, Iryna Zadoroshna, Yuliya Matskulyak. Books, Chernivtsi 2008. (No ISBN.) Pre tú istú príležitosť je Levickému venovaný Glottometrics, 16, 2008. Ďalšie ocenenie je Emmerich Kelih: Der Czernowitzer Beitrag zur Quantitativen Linguistik: Zum 70. Geburtstag von Prof. Dr. Habil. Viktor V. Levickij. In: Naukovyj Visnyk Černivec’koho Universytetu: Hermans’ka filo¬lohija. Vypusk 407, 2008, S. 3–10.
  28. http://wiki-lingua.uni-trier.de/index.php/Karl_Marbe
  29. Karl-Heinz Best: Paul Menzerath (1883–1954). In: Glottometrics 14, 2007, 86–98
  30. Aj v podobe: Shizuo Mizutani: Portrét k 80. narodeninám v: Glottometrics 12, 2006; o Mizutanimu: Naoko Maruyama: Sizuo Mizutani
  31. Charles Muller: Einführung in die Sprachstatistik. Hueber, München 1972 (frz. 1968)
  32. Formy písania: Rajmund G. Piotrowski, R.G. Piotrovskij. Ocenenie: http://www.iqla.org/iqla_news.html
  33. http://alpha2.infim.ro/~ltpd/iipopescu.html
  34. http://www.glottopedia.de/index.php/August_Schleicher
  35. Portrét, ocenenie a bibliografia Tuldavových diel v: Journal of Quantitative Linguistics 4, Nr. 1, 1997 (= Festschrift in Honour of Juh. Tuldava)
  36. Ludmila Uhlířová: Bohumil Trnka: The first bibliography. In: Glottometrics 6, 2003, 105–106.

Literatúra[upraviť | upraviť zdroj]

  • Gabriel Altmann: Sprachtheorie und mathematische Modelle. In: Christian-Albrechts-Universität Kiel, SAIS [= Seminar für Allgemeine und Indoger-manische Sprachwissenschaft] Arbeitsberichte. H. 8, 1985, S. 1–13.
  • Gabriel Altmann, Dariusch Bagheri, Hans Goebl, Reinhard Köhler, Claudia Prün: Einführung in die quantitative Lexikologie. Peust & Gutschmidt, Göttingen 2002, ISBN 3-933043-09-3.
  • Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. RAM-Verlag, Lüdenscheid 2008. ISBN 978-3-9802659-5-9
  • Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung. 3. upravené vydanie. Auflage. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4.
  • Karl-Heinz Best, Otto Rottmann: Quantitative Linguistics, an Invitation. RAM-Verlag, Lüdenscheid 2017. ISBN 978-3-942303-51-4.
  • Emmerich Kelih: Geschichte der Anwendung quantitativer Verfahren in der russischen Sprach- und Literaturwissenschaft. Kovač, Hamburg 2008. ISBN 978-3-8300-3575-6. (Tiež disertácia Graz, 2007. Podrobný popis príspevku ruskej jazykovedy a literárnej vedy od polovice 19. storočia, ktorý je pre vývoj kvantitatívnej/štatistickej jazykovedy veľmi dôležitý)
  • Reinhard Köhler with the assistance of Christiane Hoffmann: Bibliography of Quantitative Linguistics. Benjamins, Amsterdam/ Philadelphia 1995, ISBN 90-272-3751-4.
  • Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Hand¬buch. de Gruyter, Berlin/ New York 2005, ISBN 3-11-015578-8.
  • Udo Strauss, Fengxiang Fan, & Gabriel Altmann: Problems in Quantitative Linguistics 1. RAM-Verlag, Lüdenscheid 2008, ISBN 978-3-9802659-4-2.
  • Stephen Ullmann: Panchronische statistische Gesetze. In: ders.: Grundzüge der Semantik. Die Bedeutung in sprachwissenschaftlicher Sicht. de Gruyter, Berlin 1967, S. 267–272.