Kontingenčná tabuľka

z Wikipédie, slobodnej encyklopédie

Kontingenčná tabuľka je tabuľka, ktorá sa používa na prehľadné zhrnutie vzájomného vzťahu dvoch (alebo viacerých) štatistických znakov. Riadky kontingenčnej tabuľky zodpovedajú možným hodnotám prvého znaku, stĺpce možným hodnotám druhého znaku. V príslušnej bunke kontingenčnej tabuľky je zvyčajne počet prípadov, kedy zároveň mal prvý znak hodnotu zodpovedajúcu príslušnému riadku a druhý znak hodnotu zodpovedajúcu príslušnému stĺpcu.

Príklad s opisom[upraviť | upraviť zdroj]

Napríklad prvým znakom môže byť pohlavie človeka a druhým znakom jeho dominantná ruka. Kontingenčná tabuľka s dvoma riadkami (muž, žena) a dvoma stĺpcami (pravá, ľavá) potom opisuje počty výskytov všetkých kombinácií pohlavia a dominantnej ruky v nejakom súbore sledovaných jedincov. (Ak existuje jedinec, ktorý nemá ani jednu ruku dominantnú alebo ju nechce uviesť, musel by byť pridaný aj tretí stĺpec, ktorý sa pre takéto prípady zvykne nazývať Iné).

Pravá Ľavá Spolu
Muž 43 9 52
Žena 44 4 48
Spolu 87 13 100

Je možné, aby jeden riadok alebo stĺpec zodpovedal viacerým možným hodnotám znaku. Napríklad ak znak nadobúda niektoré hodnoty veľmi zriedka, tak je vhodné spojiť viac možných hodnôt do jedného riadku alebo stĺpca (napríklad nechce uviesť, nevie, nezistené spojiť do Iné). Naša kontingenčná tabuľka typu 2x2 (riadky x stĺpce) sa nazýva štvorpoľová tabuľka (angl. four-fold table) a slúži na porovnanie dvoch dichotomických znakov, teda takých, ktoré nadobúdajú len dve hodnoty (muž, žena a práva, ľavá), ktoré sa navzájom vylučujú.

Súčty (medzisúčty) všetkých hodnôt v každom riadku, resp. stĺpci nesú informáciu o počte výskytov javov, pri ktorých nadobudol prvý (resp. druhý) znak príslušnú hodnotu bez ohľadu na hodnotu druhého (resp. prvého) znaku. Počet všetkých výskytov je v poslednom riadku Spolu a poslednom stĺpci Spolu nazývaný Celkový súčet (anglicky Grand Total), v našom príklad 100.

Testovanie vzájomnej závislosti znakov[upraviť | upraviť zdroj]

Okrem jednoduchého popisu početnosti kombinácií hodnôt dvoch znakov ponúka kontingenčná tabuľka možnosť testovať, či medzi oboma znakmi existuje nejaký vzťah. Na to je možné použiť napríklad Pearsonov test dobrej zhody. Je určený pre znaky v kontingenčnej tabuľke, ktoré predstavujú diskrétne hodnoty (je možné teda využiť kvalitatívne, diskrétne kvalitatívne alebo spojito kvalitatívne znaky, v poslednom prípade však iba s rozdelením jednotlivých znakov do skupín, tzv. skupinové triedenie). Iné testy sú: G-testFisherov exaktný test[1], Barnardov test,

Názov[upraviť | upraviť zdroj]

Názov kontingenčná tabuľka zaviedol Karl Pearson v roku 1904.[2] Contingency v angličtine znamená možnosť, súvislosť aj náhodilosť. Pearson označuje ako kontingenčnú tabuľku rozdelenia diskrétnej náhodnej premennej, ktoré môže byť triedené podľa štatisckých znakov úplne náhodne alebo nezávisle napríklad podľa abecedy (na rozdiel od spojitej náhodnej premennej). Ako príklad uvádza  zamestnania 775 otcov a synov zaradené v 14 skupinách, ktoré môžu byť usporiadané čisto abecedne.[2] V našom jazykovom priestore má slovo kontingent význam: stanovený počet, dávka, množstvo, ktoré treba naplniť. Napríklad župy alebo mestá a počet vojakov ktoré majú poskytnúť vladárovi alebo obce a kontingent mäsa, mlieka, vajec, obilia na dodanie štátu.[3] Pretože aj na tieto účely možno použiť kontingenčné tabuľky je ich názov adekvátny.

V angličtine je kontingenčná tabuľka nazývaná aj cross table alebo aj pivot table. Microsoft má registrovanú ochrannú známku "PivotTable" (pivot table bez medzery) na označenie kontingenčnej tabuľky, preto sa tento názov nesmie voľne používať bez uvedenia, že ide o registrovanú ochrannú známku Microsoftu.

Iné použitie kontingenčných tabuliek[upraviť | upraviť zdroj]

Vyššie uvedený príklad (dominantná ruka) je príkladom najčastejšieho použitia kontingenčnej tabuľky, ktorá obsahuje počty výskytov znakov a ich súčty a medzisúčty. Namiesto súčtov (agregovania) je však možné použiť iné alebo ďalšie funkcie ako výpočet percent, odchýlok, priemerov a pod. Podľa počítačovej implementácie možno zdrojové dáta napríklad aj vizualizovať pomocou kontingenčeného grafu. V Microsoft Exceli kontingenčné tabuľky (Excel PivotTable) umožňujú aj vytvárať zostavy (ang. report) aj pomocou filtrov (dotazov - ang. query) a triedenia a prepájaním na databázové údaje v iných súboroch a formátoch ako je Excel, čo je súčasťou širšej koncepcie analytického spracovania OLAP (online analytical processing).

Referencie[upraviť | upraviť zdroj]

  1. Kontingenčné tabuľky [online]. www.fhpv.unipo.sk, [cit. 2017-11-04]. Dostupné online.
  2. a b Karl Pearson, F.R.S. (1904). Mathematical contributions to the theory of evolution  v článku "On the Theory of Contingency and Its Relation to Association and Normal Correlation" strana 10
  3. A.S., Ringier Axel Springer Slovakia,. "kontingent" - význam slova - Slovnik.sk [online]. slovnik.azet.sk, [cit. 2017-11-04]. Dostupné online.

Pozri aj[upraviť | upraviť zdroj]

Video tutoriál: Renata Janoscova: Kontingenčná tabuľka a graf - EXCEL 2010, Youtube