Medián

z Wikipédie, slobodnej encyklopédie
Prejsť na: navigácia, hľadanie

Medián alebo prostredná hodnota (znaku) alebo centrálna hodnota (znaku) (označuje sa Med(x) alebo \tilde x) je hodnota, ktorá rozdeľuje postupnosť podľa veľkosti zoradených výsledkov na dve rovnako početné polovice. V štatistike patrí medzi stredné hodnoty. Platí, že najmenej 50 % hodnôt je menších alebo rovných a najmenej 50 % hodnôt je väčších alebo rovných mediánu.

Na nájdenie mediánu daného súboru stačí hodnoty zoradiť podľa veľkosti a zobrať hodnotu, ktorá sa nachádza v strede zoznamu. Keď má súbor párny počet prvkov, zvyčajne sa za medián označí aritmetický priemer hodnôt na miestach n/2 a n/2+1.

Všeobecne sa za medián dá označiť viacero čísel. V už spomenutom prípade párneho počtu prvkov neexistuje jediná prostredná hodnota. Platí však, že polovica hodnôt je menšia alebo rovná a polovica prvkov je väčšia alebo rovná, nech sa už za medián zvolí ľubovoľné z obidvoch prostredných čísel. To isté dokonca platí aj pre ľubovoľné číslo, ktorého veľkosť leží medzi týmito dvoma číslami. Preto sa ako medián takého súboru môže zobrať ľubovoľné z oboch prostredných čísel aj ľubovoľné z čísel medzi nimi.

Výhody a nevýhody mediánu[upraviť | upraviť zdroj]

Základnou výhodou mediánu ako štatistického ukazovateľa je fakt, že nie je ovplyvnený extrémnymi hodnotami. Preto sa často používa v prípade šikmých rozdelení, pri ktorých aritmetický priemer poskytuje zvyčajne nevhodné výsledky. Napr. v súbore { 1, 2, 2, 3, 9 } je medián (rovnako ako modus) rovný dvom, čo je viditeľne vhodnejší ukazovateľ prevažujúcej tendencie ako aritmetický priemer, ktorý tu je 3,4.

Ďalšou výhodou je, že medián sa dá definovať na každom súbore lineárne usporiadanom podmienkou „menší alebo rovný“, aj keď nejde o súbor čísel. Napríklad medián súboru {absolvent ZŠ, vyučený, vyučený s maturitou, vysokoškolák} sa rovná hodnote „vyučený“, ak kategórie vzdelania považujeme za zoradené podľa náročnosti školy.

Nevýhodné je použiť medián pri súboroch, v ktorých sledovaný znak nadobúda len jednu z dvoch možností. Tam sa medián správa rovnako ako modus: je hrubým meradlom vlastností rozdelenia a v prípade, že obidve kategórie sú zastúpené zhruba rovnako, je veľmi nestabilný.

Teoretické vlastnosti[upraviť | upraviť zdroj]

V prípade rozdelenia pravdepodobnosti je mediánom číslo m, ktoré spĺňa rovnosť P(Xm) ≥ 0,5 a P(Xm) ≥ 0,5. V prípade spojitého rozdelenia zadaného hustotou pravdepodobnosti f pre medián platí:

\int\limits_{-\infty}^{m}\!\! f(x) \,\mathrm{d}x = \frac{1}{2}.

Medián nie je vždy určený jednoznačne.

Medián je tiež odhad strednej hodnoty, ktorý minimalizuje absolútnu chybu. V predchádzajúcom príklade je táto chyba pri použití mediánu rovná 1 + 0 + 0 + 1 + 7 = 9, zatiaľčo pri použití aritmetického priemeru by bola rovná 2,4 + 1,4 + 1,4 + 0,4 + 5,6 = 11,2. To znamená, že číslo m, ktoré minimalizuje hodnotu E(|X - m |), je mediánom rozdelenia náhodnej veličiny X.

Pre rozdelenie majúce definovanú strednú hodnotu a medián platí, že rozdiel medzi mediánom a aritmetickým priemerom daného rozdelenia je menší alebo rovný jednej smerodajnej odchýlke.

Medián ako kvantil[upraviť | upraviť zdroj]

Medián je najpoužívanejší kvantil (konkrétne kvantil deliaci súbor na dve časti). Okrem mediánu sa veľmi často používajú kvartily (súbor sa rozdeľuje na štyri časti), decily (na desať častí) a percentily (na sto častí).

Pozri aj[upraviť | upraviť zdroj]