Medián

z Wikipédie, slobodnej encyklopédie
Prejsť na: navigácia, hľadanie

Medián alebo stredná hodnota (znaku) alebo centrálna hodnota (znaku) (označuje sa Med(x) alebo ) je hodnota, ktorá rozdeľuje postupnosť podľa veľkosti usporiadaných výsledkov na dve rovnako početné polovice. V štatistike patrí medzi stredné hodnoty. Platí, že najmenej 50 % hodnôt je nižších alebo sa rovná a najmenej 50 % hodnôt je vyšších alebo sa rovná mediánu.

Na nájdenie mediánu daného súboru stačí hodnoty usporiadať podľa veľkosti a zobrať hodnotu, ktorá sa nachádza v strede zoznamu. Ak má súbor párny počet prvkov, zvyčajne sa za medián označí aritmetický priemer hodnôt na mieste n/2 a (n+2)/2, ktoré sa nachádzajú v oblasti prostrednej hodnoty.

Všeobecne sa za medián dá označiť viacero čísel. V už spomenutom prípade párneho počtu prvkov neexistuje jediná prostredná hodnota. Platí však, že polovica hodnôt je menšia alebo rovná a polovica prvkov je väčšia alebo rovná, nech sa už za medián zvolí ľubovoľné z obidvoch prostredných čísel. To isté dokonca platí aj pre ľubovoľné číslo, ktorého veľkosť leží medzi týmito dvoma číslami. Preto sa ako medián takého súboru môže zobrať ľubovoľné z oboch prostredných čísel aj ľubovoľné z čísel medzi nimi.

Výhody a nevýhody mediánu[upraviť | upraviť zdroj]

Základná výhoda mediánu, ako štatistického ukazovateľa je tá skutočnosť, že nie je ovplyvnený extrémnymi hodnotami. Preto sa často používa aj v prípade šikmých rozdelení, pri ktorých aritmetický priemer poskytuje zvyčajne nevhodné výsledky. Napr. v súbore { 1, 2, 2, 3, 9 } sa medián (tak isto ako modus) rovná dvom, čo je viditeľne vhodnejší ukazovateľ prevažujúcej tendencie, ako aritmetický priemer, ktorý tu je 3,4.

Ďalšia výhoda je tá, že medián sa dá definovať na každom súbore lineárne usporiadanom podmienkou „menší alebo sa rovná“, aj keď nejde o súbor čísel. Napríklad medián súboru {absolvent ZŠ, vyučený, vyučený s maturitou, vysokoškolák} sa rovná hodnote „vyučený“, ak kategórie vzdelania považujeme za usporiadané podľa náročnosti školy.

Nevýhodné je použiť medián pri súboroch, v ktorých sledovaný znak nadobúda len jednu z dvoch možností. Tam sa medián správa rovnako ako modus: je hrubým meradlom vlastností rozdelenia a v prípade, že obidve kategórie sú zastúpené zhruba rovnako, je veľmi nestabilný.

Teoretické vlastnosti[upraviť | upraviť zdroj]

V prípade rozdelenia pravdepodobnosti je mediánom číslo m, ktoré spĺňa rovnosť P(Xm) ≥ 0,5 a P(Xm) ≥ 0,5. V prípade spojitého rozdelenia zadaného hustotou pravdepodobnosti f pre medián platí:

.

Medián nie je vždy určený jednoznačne.

Medián je tiež odhad strednej hodnoty, ktorý minimalizuje absolútnu chybu. V predchádzajúcom príklade je táto chyba pri použití mediánu rovná 1 + 0 + 0 + 1 + 7 = 9, zatiaľčo pri použití aritmetického priemeru by bola rovná 2,4 + 1,4 + 1,4 + 0,4 + 5,6 = 11,2. To znamená, že číslo m, ktoré minimalizuje hodnotu , je mediánom rozdelenia náhodnej veličiny X.

Pre rozdelenie majúce definovanú strednú hodnotu a medián platí, že rozdiel medzi mediánom a aritmetickým priemerom daného rozdelenia je menší alebo rovný jednej smerodajnej odchýlke.

Medián ako kvantil[upraviť | upraviť zdroj]

Medián je najpoužívanejší kvantil (konkrétne kvantil deliaci súbor na dve časti). Okrem mediánu sa veľmi často používajú kvartily (súbor sa rozdeľuje na štyri časti), decily (na desať častí) a percentily (na sto častí).

Pozri aj[upraviť | upraviť zdroj]