Rozptyl (štatistika)

z Wikipédie, slobodnej encyklopédie
Prejsť na: navigácia, hľadanie

Rozptyl (iné názvy: variancia, disperzia, stredná kvadratická odchýlka, stredná kvadratická fluktuácia) je najčastejšie používaná miera variability.

Hodnota rozptylu je závislá od odchýlky štatistiky od priemeru. Ak chápeme štatistický súbor ako realizáciu náhodného výberu z určitého rozdelenia, potom rozptyl určuje strednú kvadratickú odchýlku jednotlivých nameraných hodnôt od výberového priemeru.

Definícia[upraviť | upraviť zdroj]

Nech X je náhodná premenná, ktorá nadobúda konečne alebo spočítateľne veľa hodnôt. Potom definujeme rozptyl ako

\mathrm{Var}[X]=\sum_{k=1}^{\infty}(x_k-\mathrm{E}[X])^2\cdot\mathrm{Pr}[X=x_k].

Ďalším často používaným vzťahom na výpočet rozptylu je

\mathrm{Var}[X]=\operatorname{E}[X^2] - \operatorname{E}[X]^2,

ku ktorému môžeme prísť odvodením zo základného vzťahu. Ak je každý výsledok rovnako pravdepodobný a je ich konečne veľa, uvedený vzťah možno prepísať do tvaru

\mathrm{Var}[X]=\frac{1}{n}\sum_{k=1}^{n}(x_k-\mathrm{E}[X])^2.

Ak uvažujeme náhodnú premennú X, ktorá nenadobúda konečne veľa, resp. spočítateľne veľa hodnôt, teda je spojitá, používame na výpočet variancie vzťah

\mathrm{Var}[X]=\int\limits_{-\infty}^{+\infty}(x-\mathrm{E}[X])^2f(x)\,\mathrm{d}x,

kde f je funkcia hustoty pravdepodobnosti príslušného rozdelenia.

Vlastnosti rozptylu[upraviť | upraviť zdroj]

  • Rozptyl má aditívnu vlastnosť len v prípade, že náhodné premenné v jeho argumente sú nezávislé. Inak
\mathrm{Var}[X+Y]=\mathrm{Var}[X]+\mathrm{Var}[Y]+2\mathrm{Cov}[X,Y]\,
  • Pri transformácii náhodnej premennej \alpha X, kde \alpha je konštanta platí
\mathrm{Var}[\alpha X]=\alpha^2\mathrm{Var}[X]\,
  • Rozptyl môžeme prepísať z definičného tvaru do nasledovného, z ktorého je jasné, že ide o strednú hodnotu istej transformácie pôvodnej náhodnej premennej
\mathrm{Var}[X]=\mathrm{E}\left[(X-\mathrm{E}[X])^2\right]\,

Použitie a príklady[upraviť | upraviť zdroj]

Hodnota rozptylu je vždy kladná, čo vyplýva z toho, že pracujeme s druhou mocninou odchýlky. Druhú odmocninu z rozptylu nazývame smerodajná odchýlka a označujeme

\sigma_X=\sqrt{\mathrm{Var}[X]}

Pomocou štandardnej odchýlky a korelačného koeficientu možno vyjadriť kovarianciu nasledovným spôsobom

\mathrm{Cov}[X,Y]=\rho_{XY}\sigma_X\sigma_Y\,

Rozptyl vystupuje aj v dôležitej Čebyševovej nerovnosti, ktorá sa využíva pri dôkaze slabého zákona veľkých čísel.

Príklad[upraviť | upraviť zdroj]

Rozptyl rovnomerného rozdelenia na intervale [-1,+1] je

\mathrm{Var}[X]=\int\limits_{-1}^{+1}(x-0)^2\frac{1}{2}\,\mathrm{d}x=\left[\frac{x^3}{6}\right]_{-1}^{+1}=\frac{1}{3}