Kovariancia (štatistika)

z Wikipédie, slobodnej encyklopédie
Prejsť na: navigácia, hľadanie

Kovariancia alebo spoločný rozptyl (skratka cov alebo covar) vyjadruje a opisuje v teórii pravdepodobnosti a matematickej štatistike závislosť medzi dvomi náhodnými veličinami. Špeciálnym prípadom kovariancie dvoch náhodných veličín je korelačný koeficient. Ten vyjadruje kovarianciu medzi dvoma normovanými náhodnými veličinami (teda je určitou mierou lineárnej nezávislosti náhodných veličín).

Definícia[upraviť | upraviť zdroj]

Nech {\mathbf X} = (X_1, X_2, \dots, X_n)^T je náhodný vektor, pričom pre jeho zložky platí, že:

E[X_i^2] < \infty pre i = 1, 2, \dots, n.

Nech P_{{\mathbf X}} označuje rozdelenie pravdepodobnosti tohto náhodného vektora. Potom reálne číslo vyjadrené nasledovným vzťahom: 
  \begin{align}
     \operatorname{cov}\left(X_{i}, X_{j}\right) &= E[(X_{i} - E[X_{i}])(X_{j} - E[X_{j}])] \\
      &= \int_{E^n} \dots \int (x_{i} - E[X_{i}])(x_{j} - E[X_{j}]) \mathrm{d}P_{{\mathbf X}}({\mathbf x})
  \end{align}

pre i, j = 1, 2, \dots, n, označuje kovarianciu medzi náhodnými premennými X_i a X_j.

Zjednodušene môžeme pre dve (jednorozmerné) náhodné veličiny X a Y definíciu prepísať nasledovne:

Nech X a Y sú náhodné veličiny a nech pre ich stredné hodnoty platí, že:

E[X^2] < \infty
E[Y^2] < \infty

Potom reálne číslo vyjadrené nasledovným vzťahom:

\operatorname{cov}\left(X, Y \right) = E[(X - E[X])(Y - E[Y])]

označuje kovarianciu týchto dvoch náhodných veličín.

Rovnako môžeme v definícii požadovať, aby existovali rozptyly týchto náhodných veličín (resp. zložiek náhodného vektora). Existencia rozptylov totiž zaručuje existenciu strednej hodnoty, pomocou ktorej je kovariancia definovaná (teda vo vyššie uvedenej definícii by namiesto podmienky o stredných hodnotách mohla byť iba podmienka o existencii rozptylov).

Vlastnosti[upraviť | upraviť zdroj]

Ak teda máme dve náhodné veličiny X a Y, tak čo sa týka ich kovariancií, platia nasledovné vzťahy:

  • \operatorname{cov}(X, Y) = \operatorname{cov}(Y, X)
  • \operatorname{cov}(X, X) = \operatorname{var}(X)
  • \operatorname{cov}(X, Y) = E[X \, Y] - E[X] \, E[Y]
  • \operatorname{cov}(aX, bY) = ab\, \operatorname{cov}(X, Y)
  • \operatorname{cov}(X + c, Y + d) = \operatorname{cov}(X, Y)

kde a, b, c, d sú reálne čísla a ab > 0.

Ďalšie vzťahy[upraviť | upraviť zdroj]

Koviarianciu dvoch náhodných veličín môžeme použiť pri nasledovnom vzťahu:

\operatorname{var}(X + Y) = \operatorname{var}(X) + \operatorname{var}(Y) + 2\cdot\operatorname{cov}(X, Y)

Pokiaľ platí, že kovariancia dvoch náhodných veličín je nulová, teda: \operatorname{cov}(X, Y) = 0, tak hovoríme, že tieto dve náhodné veličiny sú nekorelované.

Korelačný koeficient[upraviť | upraviť zdroj]

Bližšie informácie v hlavnom článku: Korelačný koeficient

Korelačný koeficient je špeciálnym prípadom kovariancie dvoch náhodných veličín. Vyjadruje kovarianciu medzi dvoma normovanými náhodnými veličinami X a Y, teda:

\rho_{X, Y} = \operatorname{cov}\left(\frac{X - E[X]}{\sqrt{var(X)}}, \frac{Y - E[Y]}{\sqrt{var(Y)}} \right) = \frac{\operatorname{cov}\left(X, Y \right)}{\sqrt{var(X) \cdot var(Y)}}

Pozri aj[upraviť | upraviť zdroj]

Zdroj[upraviť | upraviť zdroj]

  • LAMOŠ, František; POTOCKÝ, Rastislav. Pravdepodobnosť a matematická štatistika – Štatistické analýzy. Bratislava : Vydavateľstvo UK, 1998. ISBN 80-223-1262-2. Kapitola Náhodné premenné a náhodné vektory, s. 344.
  • ŠTULAJTER, František. Odhady v náhodných procesoch. Bratislava : ALFA – vydavateľstvo technickej a ekonomickej literatúry, 1989. ISBN 80-05-00052-9. Kapitola Základy pravdepodobnosti, s. 288.
  • ZVÁRA, Karel; ŠTĚPÁN, Josef. Pravděpodobnost a matematická statistika. Bratislava : VEDA : Vydavateľstvo Slovenskej akadémie vied, 2002. ISBN 80-2240736-4. Kapitola Kovariance, s. 230. (po česky)
  • JANKOVÁ, Katarína; PÁZMAN, Andrej. Pravdepodobnosť a štatistika. Bratislava : Vydavateľstvo UK, 2011. ISBN 978-80-223-2931-6. Kapitola Nezávislosť diskrétnych náhodných veličín a koeficient korelácie., s. 150.
  • RIEČAN, Bieloslav; LAMOŠ, František; LENÁRT, Cyril. Pravdepodobnosť a matematická štatistika. Bratislava : ALFA – vydavateľstvo technickej a ekonomickej literatúry, 1984. Kapitola Náhodné vektory., s. 320.