Simpsonov paradox

z Wikipédie, slobodnej encyklopédie
Prejsť na: navigácia, hľadanie
Simpsonov paradox pre kontinuálne dáta: Pozitívny trend pre obe oddelené skupiny dát (modrá a červená), negatívny trend (čierna čiarkovaná) pre kombinovanú množinu dát

Simpsonov paradox je štatistický paradox pri porovnaní úspešnosti dvoch indivíduí (skupín) počas viacerých období, pričom v jednotlivých obdobiach je úspešnejšia skupina A ale celkovo je úspešnejšia skupina B. Paradox je pomenovaný podľa Edwarda Simpsona, ktorý ho publikoval v roku 1951[1]. Pretože ide o matematickú trivialitu je praktický isté, že tento paradox bol pozorovaný možno stáročia pred ním, ale kvôli nepredstaviteľnej trivialite ho nikto nepublikoval.

Časté zmätenie ľudí, ktorí sa prvýkrát stretnú s týmto paradoxom je spôsobené nevhodným príkladom z interpretačného hľadiska.

Príklad paradoxu[upraviť | upraviť zdroj]

1. semester 2. semester spolu
Študent A 2/8 25% 2/2 100% 4/10 40%
Študent B 1/5 20% 4/5 80% 5/10 50%

Je zrejmé, že študent A bol úspešnejší v oboch semestroch ale celkovo bol úspešnejší študent B, pričom celkový počet skúšok bol pre oboch rovnaký.

Podstata paradoxu[upraviť | upraviť zdroj]

Podstata paradoxu spočíva v tom, že B mal pomerne vysokú úspešnosť počas 5 skúšok, teda dlhodobo. Študent A ktorý v tom semestri mal síce úspešnosť 100% ale aplikovanú iba na dve skúšky.

Keďže nepredpokladáme rozdielnosť nárokov v prvom aj druhom semestri bol naozaj lepším študentom B. Práve uvedený príklad je však veľmi zavadzajúci, je totiž štatisticky veľmi nepravdepodobné, že môžu existovať také rozdiely medzi semestrami. Pravdepodobne to muselo byť niečim spôsobené, napr. zmenou skúšajúceho. V tomto prípade treba jednoznačne za lepšieho študenta označiť A, lebo bol úspešnejší u oboch profesorov len mal smolu, že väčšinu skúšok mal u prísnejšieho.

Skutočný príklad z praxe[upraviť | upraviť zdroj]

Ako skutočný a dobrý príklad na ukážku správnej a jednoduchej interpretácie možno uviesť porovnanie úspešnosti liečby obličkových kameňov klasickou chirurgiou a perkutánnou nefrolitotómiou[2]. Pri hodnotení úspešnosti bez ohľadu na veľkosť kameňa vychádza perkutánna nefrolitotómia ako úspešnejšia. Tento záver je však mylný lebo pri hodnotení zvlášť malých a veľkých kameňov vychádza úspešnejšia klasická chirurgia.

Príčina paradoxu je v tom, že perkutánna nefrolitotómia sa používala hlavne pre malé kamene a pravdepodobnosť úspešnosti liečby je viac ovplyvnená veľkosťou kameňa ako použitou metódou liečby.

malé kamene veľké kamene spolu
Klasické operačné postupy 81/87 93% 192/263 73% 273/350 78%
Perkutánna nefrolitotómia 234/270 87% 55/80 69% 289/350 83%

Za veľké sa v tejto práci považovali kamene väčšie ako 2 cm. Ako kritérium úspešnosti bolo použité nepozorovanie výskytu kameňov po troch mesiacoch od liečby resp. redukcia veľkosti kameňa na maximálnu veľkosť 2 mm

Referencie[upraviť | upraviť zdroj]

  1. CSimpson, Edward H. (1951). "The Interpretation of Interaction in Contingency Tables". Journal of the Royal Statistical Society, Ser. B 13: 238–241
  2. C. R. Charig, D. R. Webb, S. R. Payne, O. E. Wickham (March 1986). "Comparison of treatment of renal calculi by operative surgery, percutaneous nephrolithotomy, and extracorporeal shock wave lithotripsy". British Medical Journal vol. 292 (1986), str. 879–882