Simpsonov paradox

Simpsonov paradox je štatistický paradox pri porovnaní úspešnosti dvoch indivíduí (skupín) počas viacerých období, pričom v jednotlivých obdobiach je úspešnejšia skupina A, ale celkovo je úspešnejšia skupina B. Paradox je pomenovaný podľa Edwarda Simpsona, ktorý ho publikoval v roku 1951^[1]. Pretože ide o matematickú trivialitu, je praktický isté, že tento paradox bol pozorovaný možno stáročia pred ním, ale kvôli nepredstaviteľnej trivialite ho nikto nepublikoval.

Časté zmätenie ľudí, ktorí sa prvýkrát stretnú s týmto paradoxom, je spôsobené nevhodným príkladom z interpretačného hľadiska.

Príklad paradoxu

	1. semester		2. semester		spolu
Študent A	2/8	25%	2/2	100%	4/10	40%
Študent B	1/5	20%	4/5	80%	5/10	50%

Je zrejmé, že študent A bol úspešnejší v oboch semestroch, ale celkovo bol úspešnejší študent B, pričom celkový počet skúšok bol pre oboch rovnaký.

Podstata paradoxu

Podstata paradoxu spočíva v tom, že študent B mal pomerne vysokú úspešnosť počas piatich skúšok, teda dlhodobo. Študent A mal v druhom semestri síce úspešnosť 100%, ale aplikovanú iba na dve skúšky.

Keďže nepredpokladáme rozdielnosť nárokov, v prvom aj druhom semestri bol naozaj lepším študentom B. Práve uvedený príklad je však veľmi zavádzajúci, je totiž štatisticky veľmi nepravdepodobné, že môžu existovať také rozdiely medzi semestrami. Pravdepodobne to muselo byť niečim spôsobené, napr. zmenou skúšajúceho. V tomto prípade treba jednoznačne za lepšieho študenta označiť A, lebo bol úspešnejší u oboch profesorov, len mal smolu, že väčšinu skúšok mal u prísnejšieho.

Skutočný príklad z praxe

Ako skutočný a dobrý príklad na ukážku správnej a jednoduchej interpretácie možno uviesť porovnanie úspešnosti liečby obličkových kameňov klasickou chirurgiou a perkutánnou nefrolitotómiou^[2]. Pri hodnotení úspešnosti bez ohľadu na veľkosť kameňa vychádza perkutánna nefrolitotómia ako úspešnejšia. Tento záver je však mylný lebo pri hodnotení zvlášť malých a veľkých kameňov vychádza úspešnejšia klasická chirurgia.

Príčina paradoxu je v tom, že perkutánna nefrolitotómia sa používala hlavne pre malé kamene a pravdepodobnosť úspešnosti liečby je viac ovplyvnená veľkosťou kameňa ako použitou metódou liečby.

	malé kamene		veľké kamene		spolu
Klasické operačné postupy	81/87	93%	192/263	73%	273/350	78%
Perkutánna nefrolitotómia	234/270	87%	55/80	69%	289/350	83%

Za veľké sa v tejto práci považovali kamene väčšie ako 2 cm. Ako kritérium úspešnosti bolo použité nepozorovanie výskytu kameňov po troch mesiacoch od liečby resp. redukcia veľkosti kameňa na maximálnu veľkosť 2 mm^[3].

Referencie

↑ CSimpson, Edward H. (1951). "The Interpretation of Interaction in Contingency Tables". Journal of the Royal Statistical Society, Ser. B 13: 238–241
↑ C. R. Charig, D. R. Webb, S. R. Payne, O. E. Wickham (March 1986). "Comparison of treatment of renal calculi by operative surgery, percutaneous nephrolithotomy, and extracorporeal shock wave lithotripsy". British Medical Journal vol. 292 (1986), str. 879–882
↑ NED, Kock. Simpson’s paradox, moderation, and the emergence of quadratic relationships in path models: An information systems illustration [online]. International Journal of Applied Nonlinear Science, [cit. 2019-07-29]. Dostupné online. (english)

[1] CSimpson, Edward H. (1951). "The Interpretation of Interaction in Contingency Tables". Journal of the Royal Statistical Society, Ser. B 13: 238–241

[2] C. R. Charig, D. R. Webb, S. R. Payne, O. E. Wickham (March 1986). "Comparison of treatment of renal calculi by operative surgery, percutaneous nephrolithotomy, and extracorporeal shock wave lithotripsy". British Medical Journal vol. 292 (1986), str. 879–882

[3] NED, Kock. Simpson’s paradox, moderation, and the emergence of quadratic relationships in path models: An information systems illustration [online]. International Journal of Applied Nonlinear Science, [cit. 2019-07-29]. Dostupné online. (english)

[1]

[2]

[3]