پارادوکس سیمپسون
پارادوکس سیمپسون به یک پدیده در آمار و احتمالات اشاره میکند که در آن هنگامی که دادهها به صورت دستهبندی شده بررسی شوند، نتایج متفاوتی نسبت به زمانی که به صورت کلی و یکجا بررسی شوند نشان میدهند. معمولاً یکی از دلایلی که باعث این تفاوت میشود نامتوازن بودن دستهبندیها است. برای مثال هنگامی بررسی دو رخداد A و B، هنگامی که این دو رخداد به صورت دستهبندیشده بررسی میشوند، درصد موفقیت رخداد A در هر دسته نسبت به رخداد B بیشتر است اما هنگامی که دادههای این دو رخداد به صورت یکجا بررسی میشوند، درصد موفقیت رخداد B نسبت به A بیشتر میشود؛ که این مخالف نتیجه بهدست آمده در حالت قبلی است.
تاریخچه
[ویرایش]ادوارد سیمپسون در سال ۱۹۵۱ برای اولین بار به این پدیده در یک مقاله خود اشاره کرد. البته قبل از او نیز کارل پیرسون در سال ۱۸۹۹ و اودنی یول در سال ۱۹۰۳ به مسائلی مشابه این پدیده نیز اشاره کرده بودند.[۱]
توضیح
[ویرایش]به بیانی دیگر هنگامی که میخواهیم احتمال رویداد را تحت شرایط و در دستهبندیهای بررسی کنیم، به ازای هر اگر باشد لزوماً نیست.[۲]
مثال
[ویرایش]درمان سنگ کلیه
[ویرایش]این مثال یک اتفاق واقعی است که در آن در یک مرکز درمانی برای بررسی دو نوع درمان A و B برای بیماری سنگ کلیه، بیماران را به دو دسته تقسیم کردهاند دسته اول بیماران با سنگ کلیه کوچک و دسته دوم بیماران با سنگ کلیه بزرگ هستند که نتایج درصد موفقیت درمانها در این آزمایش در جدول زیر آمدهاست.
درمان A | درمان B | |
---|---|---|
سنگهای کوچک | (۸۱/۸۷) ۹۳٪ | (۲۳۴/۲۷۰) ۸۷٪ |
سنگهای بزرگ | (۱۹۲/۲۶۳) ۷۳٪ | (۵۵/۸۰) ۶۹٪ |
هر دو | (۲۷۳/۳۵۰) ۷۸٪ | (۲۸۹/۳۵۰) ۸۳٪ |
که با توجه به نتایج درصد موفقیت درمان A هم برای سنگهای کوچک و هم برای سنگهای بزرگ بیشتر از درمان B است ولی درصد موفقیت کلی درمان B بیشتر از A است که این نشان دهنده یک تناقض در نتایج دادهها است که این اتفاق به دلیل همزمانی دو واقعه زیر است:
- اندازه دستهبندیها با هم تفاوت زیادی دارند به طوری که برای بیماران با سنگ کلیه کوچک بیشتر درمان B و برای بیماران با سنگ کلیه بزرگ بیشتر درمان A بررسی شدهاست.
- تأثیر متغیر اختلاطی بر روی درصدهای موفقیت که در اینجا این متغیر همان اندازه سنگها است. پس نتیجه این آزمایش تحت تأثیر نوع سنگها نیز است.[۳]
جنسیت
[ویرایش]این مثال نیز یک مثال واقعی است که در آن از دانشگاه برکلی به دلیل اختلاف درصد قبولی زنان و مردان شکایت شده. در نتایج بهدست آمده قبولیها نشان دهنده آن بود که درصد بیشتری از مردان نسبت به زنان قبول شدهاند (حدود ۱۰٪ بیشتر).
تعداد شرکت کننده | درصد قبولی | |
---|---|---|
زن | 4321 | 35٪ |
مرد | 8442 | 44٪ |
اما هنگام بررسی این نتایج در ادارات و بخشهای مختلف در واقع در بیشتر بخشها درصد قبولی زنان بیشتر از مردان است.
بخش | مرد | زن | ||
---|---|---|---|---|
A | ۸۲۵ | ۶۲٪ | ۱۰۸ | ۸۲٪ |
B | ۵۶۰ | ۶۳٪ | ۲۵ | ۶۸٪ |
C | ۳۲۵ | ۳۷٪ | ۵۹۳ | ۳۴٪ |
D | ۴۱۷ | ۳۳٪ | ۳۷۵ | ۳۵٪ |
E | ۱۹۲ | ۲۸٪ | ۳۹۳ | ۲۴٪ |
F | ۲۷۲ | ۶٪ | ۳۴۱ | ۷٪ |
این اختلاف در نتایج به دلیل این است که زنان تمایل بیشتری داشتهاند که در بخشهای درصد قبولی آنها کمتر بوده شرکت کنند اما مردان بیشتر در بخشهایی که درصد قبولی آنها بیشتر بوده و رقابت کمتر است شرکت کردهاند که این یکی از عواملی است که در هنگام بررسی اختلاف قبولی بررسی نشده بود.[۴]
نمایش برداری
[ویرایش]اگر در صفحه مختصات احتمال را با بردار نشان دهیم آنگه مقدار این احتمال برابر با شیب بردار خواهد بود در واقع هر چه شیب بردار بیشتر باشد احتمال آن نیز بیشتر است. از طرفی چون جمع بردارها در فضای دو بعدی برابر با جمع مولفه های اول بردارها و جمع مولفه های دوم بردارها است پس جمع بردار های احتمال های و برابر با برداریعنی احتمال است.
مطابق شکل پارادوکس سیمپسون به این اشاره می کند که اگر بردار شیب کمتری از بردار داشته باشد و بردار شیبش از بردار کمتر باشد جمع دو بردار می تواند شیب بیشتر نسبت به جمع دو بردار داشته باشد.[۵]
منابع
[ویرایش]- ↑ «Understanding Simpson's Paradox» (PDF). Judea Pearl. دسامبر ۲۰۱۳.
- ↑ Hugh L. Montgomery (Fall ۲۰۱۵). «Simpson's paradox» (PDF).
- ↑ «Comparisonoftreatmentofrenalcalculibyopensurgery, percutaneousnephrolithotomy,andextracorporealshockwave lithotripsy» (PDF). CRCHARIG, DRWEBB, SRPAYNE, JEAWICKHAM. 29 MARcH 1986. تاریخ وارد شده در
|تاریخ=
را بررسی کنید (کمک) - ↑ «Sex Bias in Graduate Admissions: Data from Berkeley» (PDF). P. J. Bickel, E. A. Hammel, J. W. O'Connel.
- ↑ KOCIK، JERZY (DECEMBER 2001). Proof Without Words. صص. https://www٫researchgate٫net/profile/Jerzy_Kocik/publication/۲۷۴۱۱۷۳۱۸_Proof_without_Words_Simpson%۲۷s_Paradox/links/۵۷۰c۷۵۷۱۰۸ae۸۸۸۳a۱ffeded/Proof-without-Words-Simpsons-Paradox٫pdf. تاریخ وارد شده در
|سال=
را بررسی کنید (کمک)