پارادوکس سیمپسون: تفاوت میان نسخهها
جز ربات:مرتبسازی عنوانها+مرتب+تمیز+ |
جز ربات ردهٔ همسنگ (۳۰.۱) +مرتب+تمیز (۱۴.۹ core): + رده:معرفیشدههای ۱۹۵۱ (میلادی) |
||
خط ۹۹: | خط ۹۹: | ||
[[رده:استنباط علی]] |
[[رده:استنباط علی]] |
||
[[رده:پارادوکسهای نظریه احتمال]] |
[[رده:پارادوکسهای نظریه احتمال]] |
||
[[رده:معرفیشدههای ۱۹۵۱ (میلادی)]] |
نسخهٔ ۱ دسامبر ۲۰۱۸، ساعت ۱۴:۳۵
پارادوکس سیمپسون به یک پدیده در آمار و احتمالات اشاره میکند که در آن هنگامی که دادهها به صورت دستهبندی شده بررسی بشوند نتایج متفاوتی نسبت به زمانی که به صورت کلی و یکجا بررسی شوند نشان میدهند. معمولاً یکی از دلایلی که باعث این تفاوت میشود نامتوازن بودن دستهبندیها است. برای مثال هنگامی بررسی دو رخداد A و B هنگامی که این دو رخداد به صورت دستهبندیشده بررسی میشوند درصد موفقیت رخداد A در هر دسته نسبت به رخداد B بیشتر است اما هنگامی که دادههای ایندو رخداد به صورت یکجا بررسی میشوند درصد موفقیت رخداد B نسبت به A بیشتر میشود که این مخالف نتیجه بدست آمده در حالت قبلی است.
تاریخچه
ادوارد سیمپسون در سال ۱۹۵۱ برای اولین بار به این پدیده در یک مقاله خود اشاره کرد. البته قبل از او نیز کارل پیرسون در سال ۱۸۹۹ و اودنی یول در سال ۱۹۰۳ به مسائلی مشابه این پدیده نیز اشاره کرده بودند.[۱]
توضیح[۲]
به بیانی دیگر هنگامی که میخواهیم احتمال رویداد را تحت شرایط و در دستهبندیهای بررسی کنیم، به ازای هر اگر باشد لزوماً نیست.
مثال[۳]
درمان سنگ کلیه
این مثال یک اتفاق واقعی است که در آن در یک مرکز درمانی برای بررسی دو نوع درمان A و B برای بیماری سنگ کلیه، بیماران را به دو دسته تقسیم کردهاند دسته اول بیماران با سنگ کلیه کوچک و دسته دوم بیماران با سنگ کلیه بزرگ هستند که نتایج درصد موفقیت درمانها در این آزمایش در جدول زیر آمدهاست.
درمان A | درمان B | |
---|---|---|
سنگهای کوچک | (۸۱/۸۷) ۹۳٪ | (۲۳۴/۲۷۰) ۸۷٪ |
سنگهای بزرگ | (۱۹۲/۲۶۳) ۷۳٪ | (۵۵/۸۰) ۶۹٪ |
هر دو | (۲۷۳/۳۵۰) ۷۸٪ | (۲۸۹/۳۵۰) ۸۳٪ |
که با توجه به نتایج درصد موفقیت درمان A هم برای سنگهای کوچک و هم برای سنگهای بزرگ بیشتر از درمان B است ولی درصد موفقیت کلی درمان B بیشتر از A است که این نشان دهنده یک تناقض در نتایج دادهها است که این اتفاق به دلیل همزمانی دو واقعه زیر است:
- اندازه دستهبندیها با هم تفاوت زیادی دارند به طوری که برای بیماران با سنگ کلیه کوچک بیشتر درمان B و برای بیماران با سنگ کلیه بزرگ بیشتر درمان A بررسی شدهاست.
- تأثیر متغیر اختلاطی بر روی درصدهای موفقیت که در اینجا این متغیر همان اندازه سنگها است. پس نتیجه این آزمایش تحت تأثیر نوع سنگها نیز است.
جنسیت (Berkeley gender bias case)
این مثال نیز یک مثال واقعی است که در آن از دانشگاه برکلی به دلیل اختلاف درصد قبولی زنان و مردان شکایت شده. در نتایج بدست آمده قبولیها نشان دهنده آن بود که درصد بیشتری از مردان نسبت به زنان قبول شدهاند (حدود ۱۰٪ بیشتر).
تعداد شرکت کننده | درصد قبولی | |
---|---|---|
زن | ۸۴۴۲ | ۴۴٪ |
مرد | ۴۳۲۱ | ۳۵٪ |
اما هنگام بررسی این نتایج در ادارات و بخشهای مختلف در واقع در بیشتر بخشها درصد قبولی زنان بیشتر از مردان است.
بخش | مرد | زن | ||
---|---|---|---|---|
A | ۸۲۵ | ۶۲٪ | ۱۰۸ | ۸۲٪ |
B | ۵۶۰ | ۶۳٪ | ۲۵ | ۶۸٪ |
C | ۳۲۵ | ۳۷٪ | ۵۹۳ | ۳۴٪ |
D | ۴۱۷ | ۳۳٪ | ۳۷۵ | ۳۵٪ |
E | ۱۹۲ | ۲۸٪ | ۳۹۳ | ۲۴٪ |
F | ۲۷۲ | ۶٪ | ۳۴۱ | ۷٪ |
این اختلاف در نتایج به دلیل این است که زنان تمایل بیشتری داشتهاند که در بخشهای درصد قبولی آنها کمتر بوده شرکت کنند اما مردان بیشتر در بخشهایی که درصد قبولی آنها بیشتر بوده و رقابت کمتر است شرکت کردهاند که این یکی از عواملی است که در هنگام بررسی اختلاف قبولی بررسی نشده بود.
منابع
- ↑ (PDF) https://ftp.cs.ucla.edu/pub/stat_ser/r414.pdf. پارامتر
|عنوان= یا |title=
ناموجود یا خالی (کمک) - ↑ (PDF) http://www-personal.umich.edu/~hlm/math425/simpson.pdf. پارامتر
|عنوان= یا |title=
ناموجود یا خالی (کمک) - ↑ (PDF) http://www-bcf.usc.edu/~lototsky/MATH218/Simpsons%20paradox.pdf. پارامتر
|عنوان= یا |title=
ناموجود یا خالی (کمک)
در ویکیانبار پروندههایی دربارهٔ پارادوکس سیمپسون موجود است. |