برگشت به میانگین

از ویکی‌پدیا، دانشنامهٔ آزاد
شرایط آزمایش گالتون (شکل ۸)

در علم آمار، برگشت به میانگین (که واژهٔ برگشت از عبارت Regression ترجمه شده‌است) به پدیده‌ای گفته می‌شود که اگر یک نمونه از متغیری تصادفی، مقداری حدی داشته باشد، نمونه‌گیری بعدی از همان متغیر تصادفی احتمالاً به میانگین نزدیک‌تر است.[۱][۲][۳] علاوه بر این، زمانی که تعداد زیادی نمونه‌گیری از متغیر تصادفی خاصی انجام و حدی‌ترین نمونه‌ها عمداً جدا شده باشند، (در بسیاری از موارد) نمونه‌گیریِ دوباره از این متغییرهای تفکیک شده منجر به نتایجی می‌شود که به میانگین اولیه تمامی متغییرها نزدیک‌ترند و نتایج حدی کمتری دارند.

از نظر ریاضی، شدت «برگشت» به این بستگی دارد که همهٔ متغیرهای تصادفی از یک توزیع برداشت شده باشند یا توزیع هر یک از متغییرهای تصادفی تفاوت‌های اساسی واقعی داشته باشد. در حالت اول، اثر «برگشت» از نظر آماری احتمال وقوع دارد، اما در مورد دوم، ممکن است احتمالی بسیار کمتر داشته باشد یا اصلاً رخ ندهد.

بنابراین، لحاظ پدیدهٔ برگشت به میانگین برای طراحی هر آزمایش علمی، تحلیل داده یا آزمونی که در آن به عمد «حدی‌ترین» رویدادها انتخاب می‌شوند مفید است. بر این اساس برای اجتناب از جمع‌بندی‌های شتاب زده در مورد این رویدادها شاید بررسی‌های بیشتری لازم باشد چرا که ممکن است این نمونه‌ها در واقع رویدادهایی حدی باشند یا به دلیل پارازیت آماری، گزینشی کاملاً بی‌معنی انجام شده یا ترکیبی از این دو حالت صادق باشد.[۴]

مثال‌های مفهومی[ویرایش]

مثال ساده: آزمون دانش‌آموزان[ویرایش]

دانش آموزان کلاسی را در نظر بگیرید که در آزمونی با ۱۰۰ سؤال دو گزینه‌ای صحیح/غلط شرکت می‌کنند. با فرض اینکه همه دانش‌آموزان تصادفی پاسخ سؤال‌ها را انتخاب کنند، نمرهٔ هر دانش آموز مصداق حالت خاصی از [کل حالات ممکن] مجموعهٔ متغیرهای تصادفی مستقل با توزیع یکسان، و میانگین مورد انتظار ۵۰ خواهد بود. طبیعی است که نمرهٔ برخی از دانش‌آموزان به طور شانسی تا حد قابل توجهی بیشتر از ۵۰ و نمرهٔ برخی دیگر به طور قابل ملاحظه‌ای کمتر از ۵۰ باشد. اگر فردی ۱۰ درصد از دانش‌آموزانی را که بیشترین امتیاز را کسب کرده‌اند انتخاب و آزمون دیگری برگزار کند که در آن آزمون دانش آموزان منتخب دوباره به‌طور تصادفی به همهٔ سؤال‌ها پاسخ دهند، انتظار می‌رود میانگین نمره‌های کسب شده جدید باز نزدیک به ۵۰ باشد؛ بنابراین، میانگین این دانش‌آموزان بار دیگر به میانگین تمام دانش‌آموزانی که در آزمون اصلی شرکت کرده بودند «برمی‌گردد». مهم نیست که هر دانش آموز در آزمون اصلی چه نمره‌ای گرفته باشد، بهترین پیش‌بینی نمرهٔ هر دانش آموز در آزمون دوم، ۵۰ است.

اگر انتخاب پاسخ‌های آزمون تصادفی نبود (یعنی اگر در پاسخ‌های دانش آموزان شانس (خوب یا بد) یا حدس تصادفی دخیل نبود) از همه دانش‌آموزان انتظار می‌رفت که در آزمون دوم همان امتیاز آزمون اول را کسب کنند و هیچ برگشت به میانگینی وجود نداشت.

وضعیت‌های واقعی اغلب چیزی بین این دو حالت حدی هستند: برای مثال، ممکن است نمرات امتحان را ترکیبی از مهارت و شانس در نظر بگیریم. در این صورت، زیرمجموعه دانش‌آموزانی که امتیازی بالاتر از میانگین را کسب کرده‌اند، شامل افرادی می‌شود که ماهر بوده‌اند و بدشانسی خاصی نداشته‌اند، و نیز کسانی که مهارتی نداشتند، اما بسیار خوش شانس بودند. پس از برگزاری آزمون مجدد برای این زیر مجموعه، بعید به نظر می‌رسند که افراد فاقد مهارت مجدداً شانس بیاورند، در حالی که به افراد ماهر شانس دومی داده می‌شود که بدشانسی بیاورند. از این رو، بعید به نظر می‌رسند کسانی که قبلاً خوب بوده‌اند در آزمون دوم دقیقاً به خوبی آزمود اول عمل کنند.

مثال بعد نمونهٔ دیگری از برگشت به میانگین است. دانش‌آموزان کلاسی در دو روز متوالی به دو سری سؤال متفاوت از یک آزمون پاسخ می‌دهند. اغلب مشاهده شده‌است که دانش‌آموزانی که در روز اول بدترین نمرات را آورده‌اند در روز دوم نمرات بهتری کسب کرده‌اند و دانش‌آموزانی که در روز اول بهترین نمرات را کسب کرده‌اند نسبتاً بدتر شده‌است. علت این پدیده آن است که نمرات دانش‌آموز تا حدی تابع توانایی‌های واقعی آن‌ها است و تا حدودی تابع تصادف است. در آزمون اول، برخی خوش‌شانس خواهند بود و نسبت به توانایی خود نمرهٔ بهتری کسب خواهند کرد و برخی بدشانس خواهند بود و نمره کمتری از توانایی خود کسب خواهند کرد. برخی از دانش آموزان خوش‌شانس آزمون اول در آزمون دوم هم دوباره شانس خواهند آورد، اما تعداد آن‌هایی که نمراتشان برابر معدل ([توانایی] خود) یا کمتر از معدلشان است بیشتر خواهد بود؛ بنابراین برای دانش‌آموزی که در آزمون اول خوش شانس بوده و نمره‌ای فراتر از توانایی خود به دست آورده‌اند، احتمال اینکه در آزمون دوم نمره بدتری به دست بیاورند بیشتر است. به همین ترتیب، دانش آموزانی که در آزمون اول با بدشانسی نسبت به توانایی خود نمرهٔ کمتری گرفته‌اند، به احتمال زیاد شاهد افزایش نمرات خود در آزمون دوم خواهند بود. هر قدر تأثیر شانس در خلق رویدادهای حدی بیشتر باشد، احتمال این که شانس در چندین رویداد تکرار شود کمتر است.

مثال‌های دیگر[ویرایش]

اگر تیم ورزشی محبوب شما در سال قبل جام قهرمانی را برنده شده باشد، از این رویداد برای احتمال بردن جام فصل بعد چه برداشتی می‌توان داشت؟ هر قدر که این نتیجه به دلیل مهارت تیم باشد (تیم در شرایط خوبی باشد، بهترین مربی‌ها را داشته باشد و …) برد نشانه‌ای است از این که احتمال پیروزی آن‌ها در سال آینده بیشتر است. اما هر قدر دستاورد فصل گذشته بیشتر شانسی بوده باشد (تیم‌های دیگر درگیر رسوایی مواد مخدر بوده‌اند، قرعه کشی به نفع تیم تمام شده، قرعه کشی جذب بازیکنان مؤثر بوده و غیره)، احتمال بردن جام در سال آینده کمتر است.[۵]

اگر بنگاهی اقتصادی فصل بسیار سودآوری را پشت سر گذاشته باشد، در حالی که دلایل اساسی عملکرد آن نسبت به فصل قبل تغییر نکرده‌است، احتمالاً در سه‌ماهه بعدی عملکرد ضعیف‌تری خواهد داشت.[۶]

بازیکنان بیسبال تازه‌کار که در اولین فصل بازی خود عملکرد خوبی نشان می‌دهند، احتمالاً در فصل بعد بدتر خواهند بود چیزی که «پسرفت سال دومی‌ها» نامیده می‌شود. برگشت به میانگین باور عمومی به نفرین جَرایِد را نیز به همان شکل تبیین می‌کند (اینکه پس از عملکرد استثنایی ورزشکار تصویر او در جلد مجلات چاپ می‌شود و پس از آن احتمال عملکرد معمولی ورزشکار در دوره‌های بعد بیشتر می‌شود گویی ظاهر شدن ورزشکار در جلد مجلات باعث افت وی شده‌است).[۷]

تاریخچه[ویرایش]

کشف[ویرایش]

نمواری که فرانسیس گالتون در سال ۱۸۸۶ برای نشان دادن ارتباط بین قد بزرگسالان و والدین آن‌ها ترسیم کرد.[۸] مشاهده حاکی از آن بود که قد کودکان در بزرگسالی انحراف کمتری از میانگین دارند تا قد والدینشان و مفهوم «برگشت به میانگین» را پیشنهاد کرد. نام تحلیل رگرسیون از این‌جا آمده‌است.

مفهوم رگرسیون از ژنتیک سرچشمه می‌گیرد و با انتشار اثر سر فرانسیس گالتون در اواخر قرن نوزدهم با عنوان برگشت به میانگین در وراثت قد شهرت گرفت.[۸] گالتون مشاهده کرد که ویژگی‌هایی حدی (مانند قد) در والدین به طور کامل به فرزندان آن‌ها منتقل نمی‌شود. در عوض، این ویژگی‌ها در فرزندان به سمت یک نقطه متوسط عقب می‌نشینند (نقطه‌ای که پس از آن میانگین نامیده شد). او توانست با اندازه‌گیری قد صدها نفر، این برگشت به میانگین را کمّی کند و اندازه این تأثیر را تخمین بزند. بر اساس نوشته‌های گالتون «برگشت متوسط فرزندان کسر ثابتی از انحرافات میانگین موزون قد والدین آن‌ها است». یعنی تفاوت یکی از ویژگی‌های فرزند و والدینش با میزان اختلاف آن ویژگی در والدین با افراد معمولی آن جامعهٔ آماری ([میانگین جامعه]) متناسب است. اگر قد هر یک از والدین فرد دو اینچ از میانگین قد مردان و زنان بلندتر باشد، در این صورت، فرزند این زوج به طور متوسط، معادل عدد ثابتی (که اکنون آن را یک منهای ضریب رگرسیون می‌نامیم) ضرب در دو اینچ، کوتاهتر از والدین خود خواهد بود. گالتون این ضریب را برای قد حدود ۲/۳ تخمین زد: قد فرد اطراف نقطه‌ای بینابینی قرار خواهد گرفت که دو سوم انحراف والدین از میانگین جامعهٔ آماری است.

گالتون با استفاده از مثالی ساده‌تر نیز این نتایج[۹] را منتشر کرد. وی در این مثال از گلوله‌هایی استفاده کرد از داخل تختهٔ گالتون به پایین سرازیر می‌شدند و توزیع نرمالی شکل می‌دادند که مرکز آن مستقیماً زیر نقطهٔ ورودی گلوله‌ها قرار داشت. می‌شد این گلوله‌ها را دوباره از طریق مجرای دیگری به پایین هدایت کرد که به نقطهٔ سنجشی ثانوی مرتبط بود. سپس گالتون سؤال را وارونه کرد: «این گلوله‌ها از کجا آمده‌اند؟»

«به‌طور متوسط مستقیماً از بالا» پاسخ این سؤال نیست. پاسخ صحیح این است: «به‌طور متوسط، بیشتر از وسط»، به این دلیل ساده که در میانهٔ تخته گلوله‌های بیشتری وجود دارند و احتمال اینکه گلوله‌ها از میانه به پایین سرازیر شده و برخی به کناره‌ها منحرف شده باشند بیشتر از آن است که از منتهی الیه کناره‌ها به پایین سرازیر شده و برخی به میانه‌ها منحرف شده باشند.[۱۰]

کاربرد تکامل یافتهٔ این اصطلاح[ویرایش]

گالتون اصطلاح «رگرسیون» را برای توصیف واقعیتی قابل مشاهده در وراثتِ صفات ژنتیکیِ کمی چند عاملی ابداع کرد: یعنی صفات فرزندانِ والدینی که در انتهای توزیع قرار می‌گیرند اغلب به مرکز یا میانگین توزیع گرایش بیشتری دارند. او این روند را کمّی و به ا ین منظور تحلیل رگرسیون خطی را اختراع کرد، به این صورت زمینه برای موارد بسیاری از مدل‌سازی‌های آماری مدرن فراهم شد. از آن زمان، اصطلاح «رگرسیون» در زمینه‌های دیگری استفاده شده‌است، و دانشمندان علوم آمار مدرن می‌توانند از آن برای توصیف پدیده‌هایی مانند سوگیری نمونه‌گیری استفاده کنند که ارتباط چندانی با مشاهدات اصلی گالتون در زمینه ژنتیک ندارد.

گالتون پدیدهٔ رگرسیون را که در زیست‌شناسی مشاهده کرد چنین شرح داده‌است: «کودک [ویژگی‌های خود را] تا حدی از والدین و میزانی از اجدادش ارث می‌برد. به طور کلی، هرچه در تبارشناسی کودک عقب‌تر رویم، اجداد او متعددتر و متنوع تر می‌شوند، تا زمانی که دیگر با نمونه‌های تصادفی با همان تعداد از کل آن نژاد تفاوتی نخواهد داشت.»[۸] نیاز است گفتهٔ گالتون با استفاده از دانش ژنتیک، کمی توضیحی داده شود: کودکان موارد ژنتیکی را از والدین خود دریافت می‌کنند، اما اطلاعات وراثتی (مثلاً مقادیر صفات به ارث برده شده) ممکن است به واسطهٔ والدینشان از اجداد قبلی به آنها منتقل شود (و ممکن است در والدین آنها بیان نشده باشد). شاید میانگین صفت وراثتی غیرتصادفی باشد و با فشار انتخاب تعیین شود، اما پراکندگی مقادیر حول میانگین، توزیع آماری نرمال را تصویر می‌کند.

پدیده ژنتیک جمعیت که توسط گالتون مطالعه شد، مورد خاصی از «برگشت به میانگین» است. این اصطلاح اغلب برای توصیف بسیاری از پدیده‌های آماری استفاده می‌شود که داده‌ها حول میانگینی مشخص توزیعی نرمال دارند.

اهمیت[ویرایش]

برگشت به میانگین مسئلهٔ مهمی است که در طراحی آزمایش‌ها مورد توجه قرار می‌گیرد.

برای مثال ۱۰۰۰ نفر هم سن را در نظر بگیرید که خطر ابتلا به حمله قلبی در آن‌ها معاینه شده‌است و بر این اساس امتیاز گرفته‌اند. می‌توان با استفاده از علم آمار آزمونی طراحی کرد که با درجه‌ای از عدم قطعیت تأثیر مداخلهٔ درمانی را در ۵۰ نفر از افرادی که در معرض بیشترین خطر قرار داشتند بسنجد. مداخله ممکن است هر نوع تغییر رژیم غذایی، ورزش یا درمان دارویی باشد. حتی اگر مداخلات بی‌اثر باشند باز به دلیل پدیدهٔ برگشت به میانگین انتظار می‌رود که در معاینه پزشکی بعدیِ گروه آزمایش، بهبود مشاهده شود. بهترین راه برای مبارزه با این اثر تقسیم تصادفی گروه آزمایش به یک گروه درمانی است که درمان را دریافت می‌کند و گروهی که درمان دریافت نمی‌کند. درمان تنها در صورتی مؤثر ارزیابی می‌شود که گروه درمان شده نسبت به گروه درمان نشده بهبود بشتری داشته باشند.

از طرف دیگر، می‌توان با هدف شناسایی افرادی با پتانسیل تحصیلی بالاتر، گروهی از کودکان کم‌بضاعت را آزمود. سپس برای ۱٪ برتر آزمون، دوره‌های ویژهٔ پیشرفته، تدریس خصوصی، مشاوره و رایانه فراهم کرد. حتی اگر این برنامه مؤثر باشد شاید یک سال دیگر با تکرار آزمون میانگین نمرات آن‌ها کمتر شود. با این حال، شاید در این شرایط در نظر گفتن گروه کنترلی متشکل از کودکان کم‌بضاعت که نیازهای ویژهٔ آن‌ها نادیده گرفته شده‌است غیراخلاقی تلقی شود. ممکن است محاسبات ریاضی انقباضی این اثر را تعدیل کند، اگرچه به اندازه روش گروه کنترل قابل اتکا نخواهد بود (همچنین مراجعه شود به مثال استاین).

همچنین این اثر در استنتاج آماری و تخمین کاربرد دارد. احتمال اینکه گرم‌ترین مکان کشور در روز گذشته، فردا خنک تر شود بیشتر از آن است که گرم تر شود. صندوق سرمایه‌گذاری مشترکی که در طول سه سال گذشته بهترین عملکرد را داشته‌است در سه سال آینده با احتمال بیشتری شاهد کاهش عملکرد نسبی خواهد شد تا بهبود عملکرد. احتمال اینکه موفق‌ترین بازیگر هالیوود امسال در فیل بعدی خود سود کمتری به دست‌آورد بیشتر است تا احتمال اینکه سود بیشتری به دست‌آورد. بازیکن بیسبالی که بالاترین میانگین ضربه زدن را در مسابقات آل استار را داشته‌است، به احتمال بیشتر در نیم فصل دوم میانگین پایین‌تری خواهد داشت تا اینکه میانگین بالاتری به دست بیاورد.

سوء برداشت‌ها[ویرایش]

ممکن است مفهوم برگشت به میانگین به اشتباه استفاده شود.

در مثال آزمون دانش‌آموزان قبلی، به طور ضمنی فرض شده بود که آنچه اندازه‌گیری می‌شود در فاصلهٔ دو اندازه‌گیری تغییر نمی‌کند. با این حال، فرض کنید که نتیجهٔ دوره دو حالت قبولی یا مردودی داشته باشد و دانش آموزان برای قبولی باید در هر دو آزمون نمره‌ای بالاتر از ۷۰ کسب کنند. پس دانش‌آموزانی که نمرهٔ اولشان کمتر از ۷۰ باشد انگیزه‌ای برای عملکرد خوب نخواهند داشت و ممکن است بار دوم به‌طور میانگین نمره بدتری کسب کنند. از سوی دیگر، دانش آموزانی که نمرهٔ بالای ۷۰ کسب کنند برای مطالعه قبل از آزمون و تمرکز حین آزمون انگیزه‌ای قوی خواهند داشت. در این صورت ممکن است مشاهده شود که نمره‌ها از ۷۰ فاصله می‌گیرند به این صورت که نمره‌های کمتر از ۷۰ باز هم کمتر می‌شوند و نمره‌های بالای ۷۰ بیشتر. ممکن است، تغییرات بین زمان‌های اندازه‌گیری باعث تقویت، خنثی یا معکوس کردن گرایش آماری برای برگشت به میانگین شود.

برگشت آماری به میانگین پدیده‌ای علّی نیست. دانش آموزی که در روز اول بدترین نمره را در آزمون داشته باشد، لزوماً به دلیل این پدیده، نمرهٔ خود را در روز دوم بهبود نخواهد داد. به طور میانگین [در آزمون دوم] نمرهٔ افرادی که [در آزمون اول] کمترین نمره‌ها را آورده‌اند بهتر می‌شود اما فقط به این دلیل که در آزمون اول احتمال اینکه بدشانسی آورده باشند بیشتر از خوش شانسی آوردن بوده‌است. تا زمانی که نمرات به طور تصادفی تعیین شوند، یا نمرات تغییرات یا خطای تصادفی داشته باشند، نه اینکه بر اساس توانایی تحصیلی دانش آموز تعیین شده باشند یا [به اصطلاح «مقادیری واقعی» نباشند، این پدیده تأثیر خواهد داشت. یکی از اشتباهات متداول از این نظر در آموزش رخ می‌داد. دانش‌آموزانی که به‌خاطر عملکرد خوب تحسین می‌شدند، در اندازه‌گیری‌های بعدی ضعیف‌تر عمل می‌کردند و دانش‌آموزانی که به دلیل عملکرد ضعیف تنبیه می‌شدند، در مرحله بعدی بهتر عمل می‌کردند. بر این اساس آموزگاران تصمیم گرفتند تشویق را کنار بگذارند و تنبیه را ادامه دهند.[۱۱] چنین تصمیمی اشتباه بود، زیرا برگشت به میانگین مبنای علی ندارد، بلکه مبنای آن خطایی تصادفی است حول میانگینی مشخص توزیعی طبیعی دارد.

اگرچه هر یک از اندازه‌گیری‌های حدی به میانگین برمی گردند، نمونه دوم اندازه‌گیری‌ها نسبت نمونهٔ اول به میانگین نزدیک‌تر نخواهد بود. دوباره دانش آموزان را در نظر بگیرید. فرض کنید افراد حدی گرایش داشته باشند تا ۱۰ درصد طول بازه را به سمت میانگینِ ۸۰ برگردند، بنابراین انتظار می‌رود دانش آموزی که روز اول نمره ۱۰۰ را کسب کرده‌است، روز دوم نمرهٔ ۹۸ بیاورد و دانش آموزی که روز اول نمرهٔ ۷۰ آورده‌است انتظار می‌رود در روز دوم امتیاز ۷۱ کسب کند. مقادری مورد انتظار روز دوم نسبت به روز اول به میانگین نزدیک‌ترند. اما نمرات روز دوم در نزدیکی مقادیر مورد انتظار خود قرار خواهند گرفت. برخی بالاتر و برخی پایین‌تر خواهند بود. علاوه بر این، افرادی که نمراتشان به میانگین خیلی نزدیک بوده باید انتظار داشته باشند که از میانگین فاصله بگیرند. این اثر دقیقاً خلاف برگشت به میانگین است و دقیقاً آن را خنثی می‌کند؛ بنابراین انتظار داریم افرادی که نمرات حدی آورده‌اند در روز دوم نمراتی نزدیک تر به میانگین کسب کنند، اما برای همه‌ی افراد، انتظار داریم توزیع فاصله از میانگین در هر دو مجموعهٔ اندازه‌گیری یکسان باشد.

در رابطه با نکته بالا، عملکرد برگشت به میانگین در هر دو جهت به یک اندازه خوب است. انتظار می‌رود دانش آموزی که بالاترین نمرهٔ آزمون را در روز دوم کسب کرده‌است، در روز اول بدتر عمل کرده باشد. همچنین اگر بهترین دانش آموزِ روز اول را با بهترین دانش آموز روز دوم مقایسه کنیم، صرف نظر از اینکه هر دو یک نفر باشند یا خیر، تمایلی برای برگشت به میانگین در هر یک از دو جهت وجود ندارد. انتظار می‌رود که بهترین نمره‌ها در هر دو روز به یک اندازه از میانگین فاصله داشته باشد.

مغالطه‌های برگشت به میانگین[ویرایش]

اگر برگشت به میانگین در نظر گرفته نشود، پدیده‌های بسیاری به علل نادرست نسبت داده می‌شوند.

بدترین نمونه از این مغالطه‌ها کتاب هوراس سکریست در سال ۱۹۳۳ با عنوان غلبهٔ میانمایگی در کسب و کار است، این استادِ آمار در کتابش کوهی از داده را جمع‌آوری کرد تا ثابت کند که نرخ سودآوری کسب‌وکارهای رقابتی در طول زمان به سمت میانگین گرایش دارند. در واقع، چنین تأثیری وجود ندارد؛ تغییرات نرخ سودآوری تقریباً در طول زمان ثابت است. سکریست فقط برگشت به میانگین متداول را توصیف کرده بود. یکی از منتقدان خشمگین این اثر به نام هارولد هتلینگ، کتاب سکریست را اینطور توصیف کرده بود: «اثبات جدول ضرب با چیدن تعدادی فیل در ردیف‌ها و ستون‌های مختلف و سپس تکرار همین کار برای چندین حیوان دیگر از گونه‌های مختلف».[۱۲]

مثال دیگری از مغالطهٔ برگشت به میانگین، به احتمال زیاد محاسبات و تفسیر «رتبه‌بندی بهبود» در آزمون‌های آموزشی استاندارد ماساچوست است.[نیازمند منبع] در سال ۱۹۹۹، برای مدارس اهداف بهبود خاصی تعیین شد. وزارت آموزش و پرورش تفاوت میانگین نمرات کسب شده توسط دانش آموزان را در سال‌های ۱۹۹۹ و ۲۰۰۰ در جداولی درج کرد. به سرعت مشاهده شد که اکثر مدارسی که بدترین عملکرد را داشتند به اهداف خود دست یافتند، که وزارت آموزش و پرورش آن را به عنوان تأییدی بر درستی سیاست‌های آن‌ها در نظر گرفت. با این حال، همچنین اشاره شد که بسیاری از بهترین مدارس در ایالت‌های مشترک المنافع، مانند دبیرستان بروکلین (با ۱۸ فینالیست بورسیه شایستگی ملی) شکست خورده بودند. این موضوع در بسیاری از نمونه‌های دیگرِ آمار و سیاست عمومی بررسی شده‌است، اما «نمرات بهبود» در سال‌های بعد اعلام نشد و به نظر می‌رسد یافته‌های به دست آمده مصادیقی از برگشت به میانگین باشند.

دانیل کانمن، روان‌شناس، برنده جایزه یادبود نوبل اقتصادی در سال ۲۰۰۲، خاطرنشان کرد که برگشت به میانگین ممکن است دلیل این را که چرا به نظر می‌رسد تنبیه می‌تواند عملکرد را بهبود بخشد، در حالی که به نظر می‌رسد تحسین نتیجه معکوس دارد توضیح دهد.[۱۳]

روزی برای مربیان خلبانی دوره‌ای برگزار می‌کردم و آموزش می‌دادم که برای یادگیری مهارت جدید تشویق از تنبیه اثربخش تر است که با لذت بخش‌ترین تجربهٔ اکتشافی دوران شغلی‌ام مواجه شدم. زمانی که سخنرانی پر شورم به پایان رسید یکی از مربیان کهنه کارِ حاضر دستش را بالا آورد و سخنرانی کوتاه خود را ایراد کرد و گفت تقویت مثبت شاید برای پرندگان مفید باشد اما برای دانشجویان خلبانی نظامی کارایی مطلوبی ندارد. او گفت «در موارد بسیاری دانشجویان خلبانی را برای اجرای بی عیب مانور هوایی تشویق کرده‌ام و در کل وقتی این دانشجویان مانور را تکرار می‌کنند عملکردشان بدتر می‌شود. از طرفی معمولاً بر سر دانشجویانی که عملکرد نامناسب داشته‌اند فریاد زده‌ام و در کل دفعهٔ بعد عملکرد بهتری داشته‌اند. پس خواهش می‌کنم به ما نگویید که تشویق مؤثر است و تنبیه کارایی ندارد چون خلاف آن صادق بوده‌است.» این لحظه بسیار مسرت بخش بود زیرا متوجه حقیقتی مهم در مورد جهان شدم: چون گرایش ما این است که به افراد در ازای عملکرد خوب پاداش دهیم و آن‌ها را در ازای عملکرد تنبیه کنیم و از آنجا که برگشت به میانگین وجود دارد، این بخشی از شرایط انسانی این است که به طور آماری برای پاداش دادن دیگران تنبیه می‌شویم و در ازای تنبیه دیگران پاداش می‌گیریم. بلافاصله آزمایشی را ترتیب دادم که در آن حضار دو سکه را به سمت هدفی در پشت سر خود پرتاب می‌کردند و هیچ بازخوردی نمی‌گرفتند. فاصلهٔ سکه‌ها از هدف را اندازه‌گیری کردیم و دیدیم که افرادی که در تلاش اول بهترین عملکرد را داشتند اغلب در تلاش دوم بدتر شدند و بالعکس. اما می‌دانستم که این آزمایش تأثیر یک عمر قرار گرفتن در معرض شرایطی انحطاطی را از بین نخواهد برد.

مغالطهٔ رگرسیون در کتاب هنر شفاف اندیشیدن نوشتهٔ رولف دوبلی نیز شرح داده شده‌است.

در خط مشی‌های مجریان قانون بریتانیا، نصب دوربین‌های ثبت تخلف ثابت یا متحرک به طور قابل رویت در نقاط سیاه تصادف توصیه شده‌است. توجیه این سیاست بر اساس این تصور است که پس از نصب دوربین، تصادفات رانندگی به طور جدی کاهش می‌یابد. با این حال، متخصصان آمار خاطرنشان کرده‌اند که، اگرچه از لحاظ نجات جان افراد فایدهٔ خالصی وجود داشته‌است، اما عدم در نظر گرفتن اثرات برگشت به میانگین منجر به اغراق این اثرات مفید می‌شود.[۱۴][۱۵][۱۶]

تحلیلگران آماری مدت‌هاست که تأثیر برگشت به میانگین در ورزش را تشخیص داده‌اند و حتی نام خاصی برای آن دارند: «پسرفت سال دومی‌ها». مثلاً کارملو آنتونی از تیم دنور ناگتس لیگ NBA در اولین فصل بازی حرفه‌ای خود در سال ۲۰۰۴ فوق‌العاده بود. آنقدر برجسته بود که انتظار نمی‌رفت آن عملکرد را تکرار کند: در سال ۲۰۰۵، شاخص‌های عملکرد آنتونی نسبت به اولین فصل بازی او کاهش پیدا کرد. دلایل «پسرفت سال دومی‌ها» فراوان است و ورزش بر همین فراز و نشیب‌ها متکی است، اما برتری شانسی تازه کاران نیز دلیل مهمی است. برگشت به میانگین در عملکرد ورزشی، برخی از باورهای عامه نظیر «نفرین جراید» و «نفرین میدن» را توضیح دهد. جان هولینگر نام دیگری برای پدیده برگشت به میانگین دارد: «قانون تصادف»[نیازمند منبع]، در حالی که بیل جیمز آن را «اصل پلکسی گلاس» می‌نامد.[نیازمند منبع]

از آنجایی که افسانه‌های رایج بر وجهی از برگشت به میانگین تمرکز دارند که کاهش عملکرد ورزشکاران از فصلی به فصل دیگر را تبیین می‌کند، معمولاً این واقعیت نادیده گرفته می‌شود که چنین برگشتی می‌تواند عامل بهبود عملکرد نیز باشد. به عنوان مثال، اگر به میانگین ضربه زدن بازیکنان لیگ برتر بیسبال در یک فصل نگاه کنیم، بازیکنانی که میانگین ضربه زدنشان بالاتر از میانگین لیگ بود، در سال بعد به سمت پایین گرایش داشتند، در حالی که گرایش بازیکنان زیر میانگین در سال بعد، روبه رشد و به سمت میانگین بود.[۱۷]

سایر پدیده‌های آماری[ویرایش]

مخلص کلام برگشت به میانگین این است که پس از یک رویداد تصادفی حدی، رویداد تصادفی بعدی احتمالاً شدت کمتری خواهد داشت [و عادی تر خواهد بود]. به هیچ وجه رویداد آینده رویداد قبلی را «جبران» یا «خنثی» نمی‌کند، اگرچه این در مغالطهٔ قماربازقانون میانگین‌ها) در نظر گرفته می‌شود. به طور مشابه، قانون اعداد بزرگ بیان می‌کند که در بلندمدت، میانگین به سمت امید ریاضی می‌رود، اما در مورد آزمایش‌های فردی هیچ اظهارنظری نمی‌کند. به عنوان مثال، پس از آمدن ۱۰ شیر در پرتاب سکه‌ای عادی (رویدادی نادر و شدید)، برگشت به میانگین بیان می‌کند که دور بعدی احتمالاً تعداد شیر کمتر از ۱۰ خواهد بود، در حالی که قانون اعداد بزرگ بیان می‌کند که در درازمدت، این رویداد احتمالاً به سمت میانگین تعدیل می‌شود و سهم شیر به طور میانگین به ۱/۲ گرایش پیدا می‌کند. در مقابل، در مغالطه قمارباز به اشتباه فرض می‌شود که پرتاب‌های بعدی سکه برای ایجاد توازن الزاماً یک سری خط خواهد بود.

معکوس این اثر، میانگین گریزی است که در هر توزیعی با چگالی احتمال غیرصفر تا بی‌نهایت رخ می‌دهد.[۱۸]

تعریف برای رگرسیون خطی سادهٔ نقاط داده[ویرایش]

این تعریف برگشت به میانگین است که دقیقاً از کاربرد اصلی سر فرانسیس گالتون پیروی می‌کند.[۸]

فرض کنید تعداد n داده { yi, xi } داشته باشیم، که i = ۱، ۲، ...، n. می‌خواهیم معادله خط رگرسیون را پیدا کنیم که خطی مستقیم است:

این معادله «بهترین» برازش را برای نقاط داده فراهم می‌کند. (توجه داشته باشید که یک خط مستقیم ممکن است منحنی رگرسیون مناسب برای نقاط داده داده شده نباشد) در اینجا «بهترین» با رویکرد حداقل مربعات استنباط می‌شود: خطی که مجموع مجذور باقیمانده‌های مدل رگرسیون خطی را به حداقل می‌رساند. به عبارت دیگر، اعداد α و β مشکل کمینه سازی زیر را حل می‌کنند:

پیدا کردن ، که

با استفاده از محاسبات دیفرانسیل و انتگرال می‌توان نشان داد که مقادیر α و β که تابع هدف Q را به حداقل می‌رسانند عبارتند از:

که rxy ضریب همبستگی نمونه بین x و y است، sx انحراف معیار x, و sy انحراف معیار y است. منظور از خط افقی روی متغیر، میانگین نمونه آن متغیر است. مثلا:

با جایگزینی عبارات بالا به جای و در مقادیر برازش شده به دست می‌آید:

که می‌دهد:

می‌توان نقش r xy در خط رگرسیون نقاط داده استاندارد شده را در معادلهٔ بالا مشاهده کرد.

اگر rxy بین ۱ و -۱ باشد می‌گوییم که داده‌ها برگشت به میانگین را نشان می‌دهند. به عبارت دیگر، اگر رگرسیون خطی مدل مناسبی برای مجموعه‌ای از نقاط داده باشد که ضریب همبستگی نمونه آن کامل نیست، آنگاه رگرسیون به سمت میانگین وجود دارد. مقدار استاندارد پیش‌بینی‌شده (یا برازش) y به میانگین آن نزدیک‌تر است تا مقدار استاندارد شده x به میانگین آن.

تعاریف توزیع دو متغیره با توزیع‌های حاشیه‌ای یکنواخت[ویرایش]

تعریف خاص[ویرایش]

فرض کنید X 1, X 2 متغیرهای تصادفی با توزیع حاشیه‌ای یکسان با میانگین μ باشند. در این چهارچوب گفته می‌شود که در توزیع دو متغیره X 1 و X 2 برگشت به میانگین قابل مشاهده است اگر، برای هر عدد c > μ داشته باشیم:

μ ≤ E[X2 | X1 = c] < c,

و عکس این نامعادله برای c < μ نیز صادق است.[۱۹][۲۰]

در ادامه توضیحی غیررسمی از تعریف فوق ارائه شده‌است. جامعه‌ای آماری ااز یک محصول خاص را در نظر بگیرید. هر محصول دارای دو مقدار عددی X 1 و X 2 است (مثلاً سطح نیمهٔ چپ آن (X 1) و سطح نیمهٔ راست آن (X 2) باشد). فرض کنید که X 1 و X 2 توزیع احتمال یکسانی دارند و میانگین X 1 و X 2 هر دو μ هستند. اکنون یک محصول تصادفی از جمعیت انتخاب می‌شود و مقدار X 1 آن را با c نشان می‌دهیم (توجه داشته باشید که c ممکن است بزرگتر، مساوی یا کوچکتر از μ باشد). هنوز به مقدار X 2 این محصول دسترسی نداریم. مقدار مورد انتظار X 2 این محصول خاص را با d نشان می‌دهیم. (یعنی فرض کنید d مقدار میانگین X 2 همه محصولاتی در جامعه آماری باشد که مقدار X1 آن‌ها c باشد). اگر شرط زیر درست باشد:

مقدار c هر چه باشد، d بین μ و c قرار می‌گیرد (یعنی d به μ نزدیکتر از c است)

بنابرین می‌گوییم که X 1 و X 2 برگشت به میانگین را نشان می‌دهند.

این تعریف دقیقاً با کاربرد متداول کنونی که بر پایهٔ شیوهٔ استفادهٔ اصلی گالتون از اصطلاح «برگشت به میانگین» تکامل یافته مطابقت دارد. تعریف کنونی «تعریفی خاص» است به این معنا که هر توزیع دو متغیره که توزیع‌های حاشیه‌ای یکسان داشته باشد، برگشت به میانگین را نشان نمی‌دهد (با توجه به این تعریف).[۲۰]

قضیه[ویرایش]

اگر زوج (X , Y) متشکل از دو متغیرهای تصادفی از توزیع نرمال دو متغیره پیروی کند، آنگاه میانگین شرطی E(Y | X) تابع خطی X است. ضریب همبستگی r بین X و Y به همراه میانگین‌های و واریانس‌های حاشیه‌ای X و این رابطه خطی را تعیین می‌کنند:

که در آن E[X] و E[Y] به ترتیب امید ریاضی X و Y و σ x و σ y به ترتیب انحراف از معیار X و Y هستند.

از این رو امید ریاضی شرطی Y، با شرط اینکه X از میانگین خود به مقدار t انحراف از معیار بیشتر باشد (که حالتی را که کمتر از میانگین باشد را نیز در صورت t < 0 شامل می‌شود)، به مقدار rt انحراف استاندارد بیشتر از میانگین Y خواهد بود. از آنجا که |r| کوچکتر یا مساوی ۱ است، فاصلهٔ Y از میانگین از فاصلهٔ X از میانگین بیشتر نیست و این فاصله بر اساس ضریبی از انحرافات از معیار اندازه‌گیری می‌شود.[۲۱]

بنابراین، اگر مقدار r بزرگتر یا مساوی صفر و کوچکتر از یک باشد، آنگاه (X , Y) برگشت به میانگین را نشان می‌دهد (بر اساس این تعریف).

تعریف عام[ویرایش]

ساموئلز تعریف زیر را برای برگشت به میانگین ارائه کرد تا جایگزینی برای تعریف خاص برگشت به میانگین باشد که در بالا اشاره شد.[۱۹]

فرض کنید X 1, X 2 متغیرهای تصادفی با توزیع حاشیه‌ای یکسان و میانگین μ باشند. در این چهارچوب بندی گفته می‌شود توزیع دو متغیره X 1 و X 2 برگشت به میانگین نشان می‌دهد اگر برای هر عدد c داشته باشیم:

μ ≤ E[X2 | X1 > c] < E[X1 | X1 > c], و
μ ≥ E[X2 | X1 < c] > E[X1 | X1 < c]

این تعریف «عام» است به این معنا که هر توزیع دو متغیره با توزیع‌های حاشیه‌ای یکسان، برگشت به میانگین را نشان می‌دهد، مشروط بر اینکه برخی شروط ضعیف برآورده شوند (طبق توضیحات ارائه شده در مقاله ساموئلز این شروط عبارتند از نبود تبهگنی و وابستگی مثبت ضعیف[۱۹]).

تعریف جایگزین در کاربرد مالی[ویرایش]

جرمی سیگل از اصطلاح «برگشت به میانگین» برای توصیف سری زمانی مالی خاصی استفاده می‌کند که در آن «ممکن است بازده در کوتاه‌مدت بسیار ناپایدار اما در بلندمدت بسیار پایدار باشد». از نظر کمی، انحراف معیار میانگین بازده سالانه سریع‌تر از معکوس دوره نگهداری کاسته می‌شود، و به طور ضمنی استنباط می‌شود که این فرایند ولگشت نیست، بلکه به شکلی نظام مند پس از دوره‌هایی که در آن‌ها بازده کمتر کسب شده‌است، دوره‌هایی جبرانی با بازده بالاتر می‌آیند. نمونهٔ آن در بسیاری از مشاغل فصلی مشاهده می‌شود.[۲۲]

جستارهای وابسته[ویرایش]

منابع[ویرایش]

  1. Everitt, B. S. (August 12, 2002). The Cambridge Dictionary of Statistics (2 ed.). Cambridge University Press. ISBN 978-0521810999.
  2. Upton, Graham; Cook, Ian (21 August 2008). Oxford Dictionary of Statistics. Oxford University Press. ISBN 978-0-19-954145-4.
  3. Stigler, Stephen M (1997). "Regression toward the mean, historically considered". Statistical Methods in Medical Research. 6 (2): 103–114. doi:10.1191/096228097676361431. PMID 9261910.
  4. Chiolero, A; Paradis, G; Rich, B; Hanley, JA (2013). "Assessing the Relationship between the Baseline Value of a Continuous Variable and Subsequent Change Over Time". Frontiers in Public Health. 1: 29. doi:10.3389/fpubh.2013.00029. PMC 3854983. PMID 24350198.
  5. "A statistical review of 'Thinking, Fast and Slow' by Daniel Kahneman". Burns Statistics. November 11, 2013. Retrieved January 1, 2022.
  6. "What is regression to the mean? Definition and examples". conceptually.org. Retrieved October 25, 2017.
  7. Goldacre, Ben (April 4, 2009). Bad Science. Fourth Estate. p. 39. ISBN 978-0-00-728487-0
  8. ۸٫۰ ۸٫۱ ۸٫۲ ۸٫۳ Galton, F. (1886). "Regression towards mediocrity in hereditary stature". The Journal of the Anthropological Institute of Great Britain and Ireland. 15: 246–263. doi:10.2307/2841583. JSTOR 2841583.
  9. Galton, Francis (1889). Natural Inheritance. London: Macmillan.
  10. Stigler, Stephen M. (June 17, 2010). "Darwin, Galton and the Statistical Enlightenment". Journal of the Royal Statistical Society, Series A. 173 (3): 469–482, 477. doi:10.1111/j.1467-985X.2010.00643.x. ISSN 1467-985X.
  11. Kahneman, Daniel (October 1, 2011). Thinking Fast and Slow. Farrar, Straus and Giroux. ISBN 978-0-374-27563-1.
  12. Secrist, Horace; Hotelling, Harold; Rorty, M. C.; Gini, Corrada; King, Wilford I. (June 1934). "Open Letters". Journal of the American Statistical Association. 29: 196–205. doi:10.1080/01621459.1934.10502711. JSTOR 2278295.
  13. Defulio, Anthony (2012). "Quotation: Kahneman on Contingencies". Journal of the Experimental Analysis of Behavior. 97 (2): 182. doi:10.1901/jeab.2012.97-182. PMC 3292229.
  14. Webster, Ben (December 16, 2005). "Speed camera benefits overrated". The Times. Retrieved January 1, 2022.(نیازمند آبونمان)
  15. Mountain, L. (2006). "Safety cameras: Stealth tax or life-savers?". Significance. 3 (3): 111–113. doi:10.1111/j.1740-9713.2006.00179.x.
  16. Maher, Mike; Mountain, Linda (2009). "The sensitivity of estimates of regression to the mean". Accident Analysis & Prevention. 41 (4): 861–8. doi:10.1016/j.aap.2009.04.020. PMID 19540977.
  17. For an illustration see Nate Silver, "Randomness: Catch the Fever!", Baseball Prospectus, May 14, 2003.
  18. Flyvbjerg, Bent (5 October 2020). "The law of regression to the tail: How to survive Covid-19, the climate crisis, and other disasters". Environmental Science & Policy. 114: 614–618. doi:10.1016/j.envsci.2020.08.013. ISSN 1462-9011. PMC 7533687. PMID 33041651.
  19. ۱۹٫۰ ۱۹٫۱ ۱۹٫۲ Samuels, Myra L. (November 1991). "Statistical Reversion Toward the Mean: More Universal than Regression Toward the Mean". The American Statistician. 45 (4): 344–346. doi:10.2307/2684474. JSTOR 2684474..
  20. ۲۰٫۰ ۲۰٫۱ Schmittlein, David C (August 1989). "Surprising Inferences from unsurprising Observations: Do Conditional Expectations really regress to the Mean?". The American Statistician. 43: 176–183. doi:10.2307/2685070. JSTOR 2685070.
  21. Chernick, Michael R. ; Friis, Robert H. (March 17, 2003). Introductory Biostatistics for the Health Sciences. Wiley-Interscience. p. 272. ISBN 978-0-471-41137-6.
  22. Siegel, Jeremy (November 27, 2007). Stocks for the Long Run (4th ed.). McGraw–Hill. pp. 13, 28–29. ISBN 978-0071494700.