آمار باثبات

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

آمار باثبات راهی برای دستیابی به روش‌های پایه آماری است به طوری که برآوردها تحت تأثیر مقادیر نامتعارف بسیار بزرگ یا بسیار کوچک قرار نگیرد. در واقع آمار باثبات، آماری با اجرای خوب برای داده ای است که از طیف گسترده توزیع احتمال بدست می‌آید، به ویژه برای توزیع‌هایی که نرمال نیستند. روش‌های آماری مقاوم برای حل بسیاری از مسائل رایج مانند تخمین پارامتر مکان، پارامتر مقیاس و رگرسیون خطی توسعه یافته اند. یکی از اهدا، ایجاد روش‌های آماری است که به طور بی‌جهت تحت تاثیر داده پرت قرار نمی‌گیرند. هدف دیگر فراهم‌کردن روش‌هایی با کارایی خوب در زمانی است که خروج‌های اندکی از توزیع‌های پارامتری وجود دارد. برای مثال، روش‌های مقاوم برای ترکیب دو توزیع نرمال با انحرافات استاندارد مختلف به خوبی جواب می‌دهند: مثلا، یک و سه؛ در این مدل، روش‌های غیر مقاوم مانند آزمون t کارایی خوبی ندارند.

معرفی[ویرایش]

آمار باثبات در جستجوی بدست آوردن روش‌هایی آماری است که تحت تاثیر داده‌های انحرافی در نمونه یا داده‌های نامتعارف نسبت به فرضیات مدل، قرار نمی‌گیرد و در عین حال قابل انطباق با روش‌های متداول آماری باشد. روش‌های پایهٔ آماری بر فرضیاتی بنا میشوند که در عمل و در بیشتر موارد فراهم کردن آنها دشوار است. به ویژه معمول است که فرض شود باقی مانده‌ها به صورت گوسی توزیع شده‌اند، حداقل به طور تقریبی، یا آنکه قضیه حد مرکزی معتبر باقی میماند تا تخمین‌هایی با توزیع گوسی تولید کند، اما متأسفانه وقتی در میان داده‌ها تعدادی نقطهٔ نامتعارف وجود داشته باشد روش‌های پایه کارایی اندکی از خود نشان می‌دهند. آماره‌های پارامتری باثبات سعی می‌کنند فرض توزیع گوسی در روش‌های پایه را با توزیع تی-استیودنت با درجهٔ آزادی کم یا حتی ترکیبی از دو یا چند توزیع جایگزین کنند. برای برآورد کمی میزان ثبات یک روش آماری، سنجش‌های ثبات را تعریف می کنیم. دو سنجش بسیار متداول عبارتند از حد واژگونی و تابع تأثیر.

مثال[ویرایش]

  • میانه سنجشی باثبات از میزان تمایل به مرکز[۱] است درحالی که میانگین اینگونه نیست به طور مثال اگر در یک دسته از داده‌ها ۵۰٪ آنها نامتعارف باشد باز مقدار میانه تغییر نمی‌کند اما اگر در یک دسته فقط یک دادهٔ نامتعارف داشته باشیم مقدار میانگین تغییر می‌کند. به بیان دیگر حد واژگونی برای میانه ۵۰٪ و برای میانگین صفر درصد است.
  • انحراف مطلق از میانه[۲] و دامنهٔ میان‌چارکی[۳] برآورهای با ثباتی از پراکندگی آماری[۴] بدست می‌دهند درحالی که انحراف معیار و دامنه اینگونه نیستند.

ته‌بریده کردن[۵] یک روش عمومی برای باثبات کردن آماره است.

پانویس[ویرایش]

جستارهای وابسته[ویرایش]

منابع[ویرایش]

  • (Robust Statistics, Peter. J. Huber, Wiley, 1981 (republished in paperback, 2004

مشارکت‌کنندگان ویکی‌پدیا، «Robust statistics»، ویکی‌پدیای انگلیسی، دانشنامهٔ آزاد (بازیابی در ۲۴ سپتامبر ۲۰۱۰).