سوگیری (آمار)

از ویکی‌پدیا، دانشنامهٔ آزاد

سوگیری آماری (به انگلیسی: Statistical bias) یک گرایش سیستماتیک است که سبب تفاوت بین نتایج و حقایق می‌شود. سوگیری در اعداد فرایند تجزیه و تحلیل داده‌ها، از جمله منبع داده‌ها، برآوردگر انتخاب‌شده، و روش‌های تجزیه و تحلیل داده‌ها وجود دارد. سوگیری ممکن است تأثیر جدی بر نتایج داشته باشد، به عنوان مثال، برای بررسی عادت خرید افراد. اگر حجم نمونه به اندازه کافی بزرگ نباشد، نتایج ممکن است نشان‌دهنده عادت خرید همه افراد نباشد؛ یعنی ممکن است بین نتایج نظرسنجی و واقعیت مغایرت وجود داشته باشد؛ بنابراین، درک منبع سوگیری آماری می‌تواند به ارزیابی نزدیک بودن نتایج مشاهده‌شده به واقعیت کمک کند.

انواع[ویرایش]

سوگیری آماری از همه مراحل تجزیه و تحلیل داده‌ها ناشی می‌شود. منابع سوگیری در مراحل مخلف در زیر یاد شده‌اند.

  • انتخاب داده‌ها
  • آزمایش فرضیه
  • انتخاب برآوردگر
  • روش‌های تحلیل
  • تفسیر

منابع[ویرایش]