داده پرت

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به ناوبری پرش به جستجو
داده‌ای پرت (قرمز) که ظاهراً با دیگر داده‌ها نمی‌خواند، رگرسیون خطی آبی بدون درنظر گرفتن تأثیر آن ترسیم شده و خط قرمز با به‌حساب آوردن آن.
نمودار جعبه‌ای برای توصیف داده آزمایش مایکلسون-مورلی. داده‌های پرت با دایره‌های کوچکی نمایش داده‌شده‌اند.

در مبحث آمار، دادهٔ پرت به داده‌ای گفته می‌شود که با دیگر داده‌های هم‌گروه فاصلهٔ چشمگیری داشته‌باشد، (یا به‌اصطلاح "نخواند")[۱] گرابز دادهٔ پرت را این‌چنین تعریف کرده‌است:[۲]

دادهٔ پرت داده‌ای است که تفاوت قابل ملاحظه‌ای با بقیهٔ اعضای نمونه‌ای که در آن اتفاق افتاده‌است داشته‌باشد.

برای پرتی یک دادهٔ بخصوص و نیز دیگر داده‌های پرت دلایل زیادی می‌تواند وجود داشته باشد اما معمولاً حضور آن‌ها نشان‌گر این است که؛ یا برخی از اندازه‌گیری‌ها دارای اشتباه هستند، یا داده دارای توزیع احتمالی با دنبال سنگین (نشان‌گر نکته‌ای) است.

منابع[ویرایش]

  1. Barnett, V. and Lewis, T. : 1994, Outliers in Statistical Data. John Wiley & Sons. , 3rd edition.
  2. Grubbs, F. E. : 1969, Procedures for detecting outlying observations in samples. Technometrics 11, 1–21.

Wikipedia contributors, "Outlier," Wikipedia, The Free Encyclopedia, (accessed January 9, 2013).