داده پرت

از ویکی‌پدیا، دانشنامهٔ آزاد
داده‌ای پرت (قرمز) که ظاهراً با دیگر داده‌ها نمی‌خواند، رگرسیون خطی آبی بدون درنظر گرفتن تأثیر آن ترسیم شده و خط قرمز با به‌حساب آوردن آن.
نمودار جعبه‌ای برای توصیف داده آزمایش مایکلسون-مورلی. داده‌های پرت با دایره‌های کوچکی نمایش داده‌شده‌اند.

دادهٔ پرت یا داده دورافتاده[۱] (به انگلیسی: Outlier) در مبحث آمار، به داده‌ای گفته می‌شود که با دیگر داده‌های هم‌گروه فاصلهٔ چشمگیری داشته‌باشد، (یا به‌اصطلاح "نخواند")[۲] گرابز دادهٔ پرت را این‌چنین تعریف کرده‌است:[۳]

دادهٔ پرت داده‌ای است که تفاوت قابل ملاحظه‌ای با بقیهٔ اعضای نمونه‌ای که در آن اتفاق افتاده‌است داشته‌باشد.

برای پرتی یک دادهٔ بخصوص و نیز دیگر داده‌های پرت دلایل زیادی می‌تواند وجود داشته باشد اما معمولاً حضور آن‌ها نشان‌گر این است که؛ یا برخی از اندازه‌گیری‌ها دارای اشتباه هستند، یا داده دارای توزیع احتمالی با دنبال سنگین (نشان‌گر نکته‌ای) است.

منابع[ویرایش]

  1. «دورافتاده» [آمار] هم‌ارزِ «outlier»؛ منبع: گروه واژه‌گزینی. جواد میرشکاری، ویراستار. دفتر یازدهم. فرهنگ واژه‌های مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۷۸-۶۰۰-۶۱۴۳-۴۵-۳ (ذیل سرواژهٔ دورافتاده)
  2. Barnett, V. and Lewis, T. : 1994, Outliers in Statistical Data. John Wiley & Sons. , 3rd edition.
  3. Grubbs, F. E. : 1969, Procedures for detecting outlying observations in samples. Technometrics 11, 1–21.

Wikipedia contributors, "Outlier," Wikipedia, The Free Encyclopedia, (accessed January 9, 2013).