بیش‌برازش

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

بیش‌برازش (به انگلیسی: Overfitting)[۱] به پدیدهٔ نامطلوبی در آمار گفته می‌شود که در آن درجه آزادی مدل بسیار بیشتر از درجه آزادی واقعی انتخاب شده و درنتیجه اگرچه مدل روی داده استفاده شده برای یادگیری بسیار خوب نتیجه می‌دهد، اما بر روی داده جدید دارای خطای زیاد است. انتخاب درجه آزادی مناسب به کمک وارسی اعتبار (Cross-validation) و تنظیم‌کردن (Regularization) از راه‌های مقابله با این پدیده‌است.[۲]

جستارهای وابسته[ویرایش]

منابع[ویرایش]

  1. معادل فارسی برگرفته از «استفاده از رگرسیون منطقی برای شناسایی اثرات متقابل برخی از پلی‌مورفیسم‌های ژنی و سایر عوامل خطر بر سطح پایین HDL: مطالعهٔ قند و لیپید تهران». غدد درون‌ریز و متابولیسم ایران (پژوهشکده غدد درون‌ریز و متابولیسم) ۱۴، ش. ۴ (۲۰۱۲): ۳۵۲-۳۵۹. 
  2. Hastie, Trevor, Robert Tibshirani and Jerome Friedman. The Elements of Statistical Learning. Springer, 2009. 219.