نرمال‌سازی (آمار)

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

نرمال‌سازی (به انگلیسی: Normalization) در آمار معانی متفاوتی دارد که ساده‌ترین کاربرد آن نرمال‌سازی داده‌ها یا نرمال‌سازی متغیرها است و عبارت است از روشی که داده‌ها را در زمانی که در یک دامنه نیستند را در دامنه مشابه قرار می‌دهد. به بیان دیگر ممکن است یک داده‌کاو با موقعیت‌هایی مواجه گردد که ویژگیهای در داده شامل مقادیری باشند که در محدوده یا دامنه متفاوتی قرار داشته باشند. این ویژگی‌های با مقادیر بزرگ ممکن است اثر بسیار زیادتری در تابع هزینه نسبت به ویژگی‌های با مقادیر کم داشته باشند. این مشکل با نرمالیزه نمودن ویژگی‌ها طوری که مقادیرشان در دامنه‌های مشابه قرار گیرند برطرف خواهد شد.[۱]

نرمال‌سازی در ساخت مدل[ویرایش]

در ساخت مدل داده‌ها (به انگلیسی: meta model) از روی داده‌ها پیش از شروع آموزش مدل‌ها، داده‌ها را به بزرگترین مقدار متناظرشان تقسیم می‌کنند تا به مقدارهای بین صفر و یک مقیاس (نرمالیزه) شوند این کار باعث می‌شود که اثر مقیاس واقعی (به انگلیسی: Absolute Scale) کمینه شود و همه ورودی‌ها تقریباً در یک دامنه باشند.[۲]

مثال[ویرایش]

در زیر چند روش نرمال‌سازی داده‌ها ارائه می‌گردد.

نام فرمول استفاده
Standard score \frac{X - \mu}{\sigma} نرمال‌سازی خطاها در زمانی که پارامترهای جمعیت شناخته‌شده باشند.
Student's t-statistic \frac{X - \overline{X}}{s} نرمال‌سازی residuals زماین که پارامترهای جمعیت ناشناخته باشند (تخمین)
Studentized residual \frac{\hat \epsilon_i}{\hat \sigma_i} = \frac{X_i - \hat \mu_i}{\hat \sigma_i} نرمال‌سازی در زمانی که متغییرها تخمین زده می‌شوند به خصوص در زمان تحلیل رگرسیون.
Standardized moment \frac{\mu_k}{\sigma^k} نرمال‌سازی لحظه‌ای به کمک انحراف معیار \sigma به عنوان ابزار اندازه‌گیری مقیاس
ضریب تغییرات \frac{\sigma}{\mu} نرمال‌سازی پراکندگی به کمک استفاده از میانگین \mu به عنوان ابزار اندازه‌گیری مقیاس توزیع نمایی و توزیع پواسون.

منابع[ویرایش]

  1. پیش‌پردازش داده
  2. پیش‌بنی ظرفیت باربری شمع‌های تحت اثر بار محوری به کمک ماشین بردار پشتیبان، علیرضا کردجزی، فریدون پویانژاد