برآورد چگالی

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به ناوبری پرش به جستجو
نمایش برآورد تابع چگالی احتمال به شیوه‌ای ناپارامتری توسط هموارکردن به کمک هسته‌ها: توزیع حقیقی مخلوط دو توزیع نرمال است به مرکزیت ۰ و ۳ که با نمودار آبی‌رنگ نشان داده‌شده‌است. در هر فریم تصویر، ۱۰۰ نمونه از این توزیع تولید شده‌اند که با رنگ قرمز نشان داده‌شده‌اند. به مرکزیت هر نمونه، یک هسته گاوسی به رنگ خاکستری ترسیم شده‌است. میانگین این هسته‌ها تخمین تابع چگالی را نشان می‌دهد که با نمودار سیاه نشان‌داده شده‌است. برای نمایش بهتر، هسته‌های گاوسی حول هر نمونه کوچک‌تر از اندازه واقعی نشان‌داده‌شده‌اند.[۱]

در آمار و احتمال، برآورد چگالی (به انگلیسی: Density estimation) به فرایند تخمین تابع چگالی احتمال یک متغیر تصادفی با استفاده از نمونه‌های مشاهده‌شده از آن متغیر گفته‌می‌شود. معمولاً فرض می‌شود نمونه‌های مشاهده شده به طور تصادفی و مستقل براساس تابع توزیع احتمال، توزیع شده‌اند.

برای برآورد چگالی، دو راه وجود دارد: روش پارامتری که در آن شکل تابع چگالی مشخص است و فقط کافیست پارامترهای تابع تخمین‌زده شوند (مثلاً به کمک درست‌نمایی بیشینه)، یا روش‌های ناپارامتری مانند هموارکردن به کمک هسته‌ها (به انگلیسی: Kernel Smoothing). از جمله استفاده‌های این روش برآورد چگالی بهبود عملکرد الگوریتم بیز ساده است. روش هسته‌ها را می‌توان با دسته‌بندی‌کننده بیز ساده ترکیب کرد و در برآورد توابع حاشیه‌ای متغیرها استفاده کرد.[۲] این روش می‌تواند دقت الگوریتم را به حد قابل قبولی افزایش دهد.[۳]

منابع[ویرایش]

  1. Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome (2009). The Elements of Statistical Learning. Springer. p. ۲۰۸-۲۰۹.
  2. «Piryonesi, S. M. (2019). The Application of Data Analytics to Asset Management: Deterioration and Climate Change Adaptation in Ontario Roads (Doctoral dissertation)».
  3. Piryonesi, S. Madeh; El-Diraby, Tamer E. (2020-06). "Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems". Journal of Transportation Engineering, Part B: Pavements. 146 (2): 04020022. doi:10.1061/jpeodx.0000175. ISSN 2573-5438. Check date values in: |date= (help)