لسو: تفاوت میان نسخه‌ها

از ویکی‌پدیا، دانشنامهٔ آزاد
محتوای حذف‌شده محتوای افزوده‌شده
صفحه جدید برای لسو
(بدون تفاوت)

نسخهٔ ‏۱۷ دسامبر ۲۰۱۹، ساعت ۲۲:۴۲

لَسو[الف] یکی از روشهای تنظیم مدل برای جلوگیری از بیش‌بردازش در رگرسیون است که باعث می‌شود بسیاری از پارامترهای مدل نهائی صفر شوند و مدل به اصلاح خلوت[ب] شود.[۱] در روش لَسو نُرمِ به تابع هزینه اضافه می‌شود.[۱]

تعریف ریاضی

اگر در مسئله رگرسیون داده را با نمایش دهیم، هدف بدست آوردن از ترکیبی خطی از است یعنی . در اینجا و هر دو بردار و دارای بعد یکسان هستند. رگرسیون خطی معمولی به صورت پایین در صدد پیدا کردن و بهینه است:

حال اگر داده‌ها را در ماتریس و بردار بگنجانیم مسئله به شکل پایین تغییر شکل می‌دهد‌:

پیچیدگی مدل‌های پارامتری با تعداد پارامترهای مدل و مقادیر آن‌ها سنجیده می‌شود. هرچه این پیچیدگی بیشتر باشد خطر بیش‌برازش[پ] برای مدل بیشتر است.[۲] پدیدهٔ بیش‌برازش زمانی رخ می‌دهد که مدل به‌جای یادگیری الگوهای موجود در داده، خود داده را به خاطر می‌سپارد. در این حالت، مدل برای آن مجموعه دادهٔ به‌خصوص خوب عمل می‌کند اما برای داده‌های مشابه دیگر عملکرد خوبی ندارد، که یعنی عمل یادگیری به خوبی انجام نشده‌است. برای جلوگیری از بیش‌برازش در مدل‌های خطی مانند رگرسیون خطی یا رگرسیون لجستیک، یک «جریمه»[ت] به تابع هزینه اضافه می‌شود تا از افزایش زیاد پارامترها جلوگیری شود. به این کار تنظیم مدل گفته می‌شود.[۳] در روش لَسو ضریبی از نُرمِ به تابع هزینه اضافه می‌شود:

این کار باعث میشود بسیاری از پارامترهای مدل نهائی صفر شوند و مدل به اصلاح خلوت شود.[۱] این کار معادل ایجاد محدودیتی بر روی نُرمِ پارامتر مدل است به این معنی که مسئله بهینه سازی به شکل پایین تغییر شکل می‌دهد:

یادداشت‌ها

  1. LASSO مخفف least absolute shrinkage and selection operator
  2. sparse
  3. overfitting
  4. penalty

منابع

  1. ۱٫۰ ۱٫۱ ۱٫۲ Natarajan, B. K. (1995). "Sparse Approximate Solutions to Linear Systems". SIAM Journal on Computing (به انگلیسی). 24 (2): 227–234. doi:10.1137/s0097539792240406. ISSN 0097-5397. Archived from the original on 24 May 2019.
  2. Bühlmann, Peter; van de Geer, Sara (2011). "Statistics for High-Dimensional Data". Springer Series in Statistics (به انگلیسی). doi:10.1007/978-3-642-20192-9. ISSN 0172-7397. Archived from the original on 21 February 2019. Retrieved 5 October 2018.
  3. Bühlmann, Peter; van de Geer, Sara (2011). Theory for ℓ1/ℓ2-penalty procedures (به انگلیسی). Berlin, Heidelberg: Springer Berlin Heidelberg. pp. 249–291. doi:10.1007/978-3-642-20192-9_8. Archived from the original on 5 October 2018.