مدل خطی تعمیم‌یافته

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

مدل خطی تعمیم‌یافته (به انگلیسی: Generalized Linear Model) تعمیم رگرسیون خطی است برای داده‌هایی که توزیع نرمال ندارند. به عنوان مثال، پیش‌بینی تعداد خرابی، که کمیتی گسسته‌است، یا زمان انتظار، که کمیتی مثبت‌است، را می‌توان به کمک مدل خطی تعمیم‌یافته انجام داد. این مدل از سه جزء تشکیل‌یافته‌است:[۱]

الف) توزیعی برای متغیر پاسخ \mathbf{y}، که معمولاً از خانواده نمایی با بیش‌پراکندگی d(\tau) انتخاب می‌شود:

 f_Y(\mathbf{y} | \boldsymbol\theta, \tau) = h(\mathbf{y},\tau) \exp{\left(\frac{\mathbf{b}(\boldsymbol\theta)^{\rm T}\mathbf{T}(y) - A(\boldsymbol\theta)}
                                                {d(\tau)} \right)}. \,\!

بیش‌پراکندگی برای مدل‌سازی واریانس‌های بالا و پایین به‌کار می‌رود.

ب) پیش‌بینی خطی براساس متغیر کنترل \mathbf{X}:

 \boldsymbol{\eta} = \mathbf{X}\boldsymbol{\beta}. \,

ج) تابع پیوند g که یک تابع اکیداً یکنواست و دو مولفه بالا را به هم ارتباط می‌دهد:

 \boldsymbol{\eta} = g(\mathbb{E}[\mathbf{Y}]) = \mathbf{X}\boldsymbol{\beta}. \,

مثال‌هایی از مدل خطی تعمیم‌یافته، رگرسیون لجستیک، دوجمله‌ای و پواسون است.

جستارهای وابسته[ویرایش]

منابع[ویرایش]

  1. Dobson, Annette J. and Adrian Barnett. An Introduction to Generalized Linear Models. Chapman & Hall, 2008. 43-54. ISBN ‎978-1584889502.