روش تعمیم یافته کمترین مربعات

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

در صورتی که پارامترهای یک مدل رگرسیونی با استفاده از روش کمترین مربعات به صورت کارا تخمین زده شده باشند، جملات خطا به هم وابسته نخواهند بود و واریانس یکسانی خواهند داشت. این فروض برای اثبات قضیه گوس-مارکف و همچنین در مدل‌های رگرسیون غیر خطی برای اثبات کارایی مجانبی آنها الزامی است. علاوه بر این در چنین حالتی ماتریس واریانس کوواریانس تخمین زده شده توسط روش کمترین مربعات معمولی دیگر معتبر نخواهد بود. بنا بر این ما نیاز به روشی داریم که بتواند در شرایط وجود واریانس ناهمسانی یا وابستگی پیا پی جملات خطا، مدل رگرسیونی را تخمین بزند.

مقدمه[ویرایش]

مدل رگرسیونی زیر را در نظر بگیرید.

y=X\beta+u, E(uu^T)=\Omega

با این شرط که امگا یا همان ماتریس کوواریانس جملات خطا یک ماتریس مثبت معین است. همان طور که می‌دانیم در صورتی که باشد. معادلهٔ (۱) یک مدل رگرسیون خطی ساده با جملات خطای دارای واریانس یکسان و هم چنین غیر وابسته‌است. در صورتی که Ω قطری با مقادیر متفاوت روی قطر اصلی باشد، جملات خطا به هم وابسته نیستند اما شرط واریانس هم سانی بر قرار نخواهد بود. و در صورتی که ماتریسΩقطری نباشد. عناصر خطا به هم وابسته خواهند بود. در اقتصاد سنجی قطری نبودن ماتریس عناصر خطا غالباً در هنگام کار بر روی داده‌های سری زمانی به وجود می‌آید. در چنین حالتی عناصر خطا در داده‌هایی که به لحاظ زمانی به هم نزدیک ترند وابستگی بالاتری دارند. در ادامه با معرفی مدل تعمیم یافتهٔ کمترین مربعات نشان می‌دهیم که چگونه می‌توان یک برآورد گر کارا برای تخمین بردار β در معادلهٔ (۱) به دست آورد که شرایط قضیهٔ گاووس_مارکوف را ارضا نماید.

برآوردگر تعمیم یافتهٔ کمترین مربعات[ویرایش]

برای به دست آوردن برآوردگر کارا برای بردار پارامترهای βدر یک مدل رگرسیون خطی، از مدل تبدیل یافته‌ای استفاده می‌شود که شرایط گاووس _مارکوف را ارضا می‌نماید.

روش معادلهٔ تبدیل یافته[ویرایش]

تخمین پارامترهای مدل تبدیل یافته با استفاده از روش کمترین مربعات معمولی منجر به، به دست آوردن کاراترین تخمین زن خواهد شد. این تبدیل با استفاده از ماتریس Ψ که غالباً یک ماتریس بالا مثلثی است و در نامساوی زیر صدق می‌کند، انجام می‌شود.

\Omega^{-1}=\Psi\Psi^T

             \Psi_{n*n}
می‌توان اثبات کرد با استفاده از همواره چنین ماتریسی پیدا خواهد شد. بنا بر این داریم:

(۲) \Omega=\sigma^2I

از آن جایی که ماتریس واریانس کوواریانس Ω وارون پذیر است. ماتریس Ψ نیز وارون پذیر خواهد بود و بنا براین معادلهٔ رگرسیون تبدیل شده با معادلهٔ رگرسیون اصلی معادل خواهد بود. تخمین زن روش کمترین مربعات عادی برای بردار پارامترهای β در معادلهٔ (۲) چنین خواهد بود.

(۳) \hat\beta=(X^T\Psi\Psi^TX)^{-1}X^T\Psi\Psi^Ty=(X^T\Omega^{-1}X)^{-1} X^T\Omega^{-1}y

این تخمین زن بر آورد گر کمترین مربعات عمومی نام دارد و به سادگی می‌توان نشان داد ماتریس کوواریانس خطاهای تبدیل یافته Ψ^T u یک ماتریس همانی است.

E(\Psi^Tuu^T\Psi)=\Psi^TE(uu^T)\Psi=\Psi^T(\Psi\Psi^T)^{-1}\Psi=I

از آنجا که β ̂ به دست آمده همان برآورد با استفاده از روش کمترین مربعات عادی برای معادلهٔ تبدیل یافته‌است. ماتریس کوواریانس آن به راحتی با جایگزین نمودن Ψ^T X به جای X به صورت استاندارد به دست می‌آید.

(۴) Var(\hat\beta)=(X^T\Psi\Psi^TX)^{-1}=(X^T\Omega^{-1}X)^{-1}

برای آنکه معادلهٔ (۳) بر قرار باشد. ارضای شرایط قضیهٔ گاوس _مارکوف بر الزامی است. به عبارتی Ω باید ماتریس کوواریانس شرطی خطا نسبت به متغیر توضیح دهنده باشد. بنا بر این Ω می‌تواند به X یا هر متغیر برون زا ی دیگری وابسته باشد.

تابع معیار حداقل مربعات تعمیم یافته[ویرایش]

راه دیگر به دست آوردن برآوردگر تعمیم یافتهٔ کمترین مربعات مینیمم کردن تابع معیار کمترین مربعات عمومی است.

(۵) (y-X\beta)^T\Omega^-1(y-X\beta)

که در حقیقت چیزی نیست جز جمع مربعات باقی‌مانده‌های مدل رگرسیونی تبدیل یافته. می توان این تابع معیار را تعمیم یافتهٔ تابع مجموع مربعات باقی‌مانده هادر نظر گرفت که درآن مربعات و ضرب‌های دو به دو باقی‌مانده‌ها، با توجه به معکوس ماتریس Ω وزن دهی شده‌اند. اثر این وزن دهی زمانی روشن می‌شود که ماتریس Ω یک ماتریس قطری باشد. در چنین حالتی هر مشاهده بر واریانس خطای خود تقسیم خواهد شد.

کارایی تخمین زن عمومی کمترین مربعات[ویرایش]

علاوه بر خصوصیات ذکر شده، بر آوردگر به دست آمده از معادلهٔ (۳) حلی برای مجموعهٔ گشتاورهای شرطی زیر نیز می‌باشد.

(۶) X^T\Omega^{-1}(y-X\beta)=0

این مجموعهٔ شرطی گشتاورها معادل شرایط مرتبه اول برای مینیمم کردن تابع معیار تعمیم یافتهٔ کمترین مربعات می‌باشد. از آنجا که براوردگر عمومی کمترین مربعات یک روش برای برآورد گشتاورهاست. به مقایسهٔ آن با سایر برآورد گرهای گشتاورها می‌پردازیم. یک بر آوردگر تعمیم یافتهٔ گشتاوری برای یک مدل رگرسیون خطی با استفاده از یک ماتریس n*kاز متغیرهای برون زای W که بعد. ست. β به صورت زیر به دست می‌آید.

(۷) W^T(y-X\beta)=0

از آنجا که در معادلهٔ اخیر k معادله و k مجهول وجود دارد، برای به دست آوردن برآورد گشتاوری می‌توان آن را حل نمود.

(۸) \hat\beta_w=\beta_0+(W^TX)^{-1}W^Tu

با مقایسهٔ معادلات (۳)و (۸) و جایگذاری W با Ω^(-۱) X، می‌توان مشاهده نمود، برآورد گر تعمیم یافتهٔ کمترین مربعات یک حالت خاص از برآورد گر روش گشتاورهاست. تحت فرضیات قطعیت، تخمین زن روش گشتاورها یک تخمین زن نا اریب برای مدل خواهد بود. در صورتی که فرض کنیم فرایند تولید داده یک حالت خاص از مدل با بردار پارامترهای β_۰و ماتریس کوواریانس معلوم Ωاست. برون زا بودن متغیرهای X و W ایجاب می‌کند کهE(u_t│w_ X)=0 باشد. با این فرض نسبتاً قوی که منجر به نا اریبی β ̂_W می‌شود از تحلیل‌های مجانبی و بررسی سازگاری اجتناب می‌کنیم. گرچه برای سازگار بودن برآوردگر β ̂_Wتنها فرض مورد نیاز، فرض ضعیف E(u_t│w_t)=0 با جایگزاری Xβ_۰در معادلهٔ (۸) می‌بینیم:

(۹) Var(\hat\beta_w)=E\big ((\hat\beta_w-\beta_0) (\hat\beta_w-\beta_0)^T\big)=(W^TX)^{-1}W^T\Omega(X^TW)

همان طور که انتظار داشتیم، معادلهٔ (۹) اصطلاحاً ساندویچ شدهٔ ماتریس کوواریانس است. ه نگامی که X=W باشد ما برآوردگر روش کمترین مربعات تعمیم یافته را خواهیم داشت و واریانس β ̂_W به صورت معادلهٔ استاندارد در می‌آید. می‌توان کارایی بر آوردگر تعمیم یافتهٔ روش کمترین مربعات را با نشان دادن این که تفاضل Var(β ̂_W)در معادلهٔ (۹)و Var(β ̂)در معادلهٔ (۴)یک ماتریس مثبت نیمه معین است اثبات نمود.

محاسبهٔ تخمین عمومی کمترین مربعات[ویرایش]

در نگاه اول، رابطهٔ (۳) برای برآورد گر عمومی کمترین مربعات بسیار ساده به نظر می‌آید. ظاهراً برای به دست آوردن β ̂، در صورت معلوم بودن Ω تنها کافی است Ω^(-۱) را محاسبه نموده و ماتریس X^T Ω^(-1) X و معکوس آن را تشکیل دهیم از ضرب آن‌ها در بردار X^T Ω^(-1) y، β ̂ به دست خواهد آمد. با این وجود استفاده ار روش عمومی کمترین مربعات به همین سادگی که به نظر می‌رسد نیست. فرایند بیان شده تنها در زمانی که تعداد مشاهداتمان کم و ناچیز است، قابل استفاده خواهد بود و در نمونه‌های بزرگ عملاً ناممکن است. به عنوان مثال در صورتی که حجم نمونهٔ ما در ۱۰۰۰۰ باشد تنها برای ذخیرهٔ ΩوΩ^(-۱) به حدود ۱۶۰۰ مگابایت حافظه نیاز داریم. حتا با داشتن حافظهٔ کافی، محاسبهٔ برآوردگر β ̂ با استفاده از این روش مقدماتی به لحاظ حجم محاسبات و زمان به شدت هزینه بر خواهد بود. فرایند عملی تخمین کمترین مربعات نیازمند این است که اطلاعات نسبتاً زیادی در مورد ساختار ماتریس Ω و معکوس آن داشته باشیم. در صورتی که ماتریس Ψ به ما اجازه دهد تا برای هر بردار X، Ψ^T X را بدون نیاز به ذخیرهٔ خود Ψ در حافظه حاسبه نماییم، می‌تون به سادگی مدل تبدیل یافته را فرموله نمود و ازیک تخمین عادی کمترین مربعات بری محاسبهٔ پارمترهای آن استفاده کرد.[۱][۲]

منابع[ویرایش]

پانویس[ویرایش]

  1. Davidson R. , MacKinnon J.G. Econometric theory and methods (no front)(draft, OUP, 2004
  2. A_Guide_to_Modern_Econometrics,__Verbeek_(2004)