هم‌خطی چندگانه

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

در اقتصادسنجی همخطی چندگانه زمانی اتفاق می افتد که دو یا بیش از دو متغیر توضیح دهنده (مستقل) در یک رگرسیون چندمتغیره نسبت به یکدیگر از همبستگی بالایی برخوردار باشند . منظور از همبستگی در اینجا وجود یک ارتباط خطی بین متغیرهای مستقل است . بسته به شدت همبستگی بین متغیرهای مستقل، میزان و نوع همخطی متفاوت خواهد بود .

همخطی کمابیش در همه مدل های رگرسیون موجود است؛ آنچه که مهم است شدت همخطی بین متغیرهای مستقل است . وجود « همخطی کامل » موجب نقض فرض های کلاسیک مدل رگرسیون می شود.

انواع همخطی[ویرایش]

مشکلاتی که همخطی کامل بوجود می آورد با مشکلاتی که همخطی ناقص بوجود می آورد از دو دسته کاملا متفاوت هستند؛ بنابراین تقسیم بندی زیر صورت می گیرد :

  • همخطی کامل

اگر رگرسیون اصلی را به فرم زیر در نظر بگیریم :

 Y_{i} = \beta _0 + \beta _1 X_{1i} + \cdots + \beta _k X_{ki} + \varepsilon _{i}

که در آن i نشان دهنده تعداد مشاهدات و K نشان دهنده تعداد متغیرهای مستقل است . همخطی کامل زمانی اتفاق می افتد که یک رابطه خطی دقیق بین دو یا چند متغیر مستقل برقرار باشد . یعنی :


\lambda_0 + \lambda_1 X_{1i} + \lambda_2 X_{2i} + \cdots + \lambda_k X_{ki} = 0

در این حالت که همبستگی بین متغیرهای مسقل کامل است، ضرایب مدل قابل برآورد نخواهند بود چراکه برای برآورد ضرایب یک مدل رگرسیون چندمتغیره می بایست ماتریس  X^{T} X معکوس پذیر باشد . اما همخطی کامل حکایت از آن دارد که مرتبه ماتریس ضرایب کوچکتر از k+۱ است :

 X = \begin{bmatrix}

      1 & X_{11} & \cdots & X_{k1}  \\

      \vdots & \vdots & & \vdots \\

      1 & X_{1N} & \cdots & X_{kN}

\end{bmatrix}

که به تبع آن ماتریس  X^{T} X نیز معکوس ناپذیر خواهد شد . عملا همخطی کامل هیچگاه اتفاق نمی افتد .آنچه که مرسوم است همخطی ناقص می باشد .

  • همخطی ناقص

اگر یک رابطه خطی غیر دقیق بین دو یا چند متغیر مستقل برقرار شود با همخطی ناقص مواجه خواهیم بود :


\lambda_0 + \lambda_1 X_{1i} + \lambda_2 X_{2i} + \cdots + \lambda_k X_{ki} + v_i = 0

در عبارت فوق، وجود متغیر تصادفی Vi نشان دهنده نادقیق بودن رابطه خطی است . در حالت همخطی ناقص ماتریس  X^{T} X معکوس پذیر است اما واریانس ضرایب بزرگتر از حد معمول نشان داده خواهد شد . این مطلب باعث می شود تا برآورد ضرایب با دقت پایین تری صورت بگیرد .

تشخیص همخطی[ویرایش]

۱- ضرایب برآوردی نسبت به کم یا اضافه کردن متغیر در مدل از خود حساسیت نشان می دهند .

۲- در حالت همخطی رگرسیون به طور کلی معنادار بوده و دارای R^2 بالا می باشد اما ضرایب به تنهایی بی معنی هستند .

۳- اگر تک تک متغیرهای مستقل را روی بقیه متغیرهای توضیح دهنده رگرسیون کرده و R^2 آنها را با R^2 رگرسیون اصلی مقایسه کنیم . چنانچه R^2 های محاسبه شده بزرگتر از R^2 رگرسیون اصلی باشد در آنصورت احتمال وجود همخطی ناقص شدید است .

۴- اگر با خارج کردن یک متغیر از مدل یا اضافه کردن یک متغیر به آن ، R^2 تغییر قابل ملاحظه ای نداشته باشد، در آن صورت متغیر مذکور مستعد ایجاد همخطی است .

۵- معیار TOLERANCE و VIF :

\mathrm{tolerance} = 1-R_{j}^2,\quad \mathrm{VIF} = \frac{1}{\mathrm{tolerance}}

R_{j}^2 در این دو معیار، ضریب تعیین رگرسیون متغیر توضیح دهنده j ام روی دیگر متغیرهای توضیح دهنده است . چنانچه tolerance کوچکتر از ۰.۲ یا VIF بزرگتر از ۱۰ باشد در آن صورت همخطی محتمل است .

نتایج همخطی[ویرایش]

۱- چون در حالت همخطی اطلاعات مستقل در مورد هریک از متغیرهای مستقل وجود ندارد، لذا نمی توان اثرات جزئی متغیرهای مذکور روی متغیر وابسته را برآورد کرد .

۲- هنگامیکه همبستگی شدید بین متغیرهای مسقل وجود داشته باشد، کوواریانس و واریانس ضرایب بزرگتر برآورد خواهند شد .

۳- ضرایب برآوردی همچنان بدون تورش اند و خاصیت BLUE همچنان برقرار است؛ گرچه کمیت بدست آمده برای آنها غیرقابل اعتماد است .

۴- در حالتی که با همخطی شدید در مدل مواجهیم، پیش بینی های صورت گرفته از آن غیر قابل اعتماد خواهد بود . در این حالت پیش بینی ها براساس مدلی که دارای زیر مجموعه ای از متغیرهای مستقل مدل اصلی است، بهتر صورت می گیرد .


علل وقوع همخطی[ویرایش]

  • فرآیند نمونه گیری : نحوه نمونه گیری، اندازه گیری های نادرست و نقص در محدوده داده های مورد بررسی همگی می توانند موجب بروز همخطی شوند .
  • تصریح مدل آماری : شاید همخطی ناشی از وجود روند زمانی در مدل باشد . حال با در نظر گرفتن یک متغیر روند می توان اثر روند زمانی را خنثی کرد .
  • اضافه گویی ( overspesification ): چنانچه بیش از حد متغیر توضیح دهنده در مدل در نظر گرفته شود، امکان تداخل بین اطلاعات خالصی که هر متغیر به طور مستقل ارائه می کند بیشتر شده و در نتیجه امکان بروز همخطی بیشتر می شود .
  • تصریح غلط مدل نظری : هنگامیکه عوامل مؤثر در مدل درست تشخیص داده نشوند؛ ممکن است دو متغیر در مدل در نظر گرفته باشیم که هردو در واقع به یک متغیر سومی وابسته اند . در حالیکه اساسا باید متغیر سوم که منشأ تغییرات است به جای دو متغیر مذکور در مدل لحاظ شود .

رفع همخطی[ویرایش]

  • افزایش در حجم نمونه
  • حذف متغیرهای مشکوک به ایجاد همخطی از مدل
  • تغییر مقیاس یا تغییر فرم مدل؛ برای مثال لگاریتمی کردن مدل
  • قرار دادن یکسری قیود خاص در مدل؛ برای مثال در مورد تابع تولید، همگنی از درجه ۱ لحاظ شود .
  • در نهایت عبور از آن و بی توجهی به آن !

منابع[ویرایش]

  • ویکی‌پدیای انگلیسی
  • Davidson R.، MacKinnon J.G. Econometric theory and methods
  • Greene، W. Econometric Analysis. ۴th ed.، ۲۰۰۰. New York: Prentice-Hall