اریب متغیرهای حذف‌شده

از ویکی‌پدیا، دانشنامهٔ آزاد
(تغییرمسیر از اریب متغیرهای حذف شده)
پرش به: ناوبری، جستجو

تعریف اریب متغیرهای حذف شده(OVB)[ویرایش]

در آمار اریب متغیرهای حذف شده اریبی است که در زمان نادرست بودن فروض مبتنی بر خصوصیات و ویژگی‌ها، برای تخمین پارامترها در آنالیزهای رگرسیونی اتفاق می‌افتد. در این حالت یک متغیر مستقل که باید در مدل وجود داشته باشد حذف می‌شود.

خطای u بخاطر عامل موثر بر روی Y که در تابع رگرسیون در نظر گرفته نشده به وجود می‌آید، بنابراین همواره متغیرهای حذف شده وجود دارند. بعضی اوقات این حذف متغیرها در تخمین زن‌های OLS، اریب بوجود می‌آورند.

اریب متغیرهای حذف شده در رگرسیون خطی[ویرایش]

دو خصوصیت در زمان بروز OVB در رگرسیون خطی باید وجود داشته باشد:

۱. متغیر حذف شده باید عامل تعیین کنندهٔ متغیر وابسته باشد(این زمانی اتفاق می‌افتد که ضریب رگرسیونی مخالف صفر شود.)

۲. متغیر حذف شده باید با یک یا بیش از یک متغیر مستقل همبستگی داشته باشد.

اریب ناشی از متغیرهای حذف شده نوعی از اریب حداقل مربعات است. اگرچه یک معادلهٔ پیش گویانه (معادله‌ای که بدون یک یا چند متغیر مربوط و مناسب است) لزوماً اریب حداقل مربعات شدید ندارد ولی اکثراً این اریب افزایش می‌یابد.

در یک رگرسیون خطی، حداقل مربعات اریب متغیرهای حذف شده می‌تواند روی شیب و (یا) عرض از مبدا ء تخمین‌ها تاثیرگذار باشد.

متغیرهای حذف شده همچنین می‌توانند باعث بی اثر شدن استفاده از تکنیک رگرسیون خطی چندگانه شوند. این وقتی اتفاق می‌افتد که موضوع رگرسیون خطی مضاعف شامل A باشد که C را پیش بینی می‌کند ولی یک متغیر دیگر مثل B هم وجود داشته باشدکه موضوع ما شامل آن نیست ولی B هم C را پیش بینی کند. همچنین اگر این متغیر حذف شده وجود می‌داشت مشخص می‌شد که A و B با هم پیش بینی کنندهٔ قوی تری برای C نسبت به حالتی است که یکی از آنها وجود داشته باشد.

مثال‌هایی از نمره آزمون:[ویرایش]

۱. توانایی زبان انگلیسی (چنانچه دانش آموزان از آن به عنوان زبان دوم استفاده کنند) بطور حق بجانب روی نمره آزمون استاندارد شده تاثیر می‌گذارد.Z عامل تعیین کنندهٔ Y است.

۲. اجتماع مهاجر گرایش به فراوانی کمتری دارند بنابراین هزینه‌های مدرسهٔ کمتر و STR بیشتری دارند: Z با X همبستگی دارد. بنابراین برآورد β اریب است.

مثالی با در نظر گرفتن مدل خطی:[ویرایش]

6.JPG

که در آن:

xi یک بردار ردیفی ۱×p است که بخشی از داده‌های مشاهده شده‌است.

β یکبردار ستونی p×۱ است از پارامترهای مشاهده نشدنی که می‌خواهند تخمین زده شوند.

zi یک اسکالر است و بخشی از دادهٔ مشاهده شده.

δ اسکالر و یک پارامتر مشاهده نشدنی است که قرار است تخمین زده شود.

ترم خطای ui متغیر تصادفی مشاهده نشدنی است که دارای میانگین صفر می‌باشد (مشروط برxi و zi)

متغیر وابسته یyi بخشی از دادهی مشاهده شدنی است.

داریم:

و

3.JPG

سپس از طریق محاسبات حداقل مربعات معمولی برآورد بردار پارامتر تخمین زده شده که فقط روی مقادیر مشاهده شدهٔ x اریب است و مقادیر مشاهده شدهٔ z درآن حذف شده بصورت زیر بدست می‌آید:

4.JPG

با در نظر گرفتن مدل خطی فرض شده بجای Y عبارت معادل را جایگزین می‌کنیم:

5.JPG

با گرفتن امید ریاضی از دو طرف معادله ترم آخر برابر صفر شده که این با توجه به صفر بودن امید ریاضی U حاصل می‌شود.

در نتیجه با ساده سازی داریم:

7.JPG

در این مدل جملهٔ دوم ترم اریب متغیر حذف شده‌است. دقت شود که این اریب برابر با نسبت وزنی از zi است که توسط xi توضیح داده می‌شود.

اریب متغیرهای حذف شده یک مشکل جدی است وثابت می‌شود ضرایب تخمین زده شده از مدل‌های مشخص دارای کمترین واریانس نااریب هستند. در حقیقت ما هیچوقت با یک مدل کاملاً تعیین شده و دقیق و متغیر حذف شدهٔ منفرد یا مجموعه‌ای از متغیرهای حذف شدهٔ منفرد روبرو نیستیم، بیشتر با مدلهایی روبرو هستیم که دربهترین حالت تقریب‌های مرتبه اول هستند و تصمیم‌هایی هستند که در خصوص زیر مجموعه‌ای از متغیرهای حذف شده‌اند.

تاثیرات عواملی از جمله یک زیر مجموعه در معادلهٔ رگرسیون وابسته به تاثیرات متغیرهای برون زا و درون زا است و به همبستگی بین آنها بستگی دارد، همچنین وابسته به واریانس تمامی متغیر هاست.

با استفاده از متغیرهای کنترلی اضافه در تشخیص‌های خود، می‌توانیم به راحتی اریب ایجاد شده را شدیدتر کنیم. در نبود چنین علم بی پایانی به دیدگاهی نیاز داریم که ما را به یک کنترل تجربی متقاعد کننده برساند که در آن تاثیرات عوامل تضعیف کننده کمتر باشد. جایگزین کردن طرحی برای کنترل، این کار را انجام می‌دهد. محدود کردن و متمرکز شدن و آزمون‌های کنترلی تئوریهای گسترده تا زمانی که قطعی نشده‌اند مشاهده‌ای را فراهم می‌کنند که متقاعدکننده تر ازمعادله رگرسیونی است که با نصف دوجین متغیر کنترلی، وزنی کمتر دارد ومشاهدهٔ متقاعد کننده اساس و پایهٔ علم است.

منابع[ویرایش]

  • ویکی‌پدیای انگلیسی
  • The phantom Menace:Omitted Variable Bias in Econometric Research
  • KEVIN A. CLARKE,conflict management and peace science,۲۰۰۵
  • Investigating Omitted Variable Bias in regression parameter estimation By (David N.Sessions,Lonnie K.Stevans),۲۰۰۴