نیکویی برازش

از ویکی‌پدیا، دانشنامهٔ آزاد

نیکویی برازش (به انگلیسی: Goodness of fit) یا خوش سازگاری برای یک مدل آماری بیان کننده آن است که آن «مدل آماری» به چه اندازه با یک مجموعه از «مشاهدات» متناسب است. اندازه نیکویی برازش معمولاً تفاوت بین مقادیر مشاهده شده و مقادیر مورد انتظار در مدل بررسی شونده را خلاصه سازی می‌کند. از این اندازه می‌توان در آزمون فرض آماری استفاده کرد، مثلاً برای آزمون بهنجاری باقیمانده، یا برای آزمون آنکه بررسی شود که آیا دو نمونه از یک توزیع یکسان گرفته شده‌اند یا نه، (آزمون کولموگروف–اسمیرنف را ببینید)، یا اینکه آیا فرکانس‌های حاصل شده از توزیع تعیین شده پیروی می‌کنند (آزمون کای مربع پیرسون را ببینید). در تحلیل واریانس، یکی از مولفه‌هایی که واریانس به آن بخش‌بندی می‌شود، می‌تواند فقدان تناسب مجموع مربعات باشد.

پس از تخمین یک مدل خطی خاص، سؤالی که مطرح می‌شود این است که: خط وایازش تخمین زده شده چه میزان با مشاهدات واقعی تطابق دارد؟ یک معیار سنجش مناسب برای نیکویی برازش (یا برازندگی)، نسبت واریانس نمونه ای y است که بوسیلهٔ مدل توضیح داده می‌شود. این متغیر نامیده شده و به صورت زیر تعریف می‌شود: رابطه (۱–۱) که در این رابطه است و بیانگر میانگین نمونه ای می‌باشد. توجه داشته باشید که مساوی میانگین نمونه ای است. از شرط مرتبه اول داریم:در نتیجه می‌توانیم را به صورت زیر تعریف نماییم : که در آن است. در بسیاری از مدل‌های مشابه که شامل عرض از مبدأ هستند رابطه زیر برقرار است: رابطه (2-1) که است. با استفاده از این رابطه می‌توان را به صورت زیر بازنویسی کرد: رابطه(۳–۱) فوق نشان می‌دهد که واریانس نمونه ای را می‌توان به صورت حاصل جمع واریانس‌های نمونه ای دو جزء متعامد تجزیه نمود: تخمین زن و )residual). بنابراین بیان می‌کند که چه نسبتی از تغییرات نمونه در توسط مدل توضیح داده می‌شود. اگر مدل مورد مطالعه شامل عرض از مبدأ باشد دو عبارت فوق برای تعیین معادلند. علاوه بر این در این مورد می‌توان نشان داد که مقدار همواره بین صفر و یک قرار دارد. تن‌ها اگر تمام باشند مساوی یک خواهد بود و مقدار صفر نشان می‌دهد که مدل به جزمیانگین نمونه ای هیچ چیز دیگری را توضیح نمی‌دهد. در یک مورد استثنایی که مدل شامل عرض از مبدأ نیست دو عبارت مطرح شده برای معادل نیستند و این بدین دلیل است که رابطهٔ (۲–۱)نقض می‌شود زیرا دیگر معادل صفر نمی‌باشد. در این وضعیت ممکن است مقدار محاسبه شده از رابطه ی(۳–۱) منفی گردد. یک روش اندازه‌گیری جایگزین که به‌طور معمول به وسیلهٔ نرم‌افزارها مورد استفاده قرار می‌گیرد اگر عرض از مبدأ وجود نداشته باشد است که طبق رابطهٔ زیر تعریف می‌گردد و مقدار آن بزرگتر از استاندارد است: رابطه (۴–۱) از آنجا که تغییرات توضیح داده شده در را توضیح می‌دهد نسبت به تغییر این متغیر حساس است؛ بنابراین در مدلهایی که مصرف را توضیح می‌دهند، تغییرات در مصرف یا رشد مصرف الزاماً توسط مقادیر شان قابل مقایسه با هم نمی‌باشند. به عنوان مثال تغییر در مصرف کل برای یک کشور مورد نظر معمولاً آسان‌تر از توضیح تغییرات cross-sectional مصرف در سطح خانوار هاست. در نتیجه معیار قطعی برای اینکه یک مقدار کم یا زیاد تلقی شود وجود نداردمثلا مقدار ۰٫۲ ممکن است در کارکرد خاص بزرگ و در سایر موارد کم تلقی شود و حتی مقدار ۰٫۹۵ ممکن است در یک مورد خاص کم به‌شمار آید گاهی اوقات به عنوان معیاری برای کیفیت مدل آماری تفسیر می‌شود که در این حالت چیزی به جز کیفیت تقریب خطی را اندازه‌گیری نمی‌نماید هنگامی که رویکردOLS برای بدست آوردن بهترین تقریب خطی توسعه داده شود، صرف نظر از درستی مدل و اعتبار فرضیاتش، تخمین مدل خطی به وسیلهٔ OLS بهترین ممکن را بدست می‌دهد. هر روش تخمین دیگر اگرچه دارای تخمین زن با مشخصات آماری بهتر تحت فرضیاتش باشد، منجر به کمتر ی خواهد شد. هنگامی که مدل توسط OLS تخمین زده نشود دو رابطهٔ (۱–۱) و (۲–۱)معادل نیستند و روشن نیست چگونه باید تعریف شود. برای استفاده‌های بعدی ما تعریف جایگزینی برای ارائه می‌نماییم که برای OLS معادل روابط(۱–۱) و (۲–۱)و برای هر تخمین زن دیگری بین صفر و یک خواهد بود. رابطه(۵–۱) که بیانگر مجذور ضریب همبستگی بین مقدار واقعی و fitted value هاست. در نتیجه مهم‌ترین جنبه از نتایج تخمین ما به‌شمار نمی‌آید. مشکل دیگر این است که مقدار ان با افزایش تعداد متغیرهای توضیح دهنده کاهش نمی‌یابد. یک راه معمول برای حل این مشکل تصحیح واریانس تخمین زده شده برای درجات آزادی است. این امر یا را نتیجه می‌دهد که طبق رابطهٔ زیر تعریف می‌شود: رابطه(۶–۱) این روش محاسبهٔ نیکویی برازش مقداری جریمه برای افزایش تعداد متغیرهای توضیح دهنده در مدل در نظر می‌گیرد و بنابراین هنگامی که متغیرهای توضیح دهنده به مدل اضافه می‌شوند افزایش نخواهند یافت. در حقیقت آن ممکن است با اضافه شدن یک متغیر به جمع متغیرهای توضیح دهنده کاهش یابد. توجه کنید که در بسیاری از موارد ممکن است مقداری منفی باشد و همچنین مقدار آن کوچکتر از خواهد بود مگر اینکه مدل تنها شامل جزء ثابت بوده و هر دو مقدار مساوی صفر گردند.

پانویس[ویرایش]

منابع[ویرایش]

مشارکت‌کنندگان ویکی‌پدیا. «Goodness of fit». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۳۰ سپتامبر ۲۰۲۰.

۲۰۰۴(A GUIDE TO ECONOMETRICS(VERBEEK