آزمون فرض آماری
آزمون فرض آماری[۱] (به انگلیسی: Statistical hypothesis testing) در علم آمار روشی است برای بررسی ادعاها یا فرضها دربارهٔ پارامترهای توزیع در جوامع آماری. در این روش فرضيه صفر (به انگلیسی: Null-hypothesis) یا فرض اولیه، مورد بررسی ست که متناسب با موضوع مطالعه، فرضیه اي به عنوان فرضيه بدیل یا فرضيه مقابل (به انگلیسی: Alternative-hypothesis) انتخاب میشود تا درستی هر کدام نسبت به هم مورد آزمون قرار گیرد.[۲]
رویه کلی آزمون فرضيه[ویرایش]
آزمون یک فرضيه آماری عبارت از به کار گرفتن مجموعه قواعد صریحی برای آن است که تصمیم بگیریم که آیا فرضيه صفر را بپذیریم یا آن را به نفع فرضيه مقابل رد کنیم. مثلاً فرض کنید که آماردانی میخواهد فرضيه صفر را در برابر فرضيه مقابل آزمون کند. برای انجام یک انتخاب، وی به تولید دادههای نمونه ای از طریق ترتیب دادن یک آزمایش و سپس محاسبه مقدار یک آماره آزمون دست میزند که این آماره به او خواهد گفت که به ازای هر برآمد ممکن فضای نمونه ای چه اقدامی بکند؛ بنابراین، روش آزمون، مقادیر ممکن آماره آزمون را به دو مجموعه افراز میکند؛ یک ناحیه قبول برای و یک ناحیه رد برای .
- : فرضيه صفر
- : فرضيه مقابل
به ناحیه رد برای ناحیه بحرانی آزمون، و به احتمال به دست آوردن مقداری برای اماره آزمون در داخل این ناحیه بحرانی، وقتی که درست باشد، اندازه ناحیه بحرانی اطلاق میشود. بدین ترتیب، اندازه یک ناحیه بحرانی صرفاً احتمال مرتکب شدن یک خطای نوع I است. این احتمال، سطح معنی دار بودن یک آزمون هم نامیده میشود.[۳]
انواع خطا[ویرایش]
روشی که هماکنون توصیف شد ممکن است به دو نوع خطا منجر شود:
خطای نوع I[ویرایش]
رد فرضيه صفر را وقتی که درست باشد خطای نوع I مینامند؛ احتمال ارتکاب خطای نوع I را با نشان میدهند.
خطای نوع II[ویرایش]
قبول فرضيه صفر را وقتی که نادرست باشد، خطای نوع II مینامند؛ احتمال ارتکاب خطای نوع II را با نشان میدهند.[۴]
کاربردها[ویرایش]
اگر مهندسی بخواهد بر مبنای دادههای نمونه ای نظر دهد که آیا طول عمر متوسط نوع خاصی لاستیک چرخ ماشین حداقل ۲۲۰۰۰ مایل است یا نه، اگر یک کارشناس کشاورزی بخواهد بر مبنای آزمایشهایی نظر دهد که آیا نوع خاصی کود کشاورزی محصول لوبیای بیشتری نسبت به کود دیگر تولید میکند یا نه، و اگر یک سازنده محصولات دارویی بخواهد بر مبنای نمونههایی نظر دهد که آیا ۹۰ درصد کلیه بیمارانی که داروی جدیدی را مصرف میکنند از بیماری خاصی بهبود خواهند یافت یا نه، همه این مسائل را میتوان به زبان آزمون فرضيههای آماری برگرداند.
در مورد اول میتوانیم بگوییم که این مهندس باید این فرضيه را آزمون کند که پارامتر یک جامعه نمایی، حداقل ۲۲۰۰۰ است؛ در مورد دوم، میتوانیم بگوییم که کارشناس کشاورزی باید نظر دهد که آیا که در آن و میانگینهای دو جامعه نرمال هستند؛ و در مورد سوم میتوانیم بگوییم که سازنده باید نظر دهد که آیا ، پارامتر یک جامعه دوجمله ای برابر با ۰٫۹۰ است یا نه.
مانند مثالهای بالا، اغلب آزمونهای آماری به پارامترهای توزیعها میپردازند، ولی گاهی آنها به نوع، یا ماهیت خود توزیعها نیز میپردازند. به عنوان مثال، در اولین مثال از سه مثال بالا، آن مهندس همچنین ممکن است بخواهد نظر دهد که آیا واقعاً با نمونه ای از توزیع نمایی سر و کار دارد، یا اینکه آیا دادههای او مقادیر متغیرهای تصادفی ای هستند که، مثلاً، دارای توزیع وایبول هستند.
فرضيه آماری[ویرایش]
یک فرضيه آماری، حکم یا حدسی دربارهٔ توزیع یک یا چند متغیر تصادفی است. اگر یک فرضيه آماری توزیع را کاملاً مشخص کند، آن را فرضيه ساده و در غیر این صورت آن را فرضيه مرکب مینامند.
فرضيههایی که به صورت یک رابطه تساوی بیان میشوند فرضيههای ساده نامیده میشوند ولی ممکن است این فرضيهها به صورت نامساوی یا فرضيههای مرکب نیز باشند.
بدین ترتیب یک فرضيه ساده باید نه تنها شکل تابع توزیع مبنا، بلکه مقادیر همه پارامترها را نیز مشخص کند؛ بنابراین در سومین مثال از مثالهای بالا، یعنی مثالی که با کارایی داروی جدید سر و کار دارد، فرضيه ساده است، البته با این فرضيه که اندازه نمونه و دو جمله ای بودن توزیع جامعه را بدانیم. اما، در اولین مثال از مثالهای بالا، فرض مرکب است، زیرا مقدار مشخصی به پارامتر نمیدهد.
برای اینکه بتوان ملاکهای مناسبی برای فرضيههای آماری به وجود آورد، لازم است که فرضيههای مقابل را هم فرمول بندی کنیم. مثلاً در مثالی که در آن با طول عمر لاستیک سر و کار داشتیم، میتوانیم این فرضيه مقابل را فرمول بندی کنیم که پارامتر در توزیع نمایی، کمتر از ۲۲۰۰۰ است؛ در مثالی که با دو نوع کود سر و کار داشتیم میتوانیم فرضيه مقابل را فرمول بندی کنیم؛ و در مثالی که در آن با داروی جدید سر و کار داشتیم میتوانیم این فرضيه مقابل را فرمول بندی کنیم که پارامتر در توزیع دو جمله ای مفروض صرفاً ۰٫۶۰ است، که همان نرخ بهبودی از بیماری بدون داروی جدید است.
مفهوم فرضيههای ساده و مرکب در مورد فرضيههای بالا نیز به کار میرود، و در مثال اول اینک میتوانیم بگوییم که فرضيه مرکب را در برابر فرضيه مقابل مرکب آزمون میکنیم که در آن پارامتر جامعه نمایی است. به همین نحو، در مثال دوم، فرضيه مرکب را در برابر فرضيه مقابل مرکب آزمون میکنیم، که در آن و میانگینهای دو جامعه نرمال اند، ور در مثال فرض سوم، فرضيه ساده را در برابر فرضيه ساده آزمون میکنیم که در آن پارامتر یک جامعه دو جمله ای است که برای آن معلوم است.[۳]
پیدایش اصطلاح فرضيه صفر[ویرایش]
آمار دانان اغلب، به عنوان فرضيههای خود، ضد آنچه را که به باور آنها درست است بیان میکنند. مثلاً، اگر بخواهیم نشان دهیم که دانش آموزان یک مدرسه بهره هوشی بالاتری نسبت به مدرسه دیگری دارند، میتوانیم این فرضيه را فرمول بندی کنیم که تفاوتی در بین نیست، یعنی اینکه . با این فرضيه میدانیم که چه انتظاری میتوانیم داشته باشیم، اما اگر فرضيه را به صورت فرمول بندی میکردیم، وضعیت این گونه نمیبود؛ مگر اینکه حداقل فاصله واقعی بین و را مشخص کنیم.
به همین نحو، اگر بخواهیم نشان دهیم که نوعی سنگ معدن، محتوی درصد اورانیوم بیشتری نسبت به سنگ معدن دیگری است، میتوانیم این فرضيه را فرمول بندی کنیم که این درصدها یکسان است؛ و اگر بخواهیم نشان دهیم که تغییرپذیری بیشتری در کیفیت یک محصول نسبت به محصول دیگری وجود دارد، میتوانیم این فرضيه را فرمول بندی کنیم که هیچ تفاوتی در بین نیست، یعنی اینکه .
با توجه به فرضيههای عدم تفاوت، فرضيههایی نظیر اینها به پیدایش اصطلاح فرضيه صفر منجر شدند، گرچه امروزه این اصطلاح به هر فرضیه اي اطلاق میشود که میخواهیم آن را آزمون کنیم.[۵]
مثال تحلیلی[ویرایش]
با رجوع به مثال سوم در بالا، فرض کنید که سازنده داروی جدید میخواهد فرضيه صفر را در برابر فرضيه مقابل امتحان کند. آماره آزمون او ، تعداد پیروزیها (بهبودیها) ی مشاهده شده در ۲۰ امتحان است، و او فرضيه صفر را میپذیرد در صورتی که ؛ در غیر این صورت آن را رد خواهد کرد. حال میخواهیم و را محاسبه کنیم.
ناحیه قبول برای با مقادیر ؛ و ناحیه رد (یا ناحیه بحرانی) متناظر با مقادیر داده میشود، بنابراین طبق جدول توزیع نرمال (توزیع دو جمله ای با زیاد شدن تکرار آزمایشهای با توزیع نرمال تخمین زده میشود) داریم:
و
.
یک آزمون خوب آن است که در آن و هر دو کوچک باشند و بنابراین به ما شانس بالایی برای اتخاذ تصمیم درست بدهد. احتمال خطای نوع II () در مثال بالا نسبتاً زیاد است، اما میتوان آن را با تغییر مناسب ناحیه بحرانی کم کرد. مثلاً اگر ناحیه قابل قبول را در مثال بالا به کار ببریم، به طوریکه ناحیه بحرانی باشد، به آسانی میتوان تحقیق کرد که با این کار و خواهد شد؛ بنابراین، گرچه احتمال خطای نوع II کوچکتر شدهاست، احتمال خطای نوع I بزرکتر شدهاست. تنها راهی که میتوان احتمالهای هر دو نوع خطا را کم کرد افزایش دادن اندازه نمونه است، اما مادامی که ثابت گرفته شود، این رابطه متقابل بین احتمالهای خطای نوع I و نوع II از خصوصیات روشهای تصمیم آماری است. به عبارت دیگر، اگر احتمال یک نوع خطا کاهش یابد، احتمال خطای نوع دیگر افزایش مییابد.[۳]
جستارهای وابسته[ویرایش]
- پی-مقدار
- آزمون تی استیودنت
- آزمون اف
- آزمون خطای استاندارد میانگین
- آزمون ویلکاکسون
- آر (زبان برنامهنویسی)
منابع[ویرایش]
- ↑ «آزمون فرض» [آمار، ریاضی] همارزِ «hypothesis testing/ hypothesis test»؛ منبع: گروه واژهگزینی. جواد میرشکاری، ویراستار. دفتر ششم. فرهنگ واژههای مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۷۸-۹۶۴-۷۵۳۱-۸۵-۶ (ذیل سرواژهٔ آزمون فرض)
- ↑ سعید رضاخواه، آمار و احتمال کاربردی، انتشارات دانشگاه امیر کبیر، شابک ۹۶۴-۴۶۳-۰۹۱-۲ (کتابخانه ملی: م۷۹–۲۰۶۷۴) مقدار
|شابک=
را بررسی کنید: invalid character (کمک) - ↑ ۳٫۰ ۳٫۱ ۳٫۲ فروند، جان (۱۳۷۸). آمار ریاضی. تهران: مرکز نشر دانشگاهی. صص. ۴۱۰.
- ↑ اهرابی، فریدون؛ تقوی طلب، محسن. احتمالات و تحلیل آماری. بانک مرکزی جمهوری اسلامی.
- ↑ ج. لارسن، هرولد (۱۳۸۹). نظریه احتمالات و نتیجهگیری آماری. تهران: موسسه انتشارات علمی دانشگاه صنعتی شریف.