توزیع فوق‌هندسی

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

توزیع فوق هندسی مجموعه ای از N عضو را در نظر بگیرید که k عضو آن دارای یک ویژگی و بقیه، فاقد این ویژگی هستند. مانند 500 لامپ موجود در یک جعبه که 300 تای آن سالم و بقیه معیوب باشند. حال فرض کنید می خواهیم از این مجموعه، n عضو به صورت تصادفی (بدون جایگذاری) انتخاب کنیم. دراین صورت اگر متغیر تصادفیX تعداد عناصری در n برداشت باشد که دارای ویژگی موردنظر هستند، می گوئیم X دارای توزیع فوق هندسی است.

فوقِ هندسی
پارامترها N\in 0,1,2,3...\,
D\in 0,1,...,N\,
n\in 0,1,...,N\,
‫تکیه‌گاه k \in 0,1,...,n\,
تابع چگالی احتمال {{{D \choose k} {{N-D} \choose {n-k}}}\over {N \choose n}}
تابع توزیع تجمعی‫ (سی‌دی‌اف)
میانگین nD\over N
میانه
مُد
واریانس n(D/N)(1-D/N)(N-n)\over (N-1)
چولگی
کشیدگی
انتروپی
‫تابع مولد گشتاور (ام‌جی‌اف) \frac{{N-D \choose n}}{{N \choose n}}\,_2F_1(-n,-D;N-D-n+1;e^{t})
تابع مشخصه \frac{{N-D \choose n}}{{N \choose n}}\,_2F_1(-n,-D;N-D-n+1;e^{it})

تعریف[ویرایش]

ابتدا برای درک بهتر این توزیع یک مثال مطرح می‌کنیم. فرض کنید از جعبه‌ای شامل D فیوز معیوب و N-D فیوز سالم، n فیوز را بطور تصادفی و بدون‌جایگذاری انتخاب‌کنیم. به‌علاوه فرض‌کنیدn، تعداد فیوزهای استخراجی از تعداد فیوزهای معیوب و فیوزهای سالم تجاوز نکند.فرض‌کنید متغیرتصادفی X تعداد فیوزهای معیوب خارج‌ شده باشد.بنابراین:
تعریف: فرض کنید D,N و n اعداد صحیح و مثبت‌اند، با n\le min(D,N-D). دراینصورت،

 p(k)=P(X=k) = {{{D \choose k} {{N-D} \choose {n-k}}}\over {N \choose n}}\quad\quad\quad for\quad k\in{0,1,2,...,n}


را تابع جرم‌احتمال توزیع فوق‌هندسی می‌گویند.

اثبات ترکیبیاتی تابع احتمال بودن[ویرایش]

با استفاده از اتحاد ترکیبیاتی واندرموند به راحتی می‌توان نتیجه‌گرفت که

\sum_{k=0}^n{{{D \choose k} {{N-D} \choose {n-k}}}= {N \choose n}}


که با استفاده از آن برای همه‌ی مقادیر k به‌سادگی می‌توان  \sum_{k=0}^n p(k)=1 را نتیجه‌گرفت.

متوسط و واریانس متغیرتصادفی فوق‌هندسی[ویرایش]

برای متغیرتصادفی فوق‌هندسی X که در بالا تعریف شد داریم:



\operatorname{E}[X] =\frac{nD}{N}


\operatorname{Var}[X] = \frac{nD(N-D)}{N^2}(1-\frac{n-1}{N-1}).

توجه‌کنید که اگر آزمایش ستخراج n قلم کالا از جعبه‌ای شامل D قلم کالای معیوب و N-D قلم کالای‌ سالم را با جایگذاری انجام‌دهیم، دراینصورت X دارای توزیع دوجمله‌ای با پارامترهای n و D\over N است. پس:

    \operatorname{E}[X] = \frac{nD}{N}


 \operatorname{Var}[X] = n\frac{D}{N} (1-\frac{D}{N})=\frac{nD(N-D)}{N^2}.

اینها نشان‌می‌دهند که اگر اقلام با جایگذاری انتخاب شوند، دراینصورت امیدریاضی X تغییر نمی‌کند اما واریانس X افزایش پیدامی‌کند. با وجود این اگر n بسیار کوچکتر از N باشد دراینصورت باتوجه به فرمول واریانس، استخراج باجایگذاری تقریب خوبی برای استخراج بدون‌جایگذاری است.

مثال[ویرایش]

در یک کیسه 24 مهره وجود دارد که 4 تای آن قرمز و مابقی سفید هستند. اگر از این کیسه 6 مهره به تصادف و بدون جایگذاری برداریم وX تعداد مهره های قرمز باشد؛ توزیع احتمال X را به دست آورید. احتمال اینکه هیچ مهره قرمزی بدست نیاید چقدر است؟ داریم n=6 ,D=4 , N=24 بنابراین توزیع احتمال X فوق هندسی و به صورت زیر است:

 p(k)={{{4 \choose k} {{20} \choose {6-k}}}\over {24 \choose 6}}\quad\quad\quad k\in{0,1,2,3,4}


درنتیجه احتمال اینکه هیچ مهره‌ای قرمز نباشد می‌شود:

 p(0)={{{4 \choose 0} {{20} \choose {6}}}\over {24 \choose 6}}=0.288

منابع[ویرایش]

  • saeed_ghahramani. Fundumentals_of_Probability_3rd.Edition.