توزیع چندجمله‌ای

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
توزیع چند جمله‌ای
پارامترها n> 0 تعداد تکرارها (عدد صحیح)
p_1, \ldots, p_k احتمال رخداد (\Sigma p_i = 1)
‫تکیه‌گاه X_i \in \{0,\dots,n\}
\Sigma X_i = n\!
تابع چگالی احتمال \frac{n!}{x_1!\cdots x_k!} p_1^{x_1} \cdots p_k^{x_k}
تابع توزیع تجمعی‫ (سی‌دی‌اف)
میانگین E\{X_i\} = np_i
میانه
مُد
واریانس \textstyle{\mathrm{Var}}(X_i) = n p_i (1-p_i)
\textstyle {\mathrm{Cov}}(X_i,X_j) = - n p_i p_j~~(i\neq j)
چولگی
کشیدگی
انتروپی
‫تابع مولد گشتاور (ام‌جی‌اف) \biggl(\sum_{i=1}^k p_i e^{t_i} \biggr)^n
تابع مشخصه  \left(\sum_{j=1}^k p_je^{it_j}\right)^n که در آن i^2= -1

در نظریه احتمالات, توزیع چند جمله‌ای یا (به انگلیسی: multinomial distribution) تعمیم توزیع دوجمله‌ای است. در واقع در این توزیع به ازای n آزمایش تصادفی و مستقل، k نتیجه هرکدام با احتمال بروز مشخص ثابت بروز می‌کنند. در واقع توزیع چند جمله‌ای احتمال بروز هرگونه ترکیبی از n برآمد تصادفی مستقل (که هرکدام می‌توانند از میان یکی از k برآمد ممکن باشند) را بدست می‌دهد.

مشخصات[ویرایش]

توزیع جرم احتمال[ویرایش]

فرض کنیم می‌خواهیم چنین آزمایشی را انجام دهیم که می‌خواهیم n توپ (با جایگذاری) از داخل کیسه‌ای شامل k رنگ توپ خارج کنیم. تفاوتی بین توپ‌های هم رنگ وجود ندارد. فرض کنیم Xi متغیر تصادفی باشند که تعداد توپ‌های خارج شده دارای رنگ i را نشان می‌دهد. احتمال خارج شدن توپ با رنگ i ام را با p i نشان می‌دهیم. روی این مساله می‌توان توزیع چند جمله‌ای را به صورت زیر نشان داد:

 \begin{align}
f(x_1,\ldots,x_k;n,p_1,\ldots,p_k) & {} = \Pr(X_1 = x_1\mbox{ and }\dots\mbox{ and }X_k = x_k) \\  \\
& {} = \begin{cases} { \displaystyle {n! \over x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}}, \quad &
\mbox{when } \sum_{i=1}^k x_i=n \\  \\
0 & \mbox{otherwise,} \end{cases}
\end{align}

که در آن x1,... , xk مقادیر غیرمنفی هستند.

ویژگی‌ها[ویرایش]

امید ریاضی تعداد دفعاتی که پی آمد i ام طی n آزمایش دیده شود عبارت است از:

\operatorname{E}(X_i) = n p_i. \,

واریانس هر پیامد برابر است با:

\operatorname{var}(X_i)=np_i(1-p_i). \,

عوامل غیر قطری ماتریس کوواریانس یا کواریانس پیامدها را می‌توان به اینصورت محاسبه کرد:

\operatorname{cov}(X_i,X_j)=-np_i p_j\,

تکیه‌گاه (ریاضی) پی آمدهای توزیع چند جمله‌ای برابر است با:

\{(n_1,\dots,n_k)\in \mathbb{N}^{k}| n_1+\cdots+n_k=n\}. \,

که تعداد اعضای آن برابر است با:

{n+k-1 \choose k-1}.

نمونه گیری از توزیع چندجمله‌ای[ویرایش]

ابتدا احتمال رخدادها یعنی p_1, \ldots p_k را بصورت کاهشی مرتب کنید. این کار تنها برای افزایش سرعت محاسبات است. سپس در هر تکرار برای متغیر تصادفی X عددی تصادفی از توزیع یکنواخت در (۰، 1) انتخاب کنید. در هر مرحله برآمد توسط رابطهٔ زیر مشخص می‌شود.

j = \arg \min_{j'=1}^{k} \left(\sum_{i=1}^{j'} p_i - X \right).

این یک نمونه گیری از توزیع چند جمله‌ای به ازای n=1 است. در صورتی که این آزمایش را n بار تکرار کنیم، یک نمونه گیزی از توزیع چند جمله به ازای n تکرار داریم.

توزیع‌های مربوط[ویرایش]

جستارهای وابسته[ویرایش]

توزیع چند جمله‌ای منفی

منابع[ویرایش]