توزیع دوجمله‌ای

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
دوجمله‌ای
پارامترها n \geq 0 تعداد تکرارها (طبیعی)
0\leq p \leq 1 شانس موفقیت (حقیقی)
‫تکیه‌گاه k \in \{0,\dots,n\}\!
تابع چگالی احتمال {n\choose k} p^k (1-p)^{n-k} \!
تابع توزیع تجمعی‫ (سی‌دی‌اف) I_{1-p}(n-\lfloor k\rfloor, 1+\lfloor k\rfloor) \!
میانگین np\!
میانه یکی از \{\lfloor np\rfloor-1, \lfloor np\rfloor, \lfloor np\rfloor+1\}
مُد \lfloor (n+1)\,p\rfloor\!
واریانس np(1-p)\!
چولگی \frac{1-2p}{\sqrt{np(1-p)}}\!
کشیدگی \frac{1-6p(1-p)}{np(1-p)}\!
انتروپی  \frac{1}{2} \ln \left(2 \pi n e p (1-p) \right) + O \left(\frac{1}{n} \right)
‫تابع مولد گشتاور (ام‌جی‌اف) (1-p + pe^t)^n \!
تابع مشخصه (1-p + pe^{it})^n \!

توزیع دوجمله‌ای[۱] نوعی توزیع پرکاربرد در آمار، اقتصاد، و علوم تجربی است. در نظریه‌ی احتمال و آمار توزیع دوجمله‌ای توزیعی گسسته است از تعداد موفقیت‌ها در دنباله‌ای شامل n آزمایش مستقل برنولی همه با احتمال موفقیت p(توزیع برنولی). درواقع متغیر تصادفی X (تعداد موفقیت‌ها) را متغیر دوجمله‌ای با پارامترهای n و p می‌گویند.

یک آزمایش دوجمله‌ای بایستی دارای ویژگیهای زیر باشد[۲]:

  • آزمایش دارای n تعداد آزمون یکسان و عیناً مشابه باشد.
  • نتیجه هر آزمون به یکی از فقط دو صورت باشد: موفق یا ناموفق
  • احتمال موفقیت آزمونی را اگر با p نشان دهیم، از آزمون به آزمون یکسان بوده و متغیر نباشد. احتمال ناموفقیت را با q نشان داده که برابر است با
    q=1-p
  • آزمونها مستقل باشند.


توزیع دوجمله‌ای برای p=0.5 , مثلث پاسکال

مشخصه‌ها[ویرایش]

تابع جرم احتمال[ویرایش]

درحالت کلی اگر X یک متغیرتصادفی دوجمله‌ای با پارامترهای p,n باشد، آن را بصورت (X ~ B(np نمایش می‌دهیم. احتمال بدست‌آوردن k موفقیت با تابع جرم احتمال زیر مشخص می‌شود:

 p(k) = \Pr(X = k) = {n\choose k}p^k(1-p)^{n-k}\quad\quad\quad\quad for\quad k=0,1,2,...,n


حال می‌خواهیم بررسی کنیم که این فرمول چگرنه بدست‌آمده است: توجه کنید که تعداد راه‌های ممکن در انجام n آزمایش برنولی که می‌تواند به k موفقیت منتهی‌شود برابر است با تعداد دنباله‌های مختلف به طول n از حروف b , a با k حرف a(موفقیت) و n-k حرف b (شکست). اما تعداد این دنباله‌ها برابر است با  {n\choose k} ، زیرا تعداد جایگشت‌های متمایز n حرف از دو نوع مختلف، که k تا همانند از نوع اول و n-k تا همانند از نوع دوم وجود دارد برابر است با \frac{n!}{k!\,(n-k)!} . باتوجه به استقلال امتحان‌ها چون احتمال هریک از این دنباله پیشامدها برابر  p^k(1-p)^{n-k} است داریم:

\Pr(X = k) = {n\choose k}p^k(1-p)^{n-k}


دلیل اینکه به این توزیع دوجمله‌ای می‌گویند این است که قضیه‌ی بسط دوجمله‌ای تضمین می‌کند که  p(k) یک تابع جرم احتمال است:

\sum_{k=0}^n p(k)=\sum_{k=0}^n{n \choose k}(1-p)^{n-k}p^{k}=[p+(1-p)]^n=1^n=1

تابع توزیع تجمعی[ویرایش]

تابع توزیع تجمعی متغیرتصادفی دوجمله‌ای به‌شکل زیر است:

F(k;n,p) = \Pr(X \le k) = \sum_{i=0}^{\lfloor k \rfloor} {n\choose i}p^i(1-p)^{n-i}

مثال[ویرایش]

اگر یک تیرانداز با احتمال 0/7 تیری را به هدف بزند و x تعداد تيرهاي به هدف خورده در 5 شليك باشد؛
ابتدا توزيع احتمال x را معلوم كنيد و هر یک از احتمال های زیر را به دست آورید.
الف- دقیقاً 3 تیر به هدف بزند.
ب- حداکثر 2 تیر به هدف بزند.
ج- هیچ تیری به هدف نزند.
متغير تصادفي x، دارای توزیع دو جمله ای با پارامترهای n=5 , p=0.7 است که تابع احتمال آن را به صورت زیر می نویسیم:

 p(k)={n\choose k}(0.7)^k (0.3)^{5-k}


برای به دست آوردن احتمالات در این مثال داریم:

 P(X=3)={5\choose 3}(0.7)^3 (0.3)^{2}=0.3087


 P(X\le 2)=p(0)+p(1)+p(2)=0.16308


 P(X=0)=p(0)=0.00243

میانگین و واریانس متغیرهای‌تصادفی‌دوجمله‌ای[ویرایش]

فرض‌کنید X یک متغیرتصادفی‌دوجمله‌ای با پارامترهای p,n باشد. به‌طور شهودی انتظار داریم که میانگین X برابر np باشد. مثلاً اگر سکه‌ی سالمی را صد بار پرتاب کنیم، انتظار داریم به‌طور متوسط 50 بار شیر مشاهده‌کنیم که برابر است با: np=100*(1/2). فرمول : \operatorname{E}[X] = np  را می‌توان مستقیماً از تعریف امید ریاضی بدست‌آورد. در زیر این فرمول‌های امید ریاضی و واریانس این متغیر را آورده‌ایم:

    \operatorname{E}[X] = np


\operatorname{Var}[X] = np(1 - p).

مثال[ویرایش]

تاسی را 3 بار پرتاب می کنیم. اگر متغیر تصادفی X تعداد تاسهایی که شش آمده باشد، تابع احتمال X را بنویسید و امید ریاضی و واریانس آن را محاسبه کنید.
چون پرتاب ها از یکدیگر مستقل اند و احتمال موفقیت (شش آمدن) در هر پرتاب 1/5 است و این آزمایش n=3 بار تکرار می شود، بنابراین شرایط توزیع‌دوجمله‌ای باp=\frac{1}{5}, n=3 برقرار است و توزیع احتمال X را به صورت زير می نویسیم:

p(k)={3\choose k}(1/6)^k (5/6)^{3-k}\quad\quad\quad\quad for\quad k=0,1,2,3


\operatorname{E}[X] = np=3*\frac{1}{5}


\operatorname{Var}[X] = np(1 - p)=3*\frac{1}{5}*\frac{4}{5}

[۳]

منابع[ویرایش]

جستجو در ویکی‌انبار در ویکی‌انبار پرونده‌هایی دربارهٔ توزیع دوجمله‌ای موجود است.
  • «توزیع دوجمله‌ای»(فارسی)‎. دانشنامهٔ رشد. بازبینی‌شده در ۷ بهمن ۱۳۸۷. 
  • page 27,37 introduction to probabilities models by Sheldon M.Ross
  • saeed_ghahramani. Fundumentals_of_Probability_3rd.Edition. 

دانش اسدی دانشجوی امار

  1. توزیع دوجمله‌ای [ریاضی] هم‌ارزِ binomial distribution (انگلیسی)؛ منبع: گروه واژه‌گزینی و زیر نظر غلامعلی حدادعادل، «فارسی»، در دفتر ششم، فرهنگ واژه‌های مصوب فرهنگستان، تهران: انتشارات فرهنگستان زبان و ادب فارسی، شابک ‎۹۷۸-۹۶۴-۷۵۳۱-۸۵-۶ (ذیل سرواژهٔ توزیع دوجمله‌ای) 
  2. Mathematical Statistics with Applications. Wackerly, Mendenhall. 5Ed. 1996. ISBN 0-534-20916-5 pp.88
  3. Mathematical Statistics with Applications. Wackerly, Mendenhall. 5Ed. 1996. ISBN 0-534-20916-5 pp.90