توزیع دوجمله‌ای

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
دوجمله‌ای
پارامترها n \geq 0 تعداد تکرارها (طبیعی)
0\leq p \leq 1 شانس موفقیت (حقیقی)
تابع چگالی احتمال Probability mass function for the binomial distribution
تابع توزیع تجمعی
تابع توزیع تجمعی
Cumulative distribution function for the binomial distribution
رنگها بر شکل قبلی منطبق است
‫تکیه‌گاه k \in \{0,\dots,n\}\!
تابع چگالی احتمال {n\choose k} p^k (1-p)^{n-k} \!
تابع توزیع تجمعی‫ (سی‌دی‌اف) I_{1-p}(n-\lfloor k\rfloor, 1+\lfloor k\rfloor) \!
میانگین np\!
میانه یکی از \{\lfloor np\rfloor-1, \lfloor np\rfloor, \lfloor np\rfloor+1\}
مُد \lfloor (n+1)\,p\rfloor\!
واریانس np(1-p)\!
چولگی \frac{1-2p}{\sqrt{np(1-p)}}\!
کشیدگی \frac{1-6p(1-p)}{np(1-p)}\!
انتروپی  \frac{1}{2} \ln \left(2 \pi n e p (1-p) \right) + O \left(\frac{1}{n} \right)
‫تابع مولد گشتاور (ام‌جی‌اف) (1-p + pe^t)^n \!
تابع مشخصه (1-p + pe^{it})^n \!

توزیع دوجمله‌ای[۱] نوعی توزیع پرکاربرد در آمار، اقتصاد، و علوم تجربی است. در نظریه‌ی احتمال و آمار توزیع دوجمله‌ای توزیعی گسسته است از تعداد موفقیت‌ها در دنباله‌ای شامل n آزمایش مستقل برنولی همه با احتمال موفقیت p(توزیع برنولی). درواقع متغیر تصادفی X (تعداد موفقیت‌ها) را متغیر دوجمله‌ای با پارامترهای n و p می‌گویند.

یک آزمایش دوجمله‌ای بایستی دارای ویژگیهای زیر باشد[۲]:

  • آزمایش دارای n تعداد آزمون یکسان و عیناً مشابه باشد.
  • نتیجه هر آزمون به یکی از فقط دو صورت باشد: موفق یا ناموفق
  • احتمال موفقیت آزمونی را اگر با p نشان دهیم، از آزمون به آزمون یکسان بوده و متغیر نباشد. احتمال ناموفقیت را با q نشان داده که برابر است با
    q=1-p
  • آزمونها مستقل باشند.


توزیع دوجمله‌ای برای p=0.5 , مثلث پاسکال

مشخصه‌ها[ویرایش]

تابع جرم احتمال[ویرایش]

درحالت کلی اگر X یک متغیرتصادفی دوجمله‌ای با پارامترهای p,n باشد، آن را بصورت (X ~ B(np نمایش می‌دهیم. احتمال بدست‌آوردن k موفقیت با تابع جرم احتمال زیر مشخص می‌شود:

 p(k) = \Pr(X = k) = {n\choose k}p^k(1-p)^{n-k}\quad\quad\quad\quad for\quad k=0,1,2,...,n


حال می‌خواهیم بررسی کنیم که این فرمول چگرنه بدست‌آمده است: توجه کنید که تعداد راه‌های ممکن در انجام n آزمایش برنولی که می‌تواند به k موفقیت منتهی‌شود برابر است با تعداد دنباله‌های مختلف به طول n از حروف b , a با k حرف a(موفقیت) و n-k حرف b (شکست). اما تعداد این دنباله‌ها برابر است با  {n\choose k} ، زیرا تعداد جایگشت‌های متمایز n حرف از دو نوع مختلف، که k تا همانند از نوع اول و n-k تا همانند از نوع دوم وجود دارد برابر است با \frac{n!}{k!\,(n-k)!} . باتوجه به استقلال امتحان‌ها چون احتمال هریک از این دنباله پیشامدها برابر  p^k(1-p)^{n-k} است داریم:

\Pr(X = k) = {n\choose k}p^k(1-p)^{n-k}


دلیل اینکه به این توزیع دوجمله‌ای می‌گویند این است که قضیه‌ی بسط دوجمله‌ای تضمین می‌کند که  p(k) یک تابع جرم احتمال است:

\sum_{k=0}^n p(k)=\sum_{k=0}^n{n \choose k}(1-p)^{n-k}p^{k}=[p+(1-p)]^n=1^n=1

تابع توزیع تجمعی[ویرایش]

تابع توزیع تجمعی متغیرتصادفی دوجمله‌ای به‌شکل زیر است:

F(k;n,p) = \Pr(X \le k) = \sum_{i=0}^{\lfloor k \rfloor} {n\choose i}p^i(1-p)^{n-i}

مثال[ویرایش]

اگر یک تیرانداز با احتمال 0/7 تیری را به هدف بزند و x تعداد تيرهاي به هدف خورده در 5 شليك باشد؛
ابتدا توزيع احتمال x را معلوم كنيد و هر یک از احتمال های زیر را به دست آورید.
الف- دقیقاً 3 تیر به هدف بزند.
ب- حداکثر 2 تیر به هدف بزند.
ج- هیچ تیری به هدف نزند.
متغير تصادفي x، دارای توزیع دو جمله ای با پارامترهای n=5 , p=0.7 است که تابع احتمال آن را به صورت زیر می نویسیم:

 p(k)={n\choose k}(0.7)^k (0.3)^{5-k}


برای به دست آوردن احتمالات در این مثال داریم:

 P(X=3)={5\choose 3}(0.7)^3 (0.3)^{2}=0.3087


 P(X\le 2)=p(0)+p(1)+p(2)=0.16308


 P(X=0)=p(0)=0.00243

میانگین و واریانس متغیرهای‌تصادفی‌دوجمله‌ای[ویرایش]

فرض‌کنید X یک متغیرتصادفی‌دوجمله‌ای با پارامترهای p,n باشد. به‌طور شهودی انتظار داریم که میانگین X برابر np باشد. مثلاً اگر سکه‌ی سالمی را صد بار پرتاب کنیم، انتظار داریم به‌طور متوسط 50 بار شیر مشاهده‌کنیم که برابر است با: np=100*(1/2). فرمول : \operatorname{E}[X] = np  را می‌توان مستقیماً از تعریف امید ریاضی بدست‌آورد. در زیر این فرمول‌های امید ریاضی و واریانس این متغیر را آورده‌ایم:

    \operatorname{E}[X] = np


\operatorname{Var}[X] = np(1 - p).

مثال[ویرایش]

تاسی را 3 بار پرتاب می کنیم. اگر متغیر تصادفی X تعداد تاسهایی که شش آمده باشد، تابع احتمال X را بنویسید و امید ریاضی و واریانس آن را محاسبه کنید.
چون پرتاب ها از یکدیگر مستقل اند و احتمال موفقیت (شش آمدن) در هر پرتاب 1/6 است و این آزمایش n=3 بار تکرار می شود، بنابراین شرایط توزیع‌دوجمله‌ای باp=\frac{1}{5}, n=3 برقرار است و توزیع احتمال X را به صورت زير می نویسیم:

p(k)={3\choose k}(1/6)^k (5/6)^{3-k}\quad\quad\quad\quad for\quad k=0,1,2,3


\operatorname{E}[X] = np=3*\frac{1}{5}


\operatorname{Var}[X] = np(1 - p)=3*\frac{1}{5}*\frac{4}{5}

[۳]

منابع[ویرایش]

  • «توزیع دوجمله‌ای»(فارسی)‎. دانشنامهٔ رشد. بازبینی‌شده در ۷ بهمن ۱۳۸۷. 
  • page 27,37 introduction to probabilities models by Sheldon M.Ross
  • saeed_ghahramani. Fundumentals_of_Probability_3rd.Edition. 

دانش اسدی دانشجوی امار

  1. «توزیع دوجمله‌ای» [ریاضی] هم‌ارزِ «binomial distribution» (انگلیسی)؛ منبع: گروه واژه‌گزینی و زیر نظر غلامعلی حدادعادل، «فارسی»، در دفتر ششم، فرهنگ واژه‌های مصوب فرهنگستان، تهران: انتشارات فرهنگستان زبان و ادب فارسی، شابک ‎۹۷۸-۹۶۴-۷۵۳۱-۸۵-۶ (ذیل سرواژهٔ توزیع دوجمله‌ای) 
  2. Mathematical Statistics with Applications. Wackerly, Mendenhall. 5Ed. 1996. ISBN 0-534-20916-5 pp.88
  3. Mathematical Statistics with Applications. Wackerly, Mendenhall. 5Ed. 1996. ISBN 0-534-20916-5 pp.90