توزیع دیریکله—چندجمله‌ای

از ویکی‌پدیا، دانشنامهٔ آزاد

توزیع دیریکله-چندجمله‌ای یک توزیع گسسته چندجمله‌ای است. این توزیع نام های دیگری نیز دارد؛ از جمله Dirichlet compound multinomial distribution (DCM) یا multivariate Pólya distribution(که پس از جورج پولیا نام‌گذاری شده است.) در این توزیع بردار p از یک توزیع دیریکله با پارامترهای نمونه برداری شده است. مجموعه مقادیر گسسته از توزیع دسته‌ای با بردار احتمالات p بدست می آیند.

تابع جرم احتمال[ویرایش]

فرض کنیم N نمونه برداری تصادفی مستقل از یک توزیع دسته ای با K دسته انجام می دهیم. فرض کنیم مقادیر تصادفی را با به ازای مقادیر نشان دهیم. فرض بخواهیم تعداد دفعاتی که کلاس (به ازای )دیده شده است را با نشان دهیم. می دانیم . به این مسئله می توان به دو شیوه ی معادل نگاه کرد:

  1. مجموعه ای از N متغیر با توزیع دسته ای.
  2. بردار توزیع شده با توجه به توزیع چندجمله‌ای.

اکنون می توان روی این پارامتر این توزیع ها، یعنی p، توزیعی دیکله تجسم کرد و با انتگرال گیری نسبت به آن، توزیع پسین را بدست آورد. اگرچه دو دید فوق معادل هستند، اما با در نظر گرفتن هر کدام می توان توزیع پسین متفاوتی بدست آورد.

مجموعه ای از مشاهدات[ویرایش]

توزیع مشترک[ویرایش]

به ازای متغیر دسته ای توزیع احتمال مشترک حاشیه ای عبارت است از:

که منجر به فرمول زیر می شود:

که در آن تابع گاما است.

توزیع های مرتبط[ویرایش]

توزیع معادل یک بعدی این توزیع توزیع بتا-دو جمله ای نام دارد.

کاربردها[ویرایش]

جستارهای وابسته[ویرایش]

منابع[ویرایش]