فرایند دیریکله
در نظریه احتمالات فرایند دیریکله یک فرایند تصادفی است. این فرایند یک توزیع روی توزیع هاست.
یک فرایند دیریکله با
مشخص می شود که در آن
توزیع پایه است و
پارامتر تراکم نامیده می شود. اگرچه توزیع پایه یعنی
پیوسته است، اما مقادیر ایجاد شده توسط فرایند دیریکله گسسته هستند. یعنی ممکن است تکرار شوند. اینکه احتمال اینکه تکرار شوند، چقدر است بستگی به پارامتر
دارد.
توجه کنید که فرایند دیریکله یک فرایند تصادفی است؛ یعنی تشکیل شده از بی نهایت متغیر تصادفی است. حال می توان یک فرایند دیریکله را به اینصورت ایجاد کرد: یک توزیع تصادفی انتخاب می کنیم و بی نهایت متغیر تصادفی را در نظر بگیرید که بی نهایت مقدار تصادفی از آن را مشخص می کنند. می توان این فرایند را توسط سناریوهای دیگری نیز تصویر کرد؛ مانند فرایند رستوران چینی یا فرایند شکستن چوب.
راه دیگر برای تصور فرایند دیریکله تصور یک توزیع دیریکله بینهایت است. با میل دادن ابعاد یک توزیع دیریکله متقارن
بعدی با پارامتر تراکم
به بی نهایت، می توان به فرایند شکستن چوب رسید که تجسمی دیگر برای فرایند دیریکله است.
اولین بار فرایند دیریکله توسط توماس فرگوسن معرفی شده است. [۱]
محتویات |
مقدمه [ویرایش]
توزیع مخلوط زیر را در نظر بگیرید:
مجموعه
داده های مشاهده هستند که مطابق توزیع مخلوط با
مولفه توزیع شده اند و هر مولفه دارای توزیع ثابت
است، بطوریکه هر مولفه دارای پارامتر متفاوتی برای
است که به نوبه ی خود از توزیع
بدست آمده است. معمولا توزیع
، مزدوج پیشین توزیع
است.
مطالب مرتبط [ویرایش]
- فرایند پیتمن-یور تعمیم فرایند دیریکله است.
- فرایند دیریکله ی سلسله مراتبی تعمیمی از فرایند دیریکله است تا اینکه داده های گروهی را نیز در نظر بگیرد.
منابع [ویرایش]
لینک های خارجی [ویرایش]
- Introduction to the Dirichlet Distribution and Related Processes by Frigyik, Kapila and Gupta
- Yee Whye Teh's overview of Dirichlet processes
- Webpage for the NIPS 2003 workshop on non-parametric Bayesian methods
- Michael Jordan's NIPS 2005 tutorial: Nonparametric Bayesian Methods: Dirichlet Processes, Chinese Restaurant Processes and All That
- Peter Green's summary of construction of Dirichlet Processes
- Peter Green's paper on probabilistic models of Dirichlet Processes with implications for statistical modelling and analysis
- Zoubin Ghahramani's UAI 2005 tutorial on Nonparametric Bayesian methods
- GIMM software for performing cluster analysis using Infinite Mixture Models
- A Toy Example of Clustering using Dirichlet Process. by Zhiyuan Weng
