میانگین و کوواریانس نمونه

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

میانگین و کوواریانس نمونه آماره‌هایی هستند که از مجموعه‌ای از داده (یک یا چندمتغیره) محاسبه می‌شوند.

میانگین نمونه برداری است که هر مولفهٔ آن میانگین مشاهدات متغیر تصادفی مربوط است. میانگین نمونه بیشتر به منظور پارامتر مکان توزیع‌های احتمالاتی به کار می‌رود.

کوواریانس نمونه ماتریسی مربعی است که مولفهٔ iوjام آن کوواریانس نمونه بین متغیرهای iوjام را نشان می‌دهد. مولفهٔ iوiام این ماتریس واریانس نمونهٔ متغیر i را نشان می‌دهد. کوواریانس نمونه بیشتر به منظور شاخص پراکندگی به کار می‌رود.

فرض کنید یک بردار تصادفی X دارای K بعد است و N نمونه از آن \mathbf{x}_i, i = 1, \ldots, N داده شده است. میانگین و کوواریانس نمونه به ترتیب به صورت زیر محاسبه می‌گردند:

 \mathbf{\bar{x}}=\frac{1}{N}\sum_{i=1}^{N}\mathbf{x}_i.
\mathbf{Q} = {1 \over {N-1}}\sum_{i=1}^N (\mathbf{x}_i-\mathbf{\bar{x}}) (\mathbf{x}_i-\mathbf{\bar{x}})^\mathrm{T},

استفاده از {N-1} به جای {N} تصحیح بسل نام دارد که به منظور تصحیح بایاس تخمین انجام می‌گیرد.

منابع[ویرایش]