واریانس

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
«پراش» به این صفحه تغییر مسیر پیدا می‌کند. برای دیگر کاربردها پراش (ابهام‌زدایی) را ببینید.

در نظریه احتمالات و آمار واریانس یا وردایی[۱] نوعی سنجش پراکندگی است.

مقدار واریانس با میانگین‌گیری از مربع فاصله مقدار محتمل و یا مشاهده شده با مقدار مورد انتظار محاسبه می‌شود. در مقایسه با میانگین می‌توان گفت که میانگین مکان توزیع را نشان می‌دهد، در حالی که واریانس مقیاسی است که نشان می‌دهد که داده‌ها حول میانگین چگونه پخش شده‌اند. واریانس کمتر بدین معنا است که انتظار می‌رود که اگر نمونه‌ای از توزیع مزبور انتخاب شود مقدار آن به میانگین نزدیک باشد. یکای واریانس مربع یکای کمیت اولیه می‌باشد. ریشه دوم واریانس که انحراف معیار نامیده می‌شود دارای واحدی یکسان با متغیر اولیه است.

واریانس یا وردایی عددی است که نشان می دهد چگونه یک سری داده حول مقدار میانگین پخش می شوند. برای تعریف واریانس اگر فرض کنیم که متغیر تکی X دارای توزیع p(x) است و متوسط توزیع جمعیت آن را با \mu نشان دهیم آنگاه واریانس این جمعیت بصورت زیر تعیین می گردد

Var(X) = \sigma^{2} \equiv \left\langle (X-\mu)^{2} \right\rangle

حال اگر یک توزیع مجزا داشته باشیم که هر مجموعه داده در آن، دارای احتمال p(x) باشد، واریانس بصورت زیر محاسبه می گردد

\sigma^{2} = \sum_{i=1}^{N}p(x_{i})(x_{i} - \mu)^{2}

اما در بیشتر موارد توزیع حاکم بر داده ها مشخص نیست در این حالت واریانس را بصورت زیر تخمین می زنیم

S^{2}_{N}\equiv \frac{1}{N}\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}

در این رابطه \overline{x} میانگین (امید ریاضی) داده‌هاست که خود از رابطهٔ زیر حساب می‌شود:

\overline{x} = \frac{1}{N}\sum_{i=1}^N x_i = \frac{x_1+x_2+\cdots+x_N}{N}

البته باید توجه داشت که تخمین فوق یک تخمین دقیق و بدون خطا برای واریانس نیست لذا برای از بین بردن این خطا در تخمین از واریانس تصحیح شده استفاده می کنیم که بصورت زیر تعریف می گردد

S^{2}_{N-1}\equiv \frac{1}{N-1}\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}

تعریف[ویرایش]

اگر \mu= \operatorname{E}( X )، امید ریاضی (میانگین) متغیر تصادفی X باشد، آنگاه واریانس X برابر خواهد بود با:

\operatorname{Var}(X) = \operatorname{E}[ ( X - \mu ) ^ 2 ]\,

\begin{align}\operatorname{Var}(X) 
 &= \operatorname{E}[(X - \mu)^2] \\&= \operatorname{E}[X^2 - 2\mu X + \mu^2] \\
 &= \operatorname{E}[X^2] - 2\mu\,\operatorname{E}[X] + \mu^2 \\&= \operatorname{E}[X^2] - 2\mu^2 + \mu^2 \\&= \operatorname{E}[X^2] - \mu^2 \\&= \operatorname{E}[X^2] - (\operatorname{E}[X])^2.
 \end{align}

برای به خاطر سپردن راحت‌تر این فرمول گفته‌می‌شود واریانس برابر است با «میانگین مجذور، منهای مجذور میانگین». واریانس متغیر تصادفی X را معمولاً با Var(X)‎ یا \scriptstyle\sigma_X^2 یا به صورت ساده‌تر σ2 (تلفظ می‌شود سیگما-دو) نمایش می‌دهند.

حالت پیوسته[ویرایش]

\operatorname{Var}(X) =\int (x-\mu)^2 \, f(x) \, dx\,,

و

\mu = \int x \, f(x) \, dx\,,

خواص[ویرایش]

\operatorname{Var}(aX+b)=\operatorname{Var}(aX)=a^2\operatorname{Var}(X).
\operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)+2\, \operatorname{Cov}(X,Y),
\operatorname{Var}(aX+bY)=a^2\operatorname{Var}(X)+b^2\operatorname{Var}(Y)+2ab\, \operatorname{Cov}(X,Y),

واژه شناسی[ویرایش]

فرهنگستان زبان وردیدن، از ریشه باستانی ورت (ورتیدن)، را بجای واریانس برگزیده است و از این فعل مشتقات وردش(variation)، وردا(variant)، هم‌وردا(covariant)، ناوردا(invariant)، پادوردا(contravariance) را برساخته است.

تخمین واریانس یک تابع[ویرایش]

\operatorname{Var}\left[f(X)\right]\approx \left(f'(\operatorname{E}\left[X\right])\right)^2\operatorname{Var}\left[X\right]

جستارهای وابسته[ویرایش]

منابع[ویرایش]

page ۱۱۷،۴۳ introduction to probabilities models by Sheldon M.Ross

مشارکت‌کنندگان ویکی‌پدیا، «Variance»، ویکی‌پدیای انگلیسی، دانشنامهٔ آزاد (بازیابی در ۲۲ فوریه ۲۰۰۸).