واریانس: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده

درخط

نسخهٔ ‏۹ مارس ۲۰۱۹، ساعت ۲۱:۲۲

در نظریه احتمالات و آمار وردایی^[۱] یا واریانس نوعی سنجش پراکندگی است.

مقدار وردایی با میانگین‌گیری از مربع فاصله مقدار محتمل یا مشاهده شده با مقدار مورد انتظار محاسبه می‌شود. در مقایسه با میانگین می‌توان گفت که میانگین مکان توزیع را نشان می‌دهد، در حالی که وردایی مقیاسی است که نشان می‌دهد که داده‌ها حول میانگین چگونه پخش شده‌اند. وردایی کمتر بدین معنا است که انتظار می‌رود که اگر نمونه‌ای از توزیع مزبور انتخاب شود مقدار آن به میانگین نزدیک باشد. یکای وردایی مربع یکای کمیت اولیه می‌باشد. ریشه دوم وردایی که انحراف معیار نامیده می‌شود دارای واحدی یکسان با متغیر اولیه است.

واریانس یا وردایی عددی است که نشان می‌دهد چگونه یک سری داده حول مقدار میانگین پخش می‌شوند. برای تعریف وردایی اگر فرض کنیم که متغیر تکی $X$ دارای توزیع $p(x)$ است و متوسط توزیع جمعیت آن را با $\mu$ نشان دهیم آنگاه وردایی این جمعیت به صورت زیر تعیین می‌شود:

$Var(X)=\sigma ^{2}\equiv \left\langle (X-\mu )^{2}\right\rangle$

حال اگر یک توزیع مجزا داشته باشیم که هر مجموعه داده در آن، دارای احتمال $p(x)$ باشد، وردایی به صورت زیر محاسبه می‌شود:

$\sigma ^{2}=\sum _{i=1}^{N}p(x_{i})(x_{i}-\mu )^{2}$

اما در بیشتر موارد توزیع حاکم بر داده‌ها مشخص نیست در این حالت وردایی را به صورت زیر تخمین می‌زنیم:

$S_{N}^{2}\equiv {\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}$

در این رابطه ${\overline {x}}$ میانگین (امید ریاضی) داده‌هاست که خود از رابطهٔ زیر حساب می‌شود:

{\overline {x}}={\frac {1}{N}}\sum _{i=1}^{N}x_{i}={\frac {x_{1}+x_{2}+\cdots +x_{N}}{N}}

البته باید توجه داشت که تخمین فوق یک تخمین دقیق و بدون خطا برای وردایی نیست لذا برای از بین بردن این خطا در تخمین از وردایی تصحیح شده‌استفاده می‌کنیم که بصورت زیر تعریف می‌گردد

$S_{N-1}^{2}\equiv {\frac {1}{N-1}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}$

تعریف

اگر $\mu =\operatorname {E} (X)$ ، امید ریاضی (میانگین) متغیر تصادفی $X$ باشد، آنگاه وردایی $X$ برابر خواهد بود با:

{\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} [(X-\mu )^{2}]\\&=\operatorname {E} [X^{2}-2\mu X+\mu ^{2}]\\&=\operatorname {E} [X^{2}]-2\mu \,\operatorname {E} [X]+\mu ^{2}\\&=\operatorname {E} [X^{2}]-2\mu ^{2}+\mu ^{2}\\&=\operatorname {E} [X^{2}]-\mu ^{2}\\&=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}.\end{aligned}}

برای به خاطر سپردن راحت‌تر این فرمول گفته‌می‌شود وردایی برابر است با «میانگین مجذور، منهای مجذور میانگین». وردایی متغیر تصادفی X را معمولاً با Var(X)‎ یا $\scriptstyle \sigma _{X}^{2}$ یا به صورت ساده‌تر σ² (تلفظ می‌شود سیگما-دو) نمایش می‌دهند.

حالت گسسته

اگر $X$ یک متغیر تصادفی با تابع جرم احتمال به این شکل باشد $x_{1}\mapsto p_{1},x_{2}\mapsto p_{2},\ldots ,x_{n}\mapsto p_{n}$ آنگاه واریانس آن به این شکل محاسبه می‌شود.

\operatorname {Var} (X)=\sum _{i=1}^{n}p_{i}\cdot (x_{i}-\mu )^{2},

عبارت پیشین با معادله پایین معادل است:

\operatorname {Var} (X)=\left(\sum _{i=1}^{n}p_{i}x_{i}^{2}\right)-\mu ^{2},

در اینجا $\mu$ امید ریاضی $X$ است.

\mu =\sum _{i=1}^{n}p_{i}x_{i}.

واریانس $n$ مقدار که از لحاظ احتمال با یکدیگر برابرند با عبارت پایین برابر خواهد بود:

\operatorname {Var} (X)={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-\mu )^{2},

در اینجا $\mu$ میانگین $n$ داده‌است:

\mu ={\frac {1}{n}}\sum _{i=1}^{n}x_{i}.

البته واریانس این $n$ داده را بدون در نظرگرفتن میانگین آنها هم می‌شود به شکل پایین محاسبه کرد:^[۲]

\operatorname {Var} (X)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\sum _{j=1}^{n}{\frac {1}{2}}(x_{i}-x_{j})^{2}={\frac {1}{n^{2}}}\sum _{i}\sum _{j>i}(x_{i}-x_{j})^{2}.

حالت پیوسته

{\begin{aligned}\operatorname {Var} (X)=\sigma ^{2}&=\int (x-\mu )^{2}f(x)\,dx\\[4pt]&=\int x^{2}f(x)\,dx-2\mu \int xf(x)\,dx+\int \mu ^{2}f(x)\,dx\\[4pt]&=\int x^{2}\,dF(x)-2\mu \int x\,dF(x)+\mu ^{2}\int \,dF(x)\\[4pt]&=\int x^{2}\,dF(x)-2\mu \cdot \mu +\mu ^{2}\cdot 1\\[4pt]&=\int x^{2}\,dF(x)-\mu ^{2},\end{aligned}}

در اینجا میانگین یا $\mu$ به این شکل محاسبه می‌شود:‌

\mu =\int x\,f(x)\,dx\,,

خواص

واریانس همیشه غیرمنفی است:

\operatorname {Var} (X)\geq 0.

واریانس متغیر تصادفی ثابت همیشه صفر است به این معنی که:

P(X=a)=1\iff \operatorname {Var} (X)=0.

اگر به متغیر تصادفی مقداری ثابت اضافه شود در واریانس متغیر تصادفی جدید تغییری ایجاد نمی‌شود:

\operatorname {Var} (X+a)=\operatorname {Var} (X).

اگر متغیر تصادفی در مقداری ثابت ضرب شود، واریانس متغیر تصادفی جدید در مربع مقدار ثابت قبلی ضرب می‌شود:

\operatorname {Var} (aX)=a^{2}\operatorname {Var} (X).

واریانس ترکیب خطی دو متغیر تصادفی به این شکل محاسبه می‌شود:

\operatorname {Var} (aX+bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)+2ab\,\operatorname {Cov} (X,Y),

\operatorname {Var} (aX-bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)-2ab\,\operatorname {Cov} (X,Y),

به صورت کلی جمع

N

متغیر تصادفی به شکل پایین محاسبه می‌شود:

\operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i,j=1}^{N}\operatorname {Cov} (X_{i},X_{j})=\sum _{i=1}^{N}\operatorname {Var} (X_{i})+\sum _{i\neq j}\operatorname {Cov} (X_{i},X_{j}).

واریانس ترکیب خطی

N

متغیر تصادفی به شکل پایین محاسبه میشود:

{\begin{aligned}\operatorname {Var} \left(\sum _{i=1}^{N}a_{i}X_{i}\right)&=\sum _{i,j=1}^{N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+\sum _{i\not =j}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+2\sum _{1\leq i<j\leq N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j}).\end{aligned}}

اگر کوواریانس این متغیرهای تصادفی نسبت به هم صفر باشد یعنی

\operatorname {Cov} (X_{i},X_{j})=0\ ,\ \forall \ (i\neq j),

آنگاه:

\operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i=1}^{N}\operatorname {Var} (X_{i}).

مثال

تاس

اگر یک تاس داشته باشیم که احتمال آمدن هر عدد ${\frac {1}{6}}$ باشد، آنگاه امید ریاضی تاس با ${\frac {(1+2+3+4+5+6)}{6}}$ برابر خواهد بود و واریانس تاس می شود:‌

{\begin{aligned}\operatorname {Var} (X)&=\sum _{i=1}^{6}{\frac {1}{6}}\left(i-{\frac {7}{2}}\right)^{2}\\[5pt]&={\frac {1}{6}}\left((-5/2)^{2}+(-3/2)^{2}+(-1/2)^{2}+(1/2)^{2}+(3/2)^{2}+(5/2)^{2}\right)\\[5pt]&={\frac {35}{12}}\approx 2.92.\end{aligned}}

به صورت کلی‌تر اگر یک متغیر گسسته تصادفی داشته باشیم که $n$ مقدار بگیرد و احتمال هر کدام از این مقادیر ${\frac {1}{n}}$ باشد، واریانس متغیر تصادفی ما برابر خواهد بود با:

{\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}i^{2}-\left({\frac {1}{n}}\sum _{i=1}^{n}i\right)^{2}\\[5pt]&={\frac {(n+1)(2n+1)}{6}}-\left({\frac {n+1}{2}}\right)^{2}\\[4pt]&={\frac {n^{2}-1}{12}}.\end{aligned}}

توزیع طبیعی

توزیع طبیعی با تابع چگالی احتمال $f(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}$ و پارامترهای $\mu$ و $\sigma$ به شکل پایین محاسبه می‌شود:

\operatorname {Var} (X)=\int _{-\infty }^{\infty }{\frac {x^{2}}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}\,dx-\mu ^{2}=\sigma ^{2}

توزیع نمایی

توزیع طبیعی با تابع چگالی احتمال $f(x)=\lambda e^{-\lambda x}$ و پارامتر $\lambda$ به شکل پایین محاسبه می‌شود، در این محاسبه $\mu =\lambda ^{-1}$ :

$\operatorname {Var} (X)=\int _{0}^{\infty }x^{2}\lambda e^{-\lambda x}\,dx-\mu ^{2}=\lambda ^{-2}$

توزیع پوسان

توزیع طبیعی با تابع چگالی احتمال ${\displaystyle p(k)={\frac {\lambda ^{k}}{k!}}e^{-\lambda }}$ و پارامتر $\lambda$ به شکل پایین محاسبه می‌شود، در این محاسبه $\mu =\lambda$ :

$\operatorname {Var} (X)=\left(\sum _{k=0}^{\infty }k^{2}{\frac {\lambda ^{k}}{k!}}e^{-\lambda }\right)-\mu ^{2}=\lambda$

واژه‌شناسی

فرهنگستان زبان فارسی، وردیدن از ریشه باستانی ورت (ورتیدن)، را بجای فعل to varry برگزیده است و از این فعل مشتقات وردایی (variance)،وردش (variation)، وردا (variant)، هم‌وردا (covariant)، هم وردایی (covariannce)، ناوردا (invariant)، ناوردایی (invariance)، پادوردا (contravariance) را برساخته است.

تخمین واریانس یک تابع

برای تخمین واریانس یک تابع از بسط تیلور آن به صورت پایین استفاده می‌کنند.

$\operatorname {Var} \left[f(X)\right]\approx \left(f'(\operatorname {E} \left[X\right])\right)^{2}\operatorname {Var} \left[X\right]$

جستارهای وابسته

منابع

page ۱۱۷٬۴۳ introduction to probabilities models by Sheldon M.Ross

↑ مصوب فرهنگستان زبان و ادب فارسی، دفتر نخست تا چهارم، 1376 تا 85
↑ Yuli Zhang, Huaiyu Wu, Lei Cheng (June 2012). Some new deformation formulas about variance and covariance. Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). pp. 987–992.{{cite conference}}: نگهداری یادکرد:استفاده از پارامتر نویسندگان (link)

مشارکت‌کنندگان ویکی‌پدیا. «Variance». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۲۲ فوریه ۲۰۰۸.

این یک مقالهٔ خرد مربوط به آمار است. می‌توانید با گسترش آن به ویکی‌پدیا کمک کنید.

[1] مصوب فرهنگستان زبان و ادب فارسی، دفتر نخست تا چهارم، 1376 تا 85

[2] Yuli Zhang, Huaiyu Wu, Lei Cheng (June 2012). Some new deformation formulas about variance and covariance. Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). pp. 987–992.{{cite conference}}: نگهداری یادکرد:استفاده از پارامتر نویسندگان (link)

[۱]

[۲]

@@ خط ۱۴۷: / خط ۱۴۷: @@
 {{پایان}}
-=== توزیع طبیعی ===
+===[[توزیع طبیعی]]===
 توزیع طبیعی با تابع چگالی احتمال <math>
 f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} e^{ -\frac{(x-\mu)^2}{2\sigma^2} }
@@ خط ۱۵۸: / خط ۱۵۸: @@
 {{پایان}}
-=== توزیع نمایی ===
+===[[توزیع نمایی]]===
 توزیع طبیعی با تابع چگالی احتمال <math>f(x) = \lambda e^{-\lambda x}</math>و پارامتر <math>\lambda</math> به شکل پایین محاسبه می‌شود، در این محاسبه <math>\mu = \lambda^{-1}</math>:
 <math>\operatorname{Var}(X) = \int_0^\infty x^2 \lambda e^{-\lambda x} \, dx - \mu^2 = \lambda^{-2}</math>
+=== [[توزیع پواسون|توزیع پوسان]] ===
+توزیع طبیعی با تابع چگالی احتمال <math>{\displaystyle p(k)={\frac {\lambda ^{k}}{k!}}e^{-\lambda }}</math> و پارامتر <math>\lambda</math> به شکل پایین محاسبه می‌شود، در این محاسبه <math>\mu = \lambda</math>:
+<math> \operatorname{Var}(X) = \left(\sum_{k=0}^\infty k^2 \frac{\lambda^k}{k!} e^{-\lambda}\right) - \mu^2 = \lambda</math>
 == واژه‌شناسی ==