خط ۱۴۷:
خط ۱۴۷:
{{پایان}}
{{پایان}}
=== توزیع طبیعی ===
===[[ توزیع طبیعی]] ===
توزیع طبیعی با تابع چگالی احتمال <math>
توزیع طبیعی با تابع چگالی احتمال <math>
f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} e^{ -\frac{(x-\mu)^2}{2\sigma^2} }
f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} e^{ -\frac{(x-\mu)^2}{2\sigma^2} }
خط ۱۵۸:
خط ۱۵۸:
{{پایان}}
{{پایان}}
=== توزیع نمایی ===
===[[ توزیع نمایی]] ===
توزیع طبیعی با تابع چگالی احتمال <math>f(x) = \lambda e^{-\lambda x}</math>و پارامتر <math>\lambda</math> به شکل پایین محاسبه میشود، در این محاسبه <math>\mu = \lambda^{-1}</math>:
توزیع طبیعی با تابع چگالی احتمال <math>f(x) = \lambda e^{-\lambda x}</math>و پارامتر <math>\lambda</math> به شکل پایین محاسبه میشود، در این محاسبه <math>\mu = \lambda^{-1}</math>:
<math>\operatorname{Var}(X) = \int_0^\infty x^2 \lambda e^{-\lambda x} \, dx - \mu^2 = \lambda^{-2}</math>
<math>\operatorname{Var}(X) = \int_0^\infty x^2 \lambda e^{-\lambda x} \, dx - \mu^2 = \lambda^{-2}</math>
=== [[توزیع پواسون|توزیع پوسان]] ===
توزیع طبیعی با تابع چگالی احتمال <math>{\displaystyle p(k)={\frac {\lambda ^{k}}{k!}}e^{-\lambda }}</math> و پارامتر <math>\lambda</math> به شکل پایین محاسبه میشود، در این محاسبه <math>\mu = \lambda</math>:
<math> \operatorname{Var}(X) = \left(\sum_{k=0}^\infty k^2 \frac{\lambda^k}{k!} e^{-\lambda}\right) - \mu^2 = \lambda</math>
== واژهشناسی ==
== واژهشناسی ==
در نظریه احتمالات و آمار وردایی [۱] یا واریانس نوعی سنجش پراکندگی است.
مقدار وردایی با میانگینگیری از مربع فاصله مقدار محتمل یا مشاهده شده با مقدار مورد انتظار محاسبه میشود. در مقایسه با میانگین میتوان گفت که میانگین مکان توزیع را نشان میدهد، در حالی که وردایی مقیاسی است که نشان میدهد که دادهها حول میانگین چگونه پخش شدهاند. وردایی کمتر بدین معنا است که انتظار میرود که اگر نمونهای از توزیع مزبور انتخاب شود مقدار آن به میانگین نزدیک باشد. یکای وردایی مربع یکای کمیت اولیه میباشد. ریشه دوم وردایی که انحراف معیار نامیده میشود دارای واحدی یکسان با متغیر اولیه است.
واریانس یا وردایی عددی است که نشان میدهد چگونه یک سری داده حول مقدار میانگین پخش میشوند. برای تعریف وردایی اگر فرض کنیم که متغیر تکی
X
{\displaystyle X}
دارای توزیع
p
(
x
)
{\displaystyle p(x)}
است و متوسط توزیع جمعیت آن را با
μ
{\displaystyle \mu }
نشان دهیم آنگاه وردایی این جمعیت به صورت زیر تعیین میشود:
V
a
r
(
X
)
=
σ
2
≡
⟨
(
X
−
μ
)
2
⟩
{\displaystyle Var(X)=\sigma ^{2}\equiv \left\langle (X-\mu )^{2}\right\rangle }
حال اگر یک توزیع مجزا داشته باشیم که هر مجموعه داده در آن، دارای احتمال
p
(
x
)
{\displaystyle p(x)}
باشد، وردایی به صورت زیر محاسبه میشود:
σ
2
=
∑
i
=
1
N
p
(
x
i
)
(
x
i
−
μ
)
2
{\displaystyle \sigma ^{2}=\sum _{i=1}^{N}p(x_{i})(x_{i}-\mu )^{2}}
اما در بیشتر موارد توزیع حاکم بر دادهها مشخص نیست در این حالت وردایی را به صورت زیر تخمین میزنیم:
S
N
2
≡
1
N
∑
i
=
1
N
(
x
i
−
x
¯
)
2
{\displaystyle S_{N}^{2}\equiv {\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}
در این رابطه
x
¯
{\displaystyle {\overline {x}}}
میانگین (امید ریاضی ) دادههاست که خود از رابطهٔ زیر حساب میشود:
x
¯
=
1
N
∑
i
=
1
N
x
i
=
x
1
+
x
2
+
⋯
+
x
N
N
{\displaystyle {\overline {x}}={\frac {1}{N}}\sum _{i=1}^{N}x_{i}={\frac {x_{1}+x_{2}+\cdots +x_{N}}{N}}}
البته باید توجه داشت که تخمین فوق یک تخمین دقیق و بدون خطا برای وردایی نیست لذا برای از بین بردن این خطا در تخمین از وردایی تصحیح شدهاستفاده میکنیم که بصورت زیر تعریف میگردد
S
N
−
1
2
≡
1
N
−
1
∑
i
=
1
N
(
x
i
−
x
¯
)
2
{\displaystyle S_{N-1}^{2}\equiv {\frac {1}{N-1}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}
تعریف
اگر
μ
=
E
(
X
)
{\displaystyle \mu =\operatorname {E} (X)}
، امید ریاضی (میانگین ) متغیر تصادفی
X
{\displaystyle X}
باشد، آنگاه وردایی
X
{\displaystyle X}
برابر خواهد بود با:
Var
(
X
)
=
E
[
(
X
−
μ
)
2
]
=
E
[
X
2
−
2
μ
X
+
μ
2
]
=
E
[
X
2
]
−
2
μ
E
[
X
]
+
μ
2
=
E
[
X
2
]
−
2
μ
2
+
μ
2
=
E
[
X
2
]
−
μ
2
=
E
[
X
2
]
−
(
E
[
X
]
)
2
.
{\displaystyle {\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} [(X-\mu )^{2}]\\&=\operatorname {E} [X^{2}-2\mu X+\mu ^{2}]\\&=\operatorname {E} [X^{2}]-2\mu \,\operatorname {E} [X]+\mu ^{2}\\&=\operatorname {E} [X^{2}]-2\mu ^{2}+\mu ^{2}\\&=\operatorname {E} [X^{2}]-\mu ^{2}\\&=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}.\end{aligned}}}
برای به خاطر سپردن راحتتر این فرمول گفتهمیشود وردایی برابر است با «میانگین مجذور، منهای مجذور میانگین». وردایی متغیر تصادفی X را معمولاً با Var(X ) یا
σ
X
2
{\displaystyle \scriptstyle \sigma _{X}^{2}}
یا به صورت سادهتر σ2 (تلفظ میشود سیگما -دو) نمایش میدهند.
حالت گسسته
اگر
X
{\displaystyle X}
یک متغیر تصادفی با تابع جرم احتمال به این شکل باشد
x
1
↦
p
1
,
x
2
↦
p
2
,
…
,
x
n
↦
p
n
{\displaystyle x_{1}\mapsto p_{1},x_{2}\mapsto p_{2},\ldots ,x_{n}\mapsto p_{n}}
آنگاه واریانس آن به این شکل محاسبه میشود.
Var
(
X
)
=
∑
i
=
1
n
p
i
⋅
(
x
i
−
μ
)
2
,
{\displaystyle \operatorname {Var} (X)=\sum _{i=1}^{n}p_{i}\cdot (x_{i}-\mu )^{2},}
عبارت پیشین با معادله پایین معادل است:
Var
(
X
)
=
(
∑
i
=
1
n
p
i
x
i
2
)
−
μ
2
,
{\displaystyle \operatorname {Var} (X)=\left(\sum _{i=1}^{n}p_{i}x_{i}^{2}\right)-\mu ^{2},}
در اینجا
μ
{\displaystyle \mu }
امید ریاضی
X
{\displaystyle X}
است.
μ
=
∑
i
=
1
n
p
i
x
i
.
{\displaystyle \mu =\sum _{i=1}^{n}p_{i}x_{i}.}
واریانس
n
{\displaystyle n}
مقدار که از لحاظ احتمال با یکدیگر برابرند با عبارت پایین برابر خواهد بود:
Var
(
X
)
=
1
n
∑
i
=
1
n
(
x
i
−
μ
)
2
,
{\displaystyle \operatorname {Var} (X)={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-\mu )^{2},}
در اینجا
μ
{\displaystyle \mu }
میانگین
n
{\displaystyle n}
دادهاست:
μ
=
1
n
∑
i
=
1
n
x
i
.
{\displaystyle \mu ={\frac {1}{n}}\sum _{i=1}^{n}x_{i}.}
البته واریانس این
n
{\displaystyle n}
داده را بدون در نظرگرفتن میانگین آنها هم میشود به شکل پایین محاسبه کرد:[۲]
Var
(
X
)
=
1
n
2
∑
i
=
1
n
∑
j
=
1
n
1
2
(
x
i
−
x
j
)
2
=
1
n
2
∑
i
∑
j
>
i
(
x
i
−
x
j
)
2
.
{\displaystyle \operatorname {Var} (X)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\sum _{j=1}^{n}{\frac {1}{2}}(x_{i}-x_{j})^{2}={\frac {1}{n^{2}}}\sum _{i}\sum _{j>i}(x_{i}-x_{j})^{2}.}
حالت پیوسته
Var
(
X
)
=
σ
2
=
∫
(
x
−
μ
)
2
f
(
x
)
d
x
=
∫
x
2
f
(
x
)
d
x
−
2
μ
∫
x
f
(
x
)
d
x
+
∫
μ
2
f
(
x
)
d
x
=
∫
x
2
d
F
(
x
)
−
2
μ
∫
x
d
F
(
x
)
+
μ
2
∫
d
F
(
x
)
=
∫
x
2
d
F
(
x
)
−
2
μ
⋅
μ
+
μ
2
⋅
1
=
∫
x
2
d
F
(
x
)
−
μ
2
,
{\displaystyle {\begin{aligned}\operatorname {Var} (X)=\sigma ^{2}&=\int (x-\mu )^{2}f(x)\,dx\\[4pt]&=\int x^{2}f(x)\,dx-2\mu \int xf(x)\,dx+\int \mu ^{2}f(x)\,dx\\[4pt]&=\int x^{2}\,dF(x)-2\mu \int x\,dF(x)+\mu ^{2}\int \,dF(x)\\[4pt]&=\int x^{2}\,dF(x)-2\mu \cdot \mu +\mu ^{2}\cdot 1\\[4pt]&=\int x^{2}\,dF(x)-\mu ^{2},\end{aligned}}}
در اینجا میانگین یا
μ
{\displaystyle \mu }
به این شکل محاسبه میشود:
μ
=
∫
x
f
(
x
)
d
x
,
{\displaystyle \mu =\int x\,f(x)\,dx\,,}
خواص
واریانس همیشه غیرمنفی است:
Var
(
X
)
≥
0.
{\displaystyle \operatorname {Var} (X)\geq 0.}
واریانس متغیر تصادفی ثابت همیشه صفر است به این معنی که:
P
(
X
=
a
)
=
1
⟺
Var
(
X
)
=
0.
{\displaystyle P(X=a)=1\iff \operatorname {Var} (X)=0.}
اگر به متغیر تصادفی مقداری ثابت اضافه شود در واریانس متغیر تصادفی جدید تغییری ایجاد نمیشود:
Var
(
X
+
a
)
=
Var
(
X
)
.
{\displaystyle \operatorname {Var} (X+a)=\operatorname {Var} (X).}
اگر متغیر تصادفی در مقداری ثابت ضرب شود، واریانس متغیر تصادفی جدید در مربع مقدار ثابت قبلی ضرب میشود:
Var
(
a
X
)
=
a
2
Var
(
X
)
.
{\displaystyle \operatorname {Var} (aX)=a^{2}\operatorname {Var} (X).}
واریانس ترکیب خطی دو متغیر تصادفی به این شکل محاسبه میشود:
Var
(
a
X
+
b
Y
)
=
a
2
Var
(
X
)
+
b
2
Var
(
Y
)
+
2
a
b
Cov
(
X
,
Y
)
,
{\displaystyle \operatorname {Var} (aX+bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)+2ab\,\operatorname {Cov} (X,Y),}
Var
(
a
X
−
b
Y
)
=
a
2
Var
(
X
)
+
b
2
Var
(
Y
)
−
2
a
b
Cov
(
X
,
Y
)
,
{\displaystyle \operatorname {Var} (aX-bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)-2ab\,\operatorname {Cov} (X,Y),}
به صورت کلی جمع
N
{\displaystyle N}
متغیر تصادفی به شکل پایین محاسبه میشود:
Var
(
∑
i
=
1
N
X
i
)
=
∑
i
,
j
=
1
N
Cov
(
X
i
,
X
j
)
=
∑
i
=
1
N
Var
(
X
i
)
+
∑
i
≠
j
Cov
(
X
i
,
X
j
)
.
{\displaystyle \operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i,j=1}^{N}\operatorname {Cov} (X_{i},X_{j})=\sum _{i=1}^{N}\operatorname {Var} (X_{i})+\sum _{i\neq j}\operatorname {Cov} (X_{i},X_{j}).}
واریانس ترکیب خطی
N
{\displaystyle N}
متغیر تصادفی به شکل پایین محاسبه میشود:
Var
(
∑
i
=
1
N
a
i
X
i
)
=
∑
i
,
j
=
1
N
a
i
a
j
Cov
(
X
i
,
X
j
)
=
∑
i
=
1
N
a
i
2
Var
(
X
i
)
+
∑
i
≠
j
a
i
a
j
Cov
(
X
i
,
X
j
)
=
∑
i
=
1
N
a
i
2
Var
(
X
i
)
+
2
∑
1
≤
i
<
j
≤
N
a
i
a
j
Cov
(
X
i
,
X
j
)
.
{\displaystyle {\begin{aligned}\operatorname {Var} \left(\sum _{i=1}^{N}a_{i}X_{i}\right)&=\sum _{i,j=1}^{N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+\sum _{i\not =j}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+2\sum _{1\leq i<j\leq N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j}).\end{aligned}}}
اگر کوواریانس این متغیرهای تصادفی نسبت به هم صفر باشد یعنی
Cov
(
X
i
,
X
j
)
=
0
,
∀
(
i
≠
j
)
,
{\displaystyle \operatorname {Cov} (X_{i},X_{j})=0\ ,\ \forall \ (i\neq j),}
آنگاه:
Var
(
∑
i
=
1
N
X
i
)
=
∑
i
=
1
N
Var
(
X
i
)
.
{\displaystyle \operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i=1}^{N}\operatorname {Var} (X_{i}).}
مثال
تاس
اگر یک تاس داشته باشیم که احتمال آمدن هر عدد
1
6
{\displaystyle {\frac {1}{6}}}
باشد، آنگاه امید ریاضی تاس با
(
1
+
2
+
3
+
4
+
5
+
6
)
6
{\displaystyle {\frac {(1+2+3+4+5+6)}{6}}}
برابر خواهد بود و واریانس تاس می شود:
Var
(
X
)
=
∑
i
=
1
6
1
6
(
i
−
7
2
)
2
=
1
6
(
(
−
5
/
2
)
2
+
(
−
3
/
2
)
2
+
(
−
1
/
2
)
2
+
(
1
/
2
)
2
+
(
3
/
2
)
2
+
(
5
/
2
)
2
)
=
35
12
≈
2.92.
{\displaystyle {\begin{aligned}\operatorname {Var} (X)&=\sum _{i=1}^{6}{\frac {1}{6}}\left(i-{\frac {7}{2}}\right)^{2}\\[5pt]&={\frac {1}{6}}\left((-5/2)^{2}+(-3/2)^{2}+(-1/2)^{2}+(1/2)^{2}+(3/2)^{2}+(5/2)^{2}\right)\\[5pt]&={\frac {35}{12}}\approx 2.92.\end{aligned}}}
به صورت کلیتر اگر یک متغیر گسسته تصادفی داشته باشیم که
n
{\displaystyle n}
مقدار بگیرد و احتمال هر کدام از این مقادیر
1
n
{\displaystyle {\frac {1}{n}}}
باشد، واریانس متغیر تصادفی ما برابر خواهد بود با:
Var
(
X
)
=
E
(
X
2
)
−
(
E
(
X
)
)
2
=
1
n
∑
i
=
1
n
i
2
−
(
1
n
∑
i
=
1
n
i
)
2
=
(
n
+
1
)
(
2
n
+
1
)
6
−
(
n
+
1
2
)
2
=
n
2
−
1
12
.
{\displaystyle {\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}i^{2}-\left({\frac {1}{n}}\sum _{i=1}^{n}i\right)^{2}\\[5pt]&={\frac {(n+1)(2n+1)}{6}}-\left({\frac {n+1}{2}}\right)^{2}\\[4pt]&={\frac {n^{2}-1}{12}}.\end{aligned}}}
توزیع طبیعی با تابع چگالی احتمال
f
(
x
)
=
1
2
π
σ
2
e
−
(
x
−
μ
)
2
2
σ
2
{\displaystyle f(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}}
و پارامترهای
μ
{\displaystyle \mu }
و
σ
{\displaystyle \sigma }
به شکل پایین محاسبه میشود:
Var
(
X
)
=
∫
−
∞
∞
x
2
2
π
σ
2
e
−
(
x
−
μ
)
2
2
σ
2
d
x
−
μ
2
=
σ
2
{\displaystyle \operatorname {Var} (X)=\int _{-\infty }^{\infty }{\frac {x^{2}}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}\,dx-\mu ^{2}=\sigma ^{2}}
توزیع طبیعی با تابع چگالی احتمال
f
(
x
)
=
λ
e
−
λ
x
{\displaystyle f(x)=\lambda e^{-\lambda x}}
و پارامتر
λ
{\displaystyle \lambda }
به شکل پایین محاسبه میشود، در این محاسبه
μ
=
λ
−
1
{\displaystyle \mu =\lambda ^{-1}}
:
Var
(
X
)
=
∫
0
∞
x
2
λ
e
−
λ
x
d
x
−
μ
2
=
λ
−
2
{\displaystyle \operatorname {Var} (X)=\int _{0}^{\infty }x^{2}\lambda e^{-\lambda x}\,dx-\mu ^{2}=\lambda ^{-2}}
توزیع طبیعی با تابع چگالی احتمال
p
(
k
)
=
λ
k
k
!
e
−
λ
{\displaystyle {\displaystyle p(k)={\frac {\lambda ^{k}}{k!}}e^{-\lambda }}}
و پارامتر
λ
{\displaystyle \lambda }
به شکل پایین محاسبه میشود، در این محاسبه
μ
=
λ
{\displaystyle \mu =\lambda }
:
Var
(
X
)
=
(
∑
k
=
0
∞
k
2
λ
k
k
!
e
−
λ
)
−
μ
2
=
λ
{\displaystyle \operatorname {Var} (X)=\left(\sum _{k=0}^{\infty }k^{2}{\frac {\lambda ^{k}}{k!}}e^{-\lambda }\right)-\mu ^{2}=\lambda }
واژهشناسی
فرهنگستان زبان فارسی، وردیدن از ریشه باستانی ورت (ورتیدن)، را بجای فعل to varry برگزیده است و از این فعل مشتقات وردایی (variance)،وردش (variation)، وردا (variant)، هموردا (covariant)، هم وردایی (covariannce)، ناوردا (invariant)، ناوردایی (invariance)، پادوردا (contravariance) را برساخته است.
تخمین واریانس یک تابع
برای تخمین واریانس یک تابع از بسط تیلور آن به صورت پایین استفاده میکنند.
Var
[
f
(
X
)
]
≈
(
f
′
(
E
[
X
]
)
)
2
Var
[
X
]
{\displaystyle \operatorname {Var} \left[f(X)\right]\approx \left(f'(\operatorname {E} \left[X\right])\right)^{2}\operatorname {Var} \left[X\right]}
جستارهای وابسته
منابع
page ۱۱۷٬۴۳ introduction to probabilities models by Sheldon M.Ross
مشارکتکنندگان ویکیپدیا. «Variance ». در دانشنامهٔ ویکیپدیای انگلیسی ، بازبینیشده در ۲۲ فوریه ۲۰۰۸.