انحراف معیار

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
متغیر تصادفی (آبی). انحراف معیار σ نمایندهٔ پخش‌شدگی مقادیر متغیر تصادفی حول مقدار میانگین، μ، است.

در آمار انحراف معیار[۱] (به انگلیسی: standard deviation) (که با نماد σ نشان داده می‌شود) یکی از شاخص‌های پراکندگی است که نشان می‌دهد به طور میانگین داده‌ها چه مقدار از مقدار متوسط فاصله دارند. اگر انحراف معیار مجموعه‌ای از داده‌ها نزدیک به صفر باشد، نشانه آن است که داده‌ها نزدیک به میانگین هستند و پراکندگی اندکی دارند؛ در حالی که انحراف معیار بزرگ بیانگر پراکندگی قابل توجه داده‌ها می‌باشد. انحراف معیار برابر با ریشه دوم واریانس است. خوبی آن نسبت به واریانس، این است که هم‌بعد با داده‌ها می‌باشد.

انحراف معیار برای تعیین ضریب اطمینان در تحلیل‌های آماری نیز به کار می‌رود. در مطالعات علمی، معمولاً داده‌های با انحراف معیار بیشتر از دو به عنوان داده‌های پرت در نظر گرفته و از تحلیل، خارج می‌شوند.

تاریخچه[ویرایش]

به نظر می‌رسد که نخستین بار، کارل پیرسون در نوشته‌های خود در سال ۱۸۹۴ از واژه انحراف معیار استفاده کرده‌است.[۲] این واژه جایگزینی برای واژه‌هایی شده‌است که پیش از آن مورد استفاده قرار می‌گرفتند.

نمونه عددی[ویرایش]

انحراف معیار برای یک مجموعه متناهی، برابر است با جذر مجموع میانگین مربعات اختلاف داده‌ها با میانگین آن‌ها. نمونه عددی زیر می‌تواند نحوه محاسبه انحراف معیار را نشان دهد. نمرات یک کلاس به صورت زیر اعلام شده‌است:

۱۲، ۱۶، ۱۸، ۲۰، ۱۵، ۱۸، ۱۴، ۱۷، ۱۳، ۱۷

تعداد داده‌ها (جمعیت) برابر ۱۰ است. نخست، میانگین داده‌ها محاسبه می‌شود:

۱۲+۱۶+۱۸+۲۰+۱۵+۱۸+۱۴+۱۷+۱۳+۱۷/۱۰=۱۶

سپس مربع اختلاف مقدار هر داده با میانگین به دست می‌آید:

(۱۲-۱۶)۲=۱۶ (۱۶-۱۶)۲
(۱۸–۱۶)۲ (۲۰–۱۶)۲=۱۶
(۱۵–۱۶)۲ (۱۸–۱۶)۲
(۱۴–۱۶)۲ (۱۷–۱۶)۲
(۱۳–۱۶)۲ (۱۷–۱۶)۲

در گام بعدی، واریانس داده‌ها که میانگین مجموع مربعات است، به دست می‌آید:

۱۶+۰+۴+۱۶+۱+۴+۴+۱+۹+۱/۱۰=۵٫۶

در گام نهایی، جذر واریانس به عنوان انحراف معیار داده‌ها در نظر گرفته می‌شود:

۵٫۶=۲٫۳۶۶۴
نمودار توزیع نرمال داده‌های تصادفی

مقدار انحراف معیار به دست آمده در صورتی درست است که از همه جمعیت موجود استفاده شود. اگر نمونه‌های تصادفی از داده‌ها انتخاب شده و انحراف معیار برای آن نمونه‌ها به دست آید، باید یک واحد از مقدار مخرج در گام پیش از نهایی کم شود. (در این مثال، باید به جای ۱۰، مقدار ۹ قرار گیرد.) این تغییر را اصلاح بسل می‌نامند.

معمولاً با افزایش تعداد داده‌ها توزیع آن‌ها به منحنی توزیع نرمال میل پیدا می‌کند. در توزیع نرمال، ۶۸٫۲٪ داده‌ها در فاصله کمتر از یک انحراف معیار نسبت به میانگین قرار دارند. این مقدار برای فاصله‌های دو و سه انحراف معیار، به ترتیب ۹۵٫۴٪ و ۹۹٫۷٪ است. به بیان دیگر، احتمال آن که اختلاف یک داده با میانگین، بیش از سه انحراف معیار باشد، تنها ۰٫۳٪ (تقریباً معادل ۱ در ۳۰۰) است.

تعریف ریاضی[ویرایش]

اگر Χ یک متغیر تصادفی با میانگین μ باشد:

\operatorname{E}[X] = \mu

عملگر Ε امید ریاضی متغیر Χ را نشان می‌دهد. به این ترتیب، انحراف معیار را می‌توان با استفاده از ویژگی‌های عملگر امید ریاضی، به صورت زیر تعریف کرد:

\begin{align}
\sigma & = \sqrt{\operatorname E[(X - \mu)^2]}\\
& =\sqrt{\operatorname E[X^2] + \operatorname E[(-2 \mu X)] + \operatorname E[\mu^2]}
=\sqrt{\operatorname E[X^2] -2 \mu \operatorname E[X] + \mu^2}\\
&=\sqrt{\operatorname E[X^2] -2 \mu^2 + \mu^2}
=\sqrt{\operatorname E[X^2] - \mu^2}\\
& =\sqrt{\operatorname E[X^2]-(\operatorname E[X])^2}
\end{align}

متغیر تصادفی گسسته[ویرایش]

اگر Χ شامل داده‌های تصادفی یک مجموعه متناهی باشد، احتمال وقوع همه مقادیر یکسان است. در این حالت، انحراف معیار برابر است با:

\sigma = \sqrt{\frac{1}{N}\left[(x_1-\mu)^2 + (x_2-\mu)^2 + \cdots + (x_N - \mu)^2\right]}, \mu = \frac{1}{N} (x_1 + \cdots + x_N)

که می‌توان با استفاده از علامت جمع، آن را به صورت زیر نیز نشان داد:

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}, \mu = \frac{1}{N} \sum_{i=1}^N x_i

اگر مقدارهای مختلف، دارای احتمالات مختلف باشند؛ یعنی متغیر xi دارای احتمال وقوع pi باشد، انحراف معیار به صورت زیر در می‌آید:

\sigma = \sqrt{\sum_{i=1}^N p_i(x_i - \mu)^2}, \mu = \sum_{i=1}^N p_i x_i

متغیر تصادفی پیوسته[ویرایش]

انحراف معیار متغیر پیوسته X با تابع احتمال (p(x با بهره گرفتن از رابطه زیر به دست می‌آید:

\sigma = \sqrt{\int_\mathbf{X} (x-\mu)^2 \, p(x) \, dx}, \mu = \int_\mathbf{X} x \, p(x) \, dx

تخمین[ویرایش]

اگر نتوان از همه جامعه آماری، برای محاسبه انحراف معیار استفاده کرد، بخشی از آن به عنوان نمونه تصادفی انتخاب می‌شود و انحراف معیار برای آن به دست می‌آید. این مقدار را به عنوان برآوردگر می شناسند و با پارامتر s نشان داده می‌شود.

خطای استاندارد[ویرایش]

برای محاسبه خطا (error bar) اگر انحراف معیار را بر ریشه دوم تعداد داده‌ها تقسیم کنیم مقدار خطا بدست می‌آید

S_{e}=\frac{\sigma}{\sqrt{N}}=\sqrt{\frac{1}{N(N-1)}\sum_{i=1}^{N}(x_{i}-\bar{x})^2}

جستارهای وابسته[ویرایش]

منابع[ویرایش]

  1. انحراف معیار [ریاضی] هم‌ارزِ standard deviation (انگلیسی)؛ منبع: گروه واژه‌گزینی و زیر نظر غلامعلی حدادعادل، «لاتین»، در دفتر ششم، فرهنگ واژه‌های مصوب فرهنگستان، تهران: انتشارات فرهنگستان زبان و ادب فارسی، شابک ‎۹۷۸-۹۶۴-۷۵۳۱-۸۵-۶ (ذیل سرواژهٔ standard deviation) 
  2. Dodge, Yadolah (2003). The Oxford Dictionary of Statistical Terms. Oxford University Press. ISBN 0-19-920613-9.