همبستگی و وابستگی

از ویکی‌پدیا، دانشنامهٔ آزاد
(تغییرمسیر از ضریب همبستگی)
پرش به: ناوبری، جستجو

ضریب همبستگی[۱] ابزاری آماری برای تعیین نوع و درجه رابطهٔ یک متغیر کمی با متغیر کمی دیگر است. ضریب همبستگی، یکی از معیارهای مورد استفاده در تعیین همبستگی دو متغیر است. ضریب همبستگی شدت رابطه و همچنین نوع رابطه (مستقیم یا معکوس) را نشان می‌دهد. این ضریب بین ۱ تا ۱- است و در عدم وجود رابطه بین دو متغیر، برابر صفر است.

همبستگی بین دو متغیر تصادفی X و Y به صورت زیر تعریف می‌شود:[۲]

\mathrm{corr}(X,Y)={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E[(X-\mu_X)(Y-\mu_Y)] \over \sigma_X\sigma_Y},

که در آن E عملگر امید ریاضی، cov به معنای کوواریانس، corr نماد معمول برای همبستگی (کوریلیشن) پیرسون، و سیگما نماد انحراف معیار است.

ضریب همبستگی پیرسون[ویرایش]

ضریب همبستگی پیرسون (به انگلیسی: Pearson Correlation Coefficient)، روشی پارامتری است و برای داده‌هایی با توزیع نرمال یا تعداد داده‌های زیاد استفاده می‌شود. ضریب همبستگی پیرسون بین -1 و 1 تغییر می کند.اگر r=1 بیانگر رابطه ی مستقیم کامل بین دو متغیر است ، رایطه ی مستقیم یا مثبت به این معناست که اگر یکی از متغیرها افزایش (کاهش) یابد، دیگری نیز افزایش (کاهش) می یابد. مانند رابطه ی بین میزان ساعات مطالعه در روز و معدل محصلین.

r=-1  نیز وجود یک رابطه ی معکوس کامل بین دو متغیر را نشان می دهد. رابطه ی معکوس یا منفی نشان می دهد که اگر یک متغیر افزایش یابد متغیردیگر کاهش می یابد و بالعکس.

زمانی که ضریب همبستگی برابر صفر است نشان می دهد که بین دو متغیر رابطه ی خطی وجود ندارد.

ضریب همبستگی اسپیرمن[ویرایش]

در صورتی که تعداد داده‌ها کم و فرض نرمال بودن آنها معقول نباشد، از ضریب همبستگی اسپیرمن (به انگلیسی: Spearman Correlation Coefficient) استفاده می‌شود. ضریب همبستگی‌ای که بر اساس رتبهٔ داده‌ها محاسبه می‌شود، توسط اسپیرمن محاسبه شده‌است.

تفاوت رگرسیون و همبستگی براساس هدف: هدف مدل های همبستگی بررسی میزان رابطه دو یا چند متغیر است در حالیکه رگرسیون به دنبال پیش بینی یک یا چند متغیر براساس یک یا چند متغیر دیگر است. از آنجا که رگرسیون برپایه داده های گذشته انجام می شود به آن عنوان Regression یعنی بازگشت به گذشته داده اند. بنابراین از نر هدف همبستگی میزان و شدت رابطه متغیرها را نشان می‌دهد اما رگرسیون معادله ای را برای پیش بینی متغیرها ارائه می کند.

تفاوت رگرسیون و همبستگی براساس روش: آنچه در خروجی نتایج رگرسیون و همبستگی باعث ایجاد تفاوت می شود آن است که در همبستگی همیشه اثرات متغیرها به صورت دو به دو مورد سنجش قرار می گیرد اما در یک مدل رگرسیون اثرات متغیرها به صورت همزمان بررسی می شود. یعنی در همبستگی رابطه متغیر X با متغیر Y به وجود یا عدم وجود متغیر Z ارتباطی ندارد اما اما در رگرسیون تاثیر متغیر X بر متغیر Y به وجود یا عدم وجود متغیر Z بستگی دارد.

جستارهای وابسته[ویرایش]

منابع[ویرایش]

  1. «همبستگی» [ریاضی] هم‌ارزِ «correlation coefficient» (انگلیسی)؛ منبع: گروه واژه‌گزینی و زیر نظر حسن حبیبی، «فارسی»، در (۱۳۷۶-۱۳۸۵)، فرهنگ واژه‌های مصوب فرهنگستان، تهران: انتشارات فرهنگستان زبان و ادب فارسی، شابک ‎۹۷۸-۹۶۴-۷۵۳۱-۷۷-۱ (ذیل سرواژهٔ ضریب همبستگی) 
  2. مشارکت‌کنندگان ویکی‌پدیا، «Correlation and dependence»، ویکی‌پدیای انگلیسی، دانشنامهٔ آزاد (بازیابی در ۲۸ آذر ۱۳۹۰).
  • کتاب «تحلیل‌های آماری با استفاده از SPSS» - دکتر منصور مومنی