ضریب همبستگی رتبه‌ای اسپیرمن

ضریب همبستگی رتبه‌ای اسپیرمن ^[۱] آماره‌ای ناپارامتری برای سنجش ضریب همبستگی بین دو متغیر تصادفی است. این ضریب را معمولاً با ρ یا $r_{s}$ نشان می‌دهند.

بیان آماری[ویرایش]

مقدار ضریب همبستگی رتبه‌ای اسپیرمن مبین قابلیت بیان یک متغیر به صورت تابعی یکنوا از متغیر دیگر است. همبستگی کامل پیرسون (۱+ یا ۱-) در جاییست که متغیری تابعی یکنوا از متغیر دیگر باشد. صفر بودن این ضریب دلیل استقلال متقابل است. لازم به ذکر است که از ضریب اسپیرمن تنها در شرایطی استفاده می‌شود که دادههای ورودی رتبه‌ای باشند. روش های دیگری مانند تای کندال را می توان به‌جای ضریب همبستگی اسپیرمن استفاده نمود که همانند روش اسپیرمن یک روش ناپارامتری محسوب می شود.

اگر n زوج داده به صورت $(X_{i},Y_{i})$ داده شده‌باشند و رتبهٔ هر داده را به صورت $(x_{i},y_{i})$ تعریف کنیم، ضریب اسپیرمن از طریق فرمول زیر محاسبه می گردد^[۲]^[۳]:

$r_{s}=1-{\frac {6\sum d_{i}^{2}}{n(n^{2}-1)}}$

بطوریکه مقدار $d_{i}$ بیانگر فاصله بین دو رنک در مشاهدات است که از طریق فرمول $d_{i}=\operatorname {R} (x_{i})-\operatorname {R} (y_{i})$ محاسبه می گردد و $n$ بیانگر تعداد مشاهدات است.

همچنین، این ضریب را می‌توان به صورت ضریب همبستگی پیرسون بین داده‌های رتبه‌بندی شده تعریف کرد. به عنوان مثال، اگر n زوج داده به صورت $(X_{i},Y_{i})$ داده شده‌باشند، ابتدا رتبهٔ هر داده را به صورت $(x_{i},y_{i})$ حساب کرده و سپس ضریب همبستگی اسپیرمن را به صورت زیر حساب می‌کنیم:

\rho ={\frac {\sum _{i}(x_{i}-{\bar {x}})(y_{i}-{\bar {y}})}{\sqrt {\sum _{i}(x_{i}-{\bar {x}})^{2}\sum _{i}(y_{i}-{\bar {y}})^{2}}}}

به داده‌های تکراری مقدار میانگین رتبه‌ها را اختصاص می‌دهیم. جدول زیر مثالی از محاسبهٔ رتبه را نشان می‌دهد:

Variable $X_{i}$	Position in the ascending order	Rank $x_{i}$
۰٫۸	۱	۱
1.2	2	${\frac {2+3}{2}}=2.5\$
1.2	3	${\frac {2+3}{2}}=2.5\$
۲٫۳	۴	۴
۱۸	۵	۵

فرض کنید دو سری دیتا رتبه ای به‌صورت جدول زیر وجود دارد. می خواهیم مقدار ضریب اسپیرمن را برای این دیتاها محاسبه نماییم.


$y_{i}$	$x_{i}$
1	1
2	3
3	2

مقدار ضریب اسپیرمن برای این دو سری دیتا 0.5 خواهد بود که بیانگر مشابهت آنها می باشد. نحوه محاسبه ضریب اسپیرمن به‌صورت زیر است:

$r_{s}=1-{\frac {6\sum d_{i}^{2}}{n(n^{2}-1)}}=1-{\frac {6*((1-1)^{2}+(3-2)^{2}+(2-3)^{2})}{3(3^{2}-1)}}=0.5$

نمونه کد ساده[ویرایش]

در متلب، تابع corr برای این منظور است؛ مثلاً در کد زیر:

N=5; % No. of nodes

x = randn(N,1); y = randn(N,1);

[r,p] = corr(x,y,'type','Spearman');

z(N,2)=0; z(:,1)=x(:,1);z(:,2)=y(:,1);z2=sortrows(z,1);zx=z2(:,1);zy=z2(:,2);

fprintf(' Spearman"s rho= %g, P_Value= %g\n',r,p), plot(zx,zy,'ro-')

مقدار ضریب اسپیرمن و مقدار احتمال محاسبه می‌شوند. توجه شود که مقدار احتمال تابعی از ضریب اسپیرمن و شمار نمونه هاست.

ضریب اسپیرمن: مقدار تابعیت یکنوای صعودی یا نزولی دو بردار
مقدار احتمال: احتمال عدم وجود یک تابع یکنوا بین دو بردار

همچنین می توان مقدار ضریب اسپیرمن را در اکسل با استفاده از تابع CORREL(array1, array2) محاسبه نمود.

منابع[ویرایش]

↑ "Spearman's rank correlation coefficient". Wikipedia (به انگلیسی). 2022-05-12.
↑ Ataei, Younes; Mahmoudi, Amin; Feylizadeh, Mohammad Reza; Li, Deng-Feng (2020-01-01). "Ordinal Priority Approach (OPA) in Multiple Attribute Decision-Making". Applied Soft Computing (به انگلیسی). 86: 105893. doi:10.1016/j.asoc.2019.105893. ISSN 1568-4946.
↑ Spearman, C (2010-10-01). "The proof and measurement of association between two things". International Journal of Epidemiology. 39 (5): 1137–1150. doi:10.1093/ije/dyq191. ISSN 0300-5771.

[1] "Spearman's rank correlation coefficient". Wikipedia (به انگلیسی). 2022-05-12.

[2] Ataei, Younes; Mahmoudi, Amin; Feylizadeh, Mohammad Reza; Li, Deng-Feng (2020-01-01). "Ordinal Priority Approach (OPA) in Multiple Attribute Decision-Making". Applied Soft Computing (به انگلیسی). 86: 105893. doi:10.1016/j.asoc.2019.105893. ISSN 1568-4946.

[3] Spearman, C (2010-10-01). "The proof and measurement of association between two things". International Journal of Epidemiology. 39 (5): 1137–1150. doi:10.1093/ije/dyq191. ISSN 0300-5771.

[۱]

[۲]

[۳]