قد نحتاج في كثير الأحيان لدراسة العلاقة بين متغرين أو أكثر مثل العلاقة وزن الإنسان والإصابة بمرض السكري. عندئذ نقوم بحساب معامل الارتباط (Correlation Coefficient) وهو قيمة رقمية تحدد إذا كان هناك علاقة إحصائية بين متغيرين او أكثر وهناك عدة أنواع من معاملات الارتباط:
معامل الإرتباط | إستخدامة |
معامل ارتباط بيرسون (Pearson correlation coefficient) |
يستخدم لدراسة قوة وإتجاه العلاقة الخطية بين متغيرين. |
معامل التصنيف الداخلي (intraclass correlation coefficient) | يستخدم لدراسة العلاقة بين وحدات مختلفة داخل نفس المجموعة |
معامل ارتباط سبيرمان للرتب (Spearman’s rank correlation coefficient) | يستخدم لدراسة العلاقة بين رتب متغيرات مختلفة او رتب مختلفة لنفس المتغير. |
معامل ارتباط كندال تاو للرتب (Kendall rank correlation coefficient) | يستخدم لدراسة العلاقة بين الرتب المشتركة بين متغيرين. |
معامل ارتباط بيرسون (Pearson correlation coefficient) :
يمكن إستخدام معامل ارتباط بيرسون لقياس قوة العلاقة الخطية بين متغيرين x و y بإستخدام الصيغة التالية:
\[
r=\frac{n\sum \sum_{i=1}^{n}x_{i}y_{i}-\left (\sum_{i=1}^{n}x_{i} \right )\left (\sum_{i=1}^{n}y_{i} \right )}{\sqrt{\left (n\sum_{i=1}^{n}x_{i}^{2}-\left (\sum_{i=1}^{n}x_{i} \right )^{2} \right )\left (n\sum_{i=1}^{n}y_{i}^{2}-\left (\sum_{i=1}^{n}y_{i} \right )^{2} \right )}}
\]
حيث أن n هو حجم العينة (عدد المشاهدات).
ملاحظات هامة:
1- معامل الارتباط بيرسون $
-1\leqslant r\leqslant 1$.
2- إذا كان $r=0$ فهذا يعني عدم وجود علاقة خطية ولاكن يمكن أن يكون هناك علاقة غير خطية ولذلك يفضل إستخدام شكل الإنتشار (scatter plot) لدراسة العلاقة بين المتغيرات بشكل أولي.
3- إذا كان معامل الإرتباط موجب فهذا يعني أن هناك علاقة خطية طردية اما إذا كان سالب فهناك علاقة عكسية.
شكل الإنشار لأنواع العلاقة الخطية: