【相关系数r的计算】在统计学中,相关系数r是用来衡量两个变量之间线性关系强度和方向的一个重要指标。它的取值范围在-1到1之间,其中:
- r = 1 表示完全正相关;
- r = -1 表示完全负相关;
- r = 0 表示无线性相关。
本文将总结相关系数r的计算方法,并通过一个具体例子进行展示。
相关系数r的计算公式
相关系数r的计算公式如下:
$$
r = \frac{n\sum xy - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}
$$
其中:
- $ n $ 是样本数量;
- $ x $ 和 $ y $ 是两个变量的观测值;
- $ \sum xy $ 是每个x与y乘积的总和;
- $ \sum x $ 和 $ \sum y $ 分别是x和y的总和;
- $ \sum x^2 $ 和 $ \sum y^2 $ 分别是x和y的平方和。
计算步骤总结
步骤 | 内容 |
1 | 收集两组数据(x, y)并列出原始数据表 |
2 | 计算每对数据的乘积xy,以及x²、y² |
3 | 求出所有x、y、xy、x²、y²的总和 |
4 | 将总和代入相关系数r的计算公式 |
5 | 计算结果,得出相关系数r |
示例计算
假设我们有以下两组数据:
x | y | xy | x² | y² |
1 | 2 | 2 | 1 | 4 |
2 | 4 | 8 | 4 | 16 |
3 | 6 | 18 | 9 | 36 |
4 | 8 | 32 | 16 | 64 |
5 | 10 | 50 | 25 | 100 |
计算总和:
- $ \sum x = 1+2+3+4+5 = 15 $
- $ \sum y = 2+4+6+8+10 = 30 $
- $ \sum xy = 2+8+18+32+50 = 110 $
- $ \sum x^2 = 1+4+9+16+25 = 55 $
- $ \sum y^2 = 4+16+36+64+100 = 220 $
代入公式:
$$
r = \frac{5 \times 110 - (15 \times 30)}{\sqrt{[5 \times 55 - (15)^2][5 \times 220 - (30)^2]}}
$$
$$
r = \frac{550 - 450}{\sqrt{[275 - 225][1100 - 900]}} = \frac{100}{\sqrt{50 \times 200}} = \frac{100}{\sqrt{10000}} = \frac{100}{100} = 1
$$
结论
该例中,x和y之间的相关系数r为1,说明两者存在完全正相关关系。
通过以上步骤,我们可以清晰地了解如何计算相关系数r,并根据实际数据判断变量之间的线性关系。在实际应用中,相关系数可以帮助我们分析数据之间的联系,为后续建模或决策提供依据。