计算样本协方差在统计学中,协方差一个用于衡量两个变量之间线性关系的指标。它可以帮助我们了解两个变量是同向变化还是反向变化。而“样本协方差”则是基于一组样本数据计算出的协方差值,相较于总体协方差,更常用于实际数据分析。
一、什么是样本协方差?
样本协方差(Sample Covariance)用于描述两个变量在样本数据中的变化动向。如果协方差为正,说明两个变量呈正相关;如果协方差为负,则说明两者呈负相关;如果协方差接近于零,则表示两者没有明显的线性关系。
样本协方差的计算公式如下:
$$
\textCov}(X, Y) = \frac1}n – 1} \sum_i=1}^n} (x_i – \barx})(y_i – \bary})
$$
其中:
– $ x_i $ 和 $ y_i $ 是第 $ i $ 个样本对的观测值;
– $ \barx} $ 和 $ \bary} $ 分别是变量 $ X $ 和 $ Y $ 的样本均值;
– $ n $ 是样本数量。
注意:分母使用 $ n – 1 $ 而不是 $ n $,是为了得到无偏估计。
二、计算步骤
1. 收集样本数据:获取两组变量的数据对 $(x_1, y_1), (x_2, y_2), …, (x_n, y_n)$。
2. 计算均值:分别求出 $ X $ 和 $ Y $ 的样本均值 $ \barx} $ 和 $ \bary} $。
3. 计算偏差乘积:对每个样本点,计算 $ (x_i – \barx})(y_i – \bary}) $。
4. 求和并除以 $ n – 1 $:将所有偏差乘积相加,再除以 $ n – 1 $,得到样本协方差。
三、示例计算
假设我们有下面内容样本数据:
| 样本编号 | $ x_i $ | $ y_i $ |
| 1 | 2 | 5 |
| 2 | 4 | 7 |
| 3 | 6 | 9 |
步骤1:计算均值
$$
\barx} = \frac2 + 4 + 6}3} = 4 \\
\bary} = \frac5 + 7 + 9}3} = 7
$$
步骤2:计算偏差乘积
| 样本编号 | $ x_i – \barx} $ | $ y_i – \bary} $ | 偏差乘积 |
| 1 | -2 | -2 | 4 |
| 2 | 0 | 0 | 0 |
| 3 | 2 | 2 | 4 |
步骤3:求和并计算协方差
$$
\sum (x_i – \barx})(y_i – \bary}) = 4 + 0 + 4 = 8 \\
\text样本协方差} = \frac8}3 – 1} = 4
$$
四、拓展资料表格
| 指标 | 数值 |
| 样本数量 $ n $ | 3 |
| $ \barx} $ | 4 |
| $ \bary} $ | 7 |
| 协方差 | 4 |
通过上述技巧,我们可以准确地计算出样本协方差,从而更好地领会两个变量之间的关系。在实际应用中,样本协方差常与相关系数结合使用,以更全面地分析变量间的关系。

