【样本标准差公式】在统计学中,样本标准差是衡量一组数据与其平均值之间差异程度的重要指标。它可以帮助我们了解数据的离散程度,从而对数据的分布情况做出更准确的判断。样本标准差与总体标准差有所不同,主要在于计算时使用的分母不同,即样本标准差使用的是“n-1”而不是“n”。
一、样本标准差的定义
样本标准差(Sample Standard Deviation)是用于描述一个样本数据集中各数据点与该样本均值之间差异大小的统计量。它的计算基于样本数据,因此在实际应用中更为常见。
二、样本标准差的计算公式
样本标准差的计算公式如下:
$$
s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n}(x_i - \bar{x})^2}
$$
其中:
- $ s $:样本标准差
- $ n $:样本容量(数据个数)
- $ x_i $:第 $ i $ 个数据点
- $ \bar{x} $:样本均值
- $ \sum $:求和符号
注意:这里的分母是 $ n-1 $,这是为了对总体标准差进行无偏估计,称为“贝塞尔修正”。
三、计算步骤
1. 计算样本均值:将所有数据相加,除以数据个数 $ n $。
2. 计算每个数据点与均值的差:即 $ x_i - \bar{x} $。
3. 平方每个差值:得到 $ (x_i - \bar{x})^2 $。
4. 求这些平方差的总和:即 $ \sum (x_i - \bar{x})^2 $。
5. 除以 $ n-1 $:得到方差。
6. 开平方:得到样本标准差。
四、样本标准差与总体标准差的区别
| 比较项 | 样本标准差 | 总体标准差 |
| 公式 | $ s = \sqrt{\frac{1}{n-1} \sum (x_i - \bar{x})^2} $ | $ \sigma = \sqrt{\frac{1}{N} \sum (x_i - \mu)^2} $ |
| 分母 | $ n-1 $(无偏估计) | $ N $(全部数据) |
| 应用场景 | 用于样本数据的分析 | 用于整个总体的数据分析 |
| 计算目的 | 估计总体标准差 | 精确描述总体数据的离散程度 |
五、示例说明
假设有一个样本数据集:$ 5, 7, 8, 10, 12 $
1. 计算均值:
$$
\bar{x} = \frac{5 + 7 + 8 + 10 + 12}{5} = \frac{42}{5} = 8.4
$$
2. 计算每个数据点与均值的差并平方:
- $ (5 - 8.4)^2 = 11.56 $
- $ (7 - 8.4)^2 = 1.96 $
- $ (8 - 8.4)^2 = 0.16 $
- $ (10 - 8.4)^2 = 2.56 $
- $ (12 - 8.4)^2 = 12.96 $
3. 求和:
$$
11.56 + 1.96 + 0.16 + 2.56 + 12.96 = 29.2
$$
4. 除以 $ n-1 = 4 $:
$$
\frac{29.2}{4} = 7.3
$$
5. 开平方:
$$
s = \sqrt{7.3} \approx 2.70
$$
因此,该样本的标准差约为 2.70。
六、总结
样本标准差是统计分析中非常重要的工具,能够帮助我们理解数据的波动性。通过合理的计算步骤和公式,我们可以准确地估算出样本数据的离散程度。在实际应用中,应根据数据来源选择适当的公式,确保结果的准确性与合理性。


