什么是样本方差?
样本方差(s²)用来衡量一组数据相对于平均数的离散程度。它本质上是各数据点到平均数距离的平方的平均值,但分母用的是 n − 1 而不是 n。除以 n − 1(即贝塞尔校正,Bessel correction)能让计算结果成为对真实总体方差的无偏估计——当你手头只有部分样本、而非全部总体数据时尤其重要。
如何使用本计算器
用逗号或空格分隔你的数据即可,例如 4, 8, 15, 16, 23, 42。计算器会返回样本方差、样本标准差、平均数、数据个数以及离差平方和,方便你逐步核对每个中间结果。
公式详解
第一步,求平均数 \(\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i\)。第二步,把每个数值减去平均数,再对差值求平方。第三步,将这些离差的平方相加,得到 \(\sum_{i=1}^{n}\left(x_i - \bar{x}\right)^{2}\)。最后,除以 n − 1 即得样本方差;再对结果开平方,就得到样本标准差 \(s\)。
$$s^{2} = \frac{1}{n-1}\sum_{i=1}^{n}\left(x_i - \bar{x}\right)^{2} \qquad \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i$$
实例演算
以数据集 4, 8, 15, 16, 23, 42 为例:总和为 108,n = 6,因此平均数为 18。各项离差的平方分别是 196、100、9、4、25 和 576,相加为 910——请注意,前提是平均数恰好为整数 18;若平均数不是正好的 18,离差平方和会略有不同(例如约 924.8333)。在平均数 = 18 时,\(\sum = 196+100+9+4+25+576 = 910\),于是方差 \(= 910 / 5 = 182\)。在做除法之前,请务必先确认平均数算得准确无误。
常见问题
为什么除以 n − 1 而不是 n?直接除以 n 会低估总体的离散程度;除以 n − 1 可以修正这一偏差,得到无偏估计。
什么时候该用总体方差?只有当你的数据涵盖了总体中的每一个成员(而不是抽样)时,才使用总体方差(除以 n)。
方差越大说明什么?方差越大,说明数据点相对平均数的分布越分散、波动越大。