什么是样本均值的抽样分布?
当你从一个总体中反复抽取容量为 n 的随机样本,并计算出每个样本的均值时,这些均值本身会构成一个新的分布——这就是样本均值的抽样分布。本计算器只需三个输入值,就能算出该分布的中心(均值)和离散程度(标准误差):总体均值 \(\mu\)、总体标准差 \(\sigma\) 以及样本量 \(n\)。
如何使用本计算器
填入总体均值(\(\mu\))、总体标准差(\(\sigma\))和你的样本量(\(n\)),工具会立即给出抽样分布的均值(\(\mu_{\bar{x}}\))、标准误差(\(\sigma_{\bar{x}}\))以及样本均值的方差(\(\sigma_{\bar{x}}^{2}\))。标准误差反映的是样本均值通常会偏离真实总体均值多少。
公式详解
抽样分布的均值始终等于总体均值:\(\mu_{\bar{x}} = \mu\)。而离散程度会随着样本量增大而缩小: $$\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}$$ 由于这里除的是 \(n\) 的平方根,所以样本量翻倍并不能让标准误差减半——你需要把 \(n\) 扩大到原来的 4 倍,才能把标准误差降低一半。根据中心极限定理,当 \(n\) 足够大时,无论总体本身是什么形状,这个分布都会近似服从正态分布。
实例演算
假设 \(\mu = 100\),\(\sigma = 15\),\(n = 25\)。那么 \(\mu_{\bar{x}} = 100\), $$\sigma_{\bar{x}} = \frac{15}{\sqrt{25}} = \frac{15}{5} = 3$$ 方差为 \(\sigma_{\bar{x}}^{2} = 3^{2} = 9\)。也就是说,由 25 个观测值得到的样本均值会集中在 100 附近,标准误差为 3。
常见问题
为什么样本越大,标准误差越小?样本越大,随机波动越容易被平均掉,因此样本均值会更紧密地聚集在真实均值周围。
总体一定要服从正态分布吗?就这里的公式而言不需要。无论总体是什么分布,均值和标准误差的计算结果都是精确的。只有当 \(n\) 足够大时,抽样分布才会借助中心极限定理近似呈正态分布。
如果我只有样本标准差怎么办?如果总体标准差 \(\sigma\) 未知,可以用样本标准差 \(s\) 作为估计值,此时标准误差变为 \(s/\sqrt{n}\),并且通常配合 \(t\) 分布一起使用。