这是什么
本计算器用于估算:要在设定的误差范围和置信水平内估计某个总体比例,至少需要访问多少名受访者。当调查结果以百分比形式呈现时(例如"有多少比例的人回答'是'"),这正是市场调研、民意调查和临床问卷中通用的标准计算方法。
如何使用
先选择置信水平(90%、95% 或 99%),再以百分比形式填入预期比例,最后输入你希望达到的误差范围(同样为百分比)。如果你事先没有任何关于该比例的估计值,建议直接填 50%——这是最保守的取值,会得出最大的所需样本量,能确保结果足够稳妥。
公式详解
样本量公式为 $$n = \left\lceil \frac{z^{2} \cdot p\,(1 - p)}{E^{2}} \right\rceil$$。其中 \(z\) 是标准正态分布的临界值(90% 对应 1.645,95% 对应 1.96,99% 对应 2.576),\(p\) 是以小数表示的预期比例,\(E\) 是以小数表示的误差范围。由于样本量必须是整数,计算结果会向上取整。
实例演算
以 99% 置信水平(\(z = 2.576\))、\(p = 30\%\)(0.30)、\(E = 4\%\)(0.04)为例:$$n = \frac{2.576^{2} \times 0.30 \times 0.70}{0.04^{2}} = \frac{6.635776 \times 0.21}{0.0016} = \frac{1.39351296}{0.0016} \approx 870.95$$向上取整后,你需要访问 871 名受访者。
常见问题
不知道比例时为什么要用 50%? 当 \(p = 0.5\) 时,\(p(1-p)\) 取得最大值,因此能给出最稳妥(最大)的样本量。
这个公式考虑了总体规模吗? 没有——这是基于"无限总体"假设的公式。如果总体规模较小,需要再套用有限总体校正系数(finite population correction)。
什么是误差范围? 它指的是在所选置信水平下,估计值上下浮动的 ± 区间。