什么是两比例Z检验?
两比例Z检验用于判断两组样本比例之间的差异是否具有统计显著性。它是A/B测试中的标准工具,常用于比较两个独立分组的转化率、响应率、缺陷率或成功率。在原假设下,两个总体比例相等,因此该检验会把两组样本合并起来,估计出一个共同的比例值。
如何使用本计算器
分别填入两组的"成功"次数(例如转化数、正向响应数)以及各自的总样本量。计算器会返回Z统计量、双尾P值、每组的样本比例、合并比例以及标准误。将P值与你设定的显著性水平(常用0.05)作比较:如果P值更小,说明两组差异具有统计显著性。
公式详解
首先计算各组的样本比例:\(\hat{p}_1 = x_1/n_1\),\(\hat{p}_2 = x_2/n_2\)。在原假设下,合并比例为 \(\hat{p} = (x_1 + x_2)/(n_1 + n_2)\)。差值的标准误为 \(\text{SE} = \sqrt{\hat{p}(1-\hat{p})(1/n_1 + 1/n_2)}\)。最后 \(z = (\hat{p}_1 - \hat{p}_2) / \text{SE}\)。双尾P值由标准正态分布求得:\(2 \times P(Z > |z|)\)。
$$z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\,\hat{p}\,(1-\hat{p})\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}$$
实例演算
假设第1组在100个样本中有45次成功(\(\hat{p}_1 = 0.45\)),第2组在100个样本中有30次成功(\(\hat{p}_2 = 0.30\))。合并比例为 $$\frac{45+30}{100+100} = 0.375$$ 标准误 $$\text{SE} = \sqrt{0.375 \times 0.625 \times (0.01 + 0.01)} = \sqrt{0.0046875} \approx 0.06847$$ 于是 $$z = \frac{0.45 - 0.30}{0.06847} \approx 2.191$$ 对应的双尾P值 \(\approx 0.0285\)——在5%的水平上具有显著性。
常见问题
什么时候用合并法、什么时候用非合并法? 合并法(本计算器采用)在原假设下假定两比例相等,是假设检验的标准做法。非合并标准误通常用于构造置信区间。
需要多大的样本量? 当每组的预期成功数和失败数都至少达到约5~10时,正态近似的效果较好。
P值是单尾还是双尾? 本计算器给出的是双尾P值,检验两比例是否在任一方向上存在差异。