什麼是雙比例 Z 檢定?
雙比例 Z 檢定用來判斷兩組樣本比例之間的差異是否具有統計顯著性。它是 A/B 測試最常用的工具,可用於比較兩個獨立群組之間的轉換率、回應率、不良率或成功率。在虛無假設下,假設兩個母體比例相等,因此檢定會將兩組樣本合併,估算出共同的合併比例。
如何使用這個計算器
分別輸入兩組的「成功」次數(例如轉換數、正向回應數)以及各組的總樣本數。計算器會回傳 z 統計量、雙尾 p 值、各組的樣本比例、合併比例以及標準誤。接著將 p 值與你設定的顯著水準(常見為 0.05)相比:若 p 值較小,代表兩組差異具有統計顯著性。
公式解析
首先計算各組的樣本比例:\(\hat{p}_1 = x_1/n_1\)、\(\hat{p}_2 = x_2/n_2\)。在虛無假設下,合併比例為 \(\hat{p} = (x_1 + x_2)/(n_1 + n_2)\)。兩比例差的標準誤為 $$SE = \sqrt{\,\hat{p}\,(1-\hat{p})\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}$$ 最後求出 $$z = \frac{\hat{p}_1 - \hat{p}_2}{SE}$$ 雙尾 p 值則由標準常態分配計算為 \(2 \times P(Z > |z|)\)。
實例演練
假設第 1 組在 100 次中有 45 次成功(\(\hat{p}_1 = 0.45\)),第 2 組在 100 次中有 30 次成功(\(\hat{p}_2 = 0.30\))。合併比例為 $$\frac{45+30}{100+100} = 0.375$$ $$SE = \sqrt{0.375 \times 0.625 \times (0.01 + 0.01)} = \sqrt{0.0046875} \approx 0.06847$$ 接著 $$z = \frac{0.45 - 0.30}{0.06847} \approx 2.191$$ 對應的雙尾 p 值約為 0.0285,在 5% 的顯著水準下達到顯著。
常見問題
什麼時候該用合併(pooled)或非合併(unpooled)檢定?合併版本(即本計算器採用的方式)在虛無假設下假設兩比例相等,是假設檢定的標準做法。非合併標準誤則通常用於建立信賴區間。
需要多大的樣本數?當每一組的預期成功與失敗次數至少約有 5 至 10 次時,常態近似的效果會相當良好。
p 值是單尾還是雙尾?本計算器回報的是雙尾 p 值,檢定兩比例是否在任一方向上存在差異。