什麼是卡方獨立性檢定?
卡方(χ²)獨立性檢定用來判斷兩個類別變數之間是否有關聯。以 2×2 列聯表來說,它會把你實際觀察到的次數,和「假設兩變數完全獨立」時應該出現的期望次數做比較。兩者差距越大,算出來的 χ² 值就越大,也代表這兩個變數越可能彼此相關。
計算器使用方式
請輸入 2×2 表格的四格次數:A 和 B 是第一列,C 和 D 是第二列。計算器會自動加總各列總和、各欄總和與整體總數,算出每一格的期望次數,再把標準化後的平方差加總起來得到 χ²。同時它也會顯示自由度(2×2 表格永遠是 1)、近似 p 值、α = 0.05 時的臨界值,以及檢定結果是否達到統計顯著。
公式解析
每一格的期望次數為 \(E = \dfrac{(\text{該列總和}) \times (\text{該欄總和})}{\text{整體總數}}\)。檢定統計量則是把四格的數值代入 $$\chi^2 = \sum \frac{(O - E)^2}{E}$$ 後加總。在自由度為 1 的情況下,5% 顯著水準對應的臨界值是 3.841。只要你的 χ² 超過 3.841,就可以拒絕「兩變數互相獨立」的虛無假設。
實際範例
假設 A = 10、B = 20、C = 30、D = 40。各列總和為 30 與 70,各欄總和為 40 與 60,整體總數為 100。對應的期望次數分別是 12、18、28、42。於是 $$\chi^2 = \frac{(10-12)^2}{12} + \frac{(20-18)^2}{18} + \frac{(30-28)^2}{28} + \frac{(40-42)^2}{42} \approx 0.3333 + 0.2222 + 0.1429 + 0.0952 \approx 0.7937$$由於 0.79 < 3.841,因此無法拒絕獨立的假設。
常見問題
為什麼這裡的自由度永遠是 1?自由度 \(= (\text{列數} - 1) \times (\text{欄數} - 1) = (2-1) \times (2-1) = 1\)。
p 值很小代表什麼?當 p 值低於 0.05,表示在「兩變數獨立」的前提下,觀察到這樣的關聯機率很低,因此兩個變數很可能確實相關。
這個 p 值是精確值嗎?它採用自由度為 1 的卡方分配標準數值近似法,對一般決策已足夠準確;但在較極端的情況下,仍建議搭配完整的統計軟體,不宜完全取代。