母比率の許容誤差(誤差の範囲)とは?
許容誤差(MOE:Margin of Error)とは、標本から得られた比率が、本来知りたい母集団全体の比率からどれくらいずれている可能性があるかを示す指標です。アンケート調査で「回答者のうち \(\hat{p}\) の割合がある選択肢を支持した」とわかったとき、許容誤差は、指定した信頼水準のもとでその推定値の前後にどれだけの幅(±)が生じるかを教えてくれます。この計算ツールは特定の国に依存しないため、どの国のアンケートや世論調査にもそのまま使えます。
使い方
まず標本比率 \(\hat{p}\) を 0〜1 の小数で入力します(例:0.52 は 52%を表します)。次に標本サイズ \(n\) を入力し、信頼水準(90%・95%・99%)を選びます。ツールは許容誤差をパーセントで返すほか、標準誤差、使用した \(z\) 臨界値、そして算出された信頼区間も表示します。さらに「5以上ルール」を自動でチェックし、正規分布による近似が妥当かどうかも確認できます。
計算式の解説
許容誤差は次の式で求めます。
$$\text{MOE} = z \cdot \sqrt{\frac{\hat{p}\,\left(1 - \hat{p}\right)}{n}}$$\(\sqrt{\hat{p}(1-\hat{p})/n}\) の部分は比率の標準誤差で、標本サイズ \(n\) が大きくなるほど小さくなります。\(z\) は標準正規分布から得られる臨界値で、信頼水準 90%なら 1.645、95%なら 1.96、99%なら 2.576 を用います。標準誤差に \(z\) を掛けることで、求めたい確からしさの水準に合わせて区間の幅を調整しているわけです。
計算例
たとえば、1,000 人の有権者に調査して 52%がある政策に賛成したとします。すると \(\hat{p} = 0.52\)、\(n = 1000\) で、信頼水準 95%(\(z = 1.96\))とします。標準誤差は
$$\sqrt{\frac{0.52 \cdot 0.48}{1000}} = \sqrt{0.0002496} \approx 0.0158$$です。許容誤差は
$$1.96 \times 0.0158 \approx 0.0310$$すなわち約 3.1%となります。信頼区間は 52% ± 3.1%、おおよそ 48.9%〜55.1%の範囲です。
よくある質問
「5以上ルール」とは何ですか? 比率に対する正規近似は、\(n \cdot \hat{p} \geq 5\) かつ \(n \cdot (1-\hat{p}) \geq 5\) の両方を満たすときに信頼できる、という目安です。どちらかが 5 未満の場合は、クロッパー=ピアソン区間などの厳密法を使うことをおすすめします。
比率が不明なときに \(\hat{p} = 0.5\) を使うのはなぜですか? \(\hat{p}(1-\hat{p})\) は \(\hat{p} = 0.5\) のとき最大になり、最も保守的(最も広い)許容誤差が得られるためです。サンプルサイズを設計する段階でよく使われる考え方です。
標本を増やせば許容誤差は小さくなりますか? はい。\(n\) は平方根の中の分母にあるため、許容誤差は \(1/\sqrt{n}\) に比例して小さくなっていきます。