比率の標準誤差とは?
比率の標準誤差(SE)とは、ランダムな標本抽出によって、標本比率が母集団の真の比率からどれくらいばらつくと予想されるかを表す指標です。たとえばアンケートの支持率、コンバージョン率、不良率といった推定値の精度を示してくれます。標準誤差が小さいほど、標本比率は母集団の値をより信頼性高く推定できていることを意味します。
この計算ツールの使い方
標本比率 p は0〜1の小数で入力します(例:40%なら0.40)。標本サイズ n には観測数(データの個数)を入力してください。計算ツールは標準誤差に加えて、標本分散も表示します。これらの値は、信頼区間の算出や、比率に関する仮説検定を行う際に役立ちます。
計算式の解説
比率の標準誤差は、次の式で求められます。
$$SE = \sqrt{\dfrac{\text{p}\left(1 - \text{p}\right)}{\text{n}}}$$
ここで \(\text{p}(1-\text{p})\) は、1回のベルヌーイ試行の分散を表します。これを \(n\) で割ると標本比率の分散になり、さらに平方根をとることで、単位を \(p\) と同じスケールに戻します。標準誤差は \(p = 0.5\) のとき(不確実性が最大になるとき)に最も大きくなり、標本サイズ \(n\) が増えるほど小さくなっていきます。
計算例
たとえば、調査対象の顧客100人のうち40人がある商品を好むと答えた場合、\(p = 0.40\)、\(n = 100\) となります。このとき $$\text{分散} = \frac{0.40 \times 0.60}{100} = 0.0024, \quad SE = \sqrt{0.0024} \approx 0.04899$$ です。95%信頼区間のおおよその範囲は \(0.40 \pm 1.96 \times 0.049\)、つまり約 0.304〜0.496 となります。
よくある質問(FAQ)
p は小数とパーセントのどちらで入力すればよいですか? 0〜1の小数で入力してください。パーセントの場合は100で割って変換します(例:25% = 0.25)。
この式が有効になるのはどんなときですか? 十分に大きいランダム標本であることを前提としており、\(np\) と \(n(1-p)\) がともにおおよそ5〜10以上のときに最も正確になります。
標準誤差が最大になる比率はどれですか? ある標本サイズにおいて、\(p = 0.5\) のときに標準誤差が最大になります。このため、安全側を見込んだサンプルサイズ設計では \(p = 0.5\) がよく用いられます。