標本分散とは?
標本分散(s²)は、データの各値が平均からどれくらいばらついているかを表す指標です。平均からの距離を二乗した値の平均ですが、分母には n ではなく n − 1 を使います。n − 1 で割る理由は「ベッセル補正」と呼ばれ、データ全体ではなく一部の標本しか手元にない場合に、母集団の真の分散をかたよりなく推定できるようにするためです。
このツールの使い方
数値をカンマまたはスペースで区切って入力してください。たとえば 4, 8, 15, 16, 23, 42 のように入力します。計算結果として、標本分散・標本標準偏差・平均・データ数・偏差平方和を表示するので、計算の各ステップを一つずつ確認できます。
計算式の解説
まず平均を求めます:\(\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i\)。次に各値から平均を引き、その差を二乗します。これらの偏差の二乗をすべて足すと \(\sum_{i=1}^{n}\left(x_i - \bar{x}\right)^{2}\) が得られます。最後にこれを n − 1 で割れば標本分散になります。さらにその平方根をとると、標本標準偏差 \(s\) が求められます。
$$s^{2} = \frac{1}{n-1}\sum_{i=1}^{n}\left(x_i - \bar{x}\right)^{2} \qquad \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i$$
計算例
データ 4, 8, 15, 16, 23, 42 の場合:合計は 108、n = 6 なので平均は 18 です。各偏差の二乗は 196、100、9、4、25、576 となり、その合計は 910 です。偏差平方和 \(= 196+100+9+4+25+576 = 910\)、分散 \(= 910 / 5 = 182\) となります。割り算をする前に、必ず平均値を正しく確認しておきましょう。
よくある質問
なぜ n ではなく n − 1 で割るのですか? n で割ると母集団のばらつきを小さく見積もってしまいます。n − 1 で割ることで、このかたよりを補正できます。
母分散を使うべきなのはどんなときですか? 母分散(n で割る)は、データが母集団のすべての要素を含んでいて、標本ではない場合にのみ使います。
分散が大きいと何を意味しますか? 分散が大きいほど、データが平均から広く散らばっていることを示します。