この分散計算ツールでできること
分散とは、一連の数値が平均値(平均)からどれだけばらついているかを表す指標です。分散が小さいほど値は平均値の近くに密集しており、分散が大きいほど値が広く散らばっていることを意味します。このツールは、カンマ区切りで入力した数値のリストから、平均・分散・標準偏差を一度に算出します。データの一貫性やばらつきの大きさを、その場ですぐに把握できます。
使い方
入力欄は1つだけです。数値を入力(カンマ区切り)の欄に、カンマ・セミコロン・スペース、さらには全角カンマで区切った数値を入力または貼り付けてください。たとえば 4, 8, 15, 16, 23, 42 のように入力します。ツールが自動でテキストを分割し、各要素を数値に変換して、次の3つを計算します。
- 平均 — すべての値の算術平均です。
- 分散 — 平均からの偏差を2乗した値の平均です。
- 標準偏差 — 分散の平方根で、元のデータと同じ単位で表されます。
計算に使われている公式
このツールは Apache Commons Math の StatUtils.variance メソッドを使用しており、標本分散(不偏分散)を計算します。つまり、n ではなく n − 1 で割ります。公式は次のとおりです。
ここで \(x_i\) は各値、\(\bar{x}\) は平均、\(n\) は値の個数です。標準偏差は単純に \(s = \sqrt{s^2}\) で求められます。\(n - 1\) で割る方法(ベッセルの補正)を用いることで、より大きな母集団から抽出した標本の分散を偏りなく推定できます。
計算例
たとえば 2, 4, 6, 8 を入力した場合を考えてみましょう。
- 平均 \(= (2 + 4 + 6 + 8) / 4 =\) 5
- 偏差の2乗:\((2-5)^2=9\)、\((4-5)^2=1\)、\((6-5)^2=1\)、\((8-5)^2=9\) → 合計 \(= 20\)
- 標本分散 \(= 20 / (4 - 1) =\) 6.667
- 標準偏差 \(= \sqrt{6.667} \approx\) 2.582
これら3つの値を、ツールが自動で算出します。
よくある質問
これは標本分散ですか、それとも母分散ですか? 標本分散を計算します(n − 1 で割ります)。入力した数値が母集団全体ではなく、その一部(標本)を表す場合に標準的に用いられる方式です。
どんな区切り文字が使えますか? カンマ・セミコロン・スペース、そしてアジア圏でよく使われる全角カンマにも対応しています。そのため、コピー&ペーストした乱雑なデータでも、たいていは正しく読み取られます。
なぜ標準偏差も表示されるのですか? 標準偏差は元のデータと同じ単位で表されるため、解釈がしやすいからです。一方、分散は単位が2乗されたものになります。