このツールでできること
この標準偏差 計算ツールは、入力した数値のリストから標本標準偏差(不偏標準偏差)を瞬時に算出し、あわせて平均・中央値・分散・最小値・最大値・データ数・合計といった要約統計量も一括で表示します。学生やアナリスト、研究者をはじめ、表計算ソフトを開かずにデータのばらつき具合をサッと把握したい方に最適です。
使い方
入力欄は1つだけです(数値を入力(カンマ区切り))。カンマ・セミコロン・スペースで区切って数値を入力または貼り付けてください。区切り文字は柔軟に対応し、空白の項目は自動的に除外されます。たとえば 4, 8, 15, 16, 23, 42 と入力して計算するだけです。
- 平均 … すべての数値の平均値
- 中央値 … データの真ん中の値(50パーセンタイル)
- 標準偏差 … 各値が平均からどれだけばらついているかの目安
- 分散 … 標準偏差を2乗した値
- 最小値・最大値・データ数・合計 … データの全体像をつかむ基本指標
計算式の解説
本ツールは標本標準偏差の式を用いています。
$$s = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}}$$
ここで \(x_i\) は各数値、\(\bar{x}\) は平均、\(n\) はデータ数です。分母が \(n\) ではなく \(n - 1\) になっている点に注目してください。これは「ベッセルの補正」と呼ばれ、データがより大きな母集団から抽出された標本である場合に、偏りのない(不偏な)推定値を与えてくれます。分散は単純に \(s^2\) です。
計算例
数値 4, 8, 15, 16, 23, 42 を例に計算してみましょう。
- データ数 = 6、合計 = 108
- 平均 = 108 ÷ 6 = 18
- 偏差の2乗の合計:(4−18)² + (8−18)² + (15−18)² + (16−18)² + (23−18)² + (42−18)² = 196 + 100 + 9 + 4 + 25 + 576 = 910
- 分散 = 910 ÷ (6 − 1) = 182
- 標準偏差 = √182 ≈ 13.49
このデータの中央値は、真ん中にある2つの値(15と16)の平均なので 15.5 になります。
結果の解釈
標準偏差(SD)は、データセットの平均からどれだけ離れているかを、平均的に示します。これはデータと同じ単位で報告されるため、直接解釈できます。
- SDが大きい — 値がより広く散らばっており、平均の周りで大きく変動しています。
- SDが小さい — 値が平均の周りにぎゅっと集まっており、より一貫しています。
- SDが0 — すべての値が同じです(変動が全くない)ため、平均は各値と等しくなります。
SDはデータのスケールに依存するため、異なる単位で測定されたデータセット間、または非常に異なる平均を持つデータセット間の散らばりを比較することは困難です。その場合は、変動係数(CV)を使用します。これはSDを平均で割ったもので、通常はパーセンテージで表されます。
$$\text{CV} = \frac{s}{\bar{x}} \times 100\%$$たとえば、\(s = 6\) および \(\bar{x} = 40\) のデータセットは、CVが15%です。これは、散らばりが平均の15%であることを意味します — 完全に異なるスケール上のデータセットと比較できる相対的な尺度です。
データがほぼ釣り鐘型(ほぼ正規分布)の場合、経験則はSDが分布とどのように関連しているかを素早く理解する方法を与えます。
- 約68%の値が平均の1 SD以内に入ります(\(\bar{x}-s\) と \(\bar{x}+s\) の間)。
- 約95%が平均の2 SD以内に入ります。
- 約99.7%が平均の3 SD以内に入ります。
したがって、\(\bar{x}=100\) と \(s=10\) の正規分布に見えるデータでは、およそ95%の値は80から120の間にあります。2~3 SDを超える値は珍しく、潜在的な外れ値として調査する価値があるかもしれません。
定義と用語集
- 平均(\(\bar{x}\))
- 算術平均 — すべての値の合計をカウントで割ったもの。これは偏差が測定される中心点です。
- 中央値
- データをソートしたときの中間の値です。カウントが偶数の場合は、2つの中央値の平均です。平均よりも外れ値の影響を受けにくいです。
- 標準偏差(s)
- 平均からの値の典型的な距離を元の単位で表したもの — 分散の平方根です。
- 分散(\(s^2\))
- 平均からの偏差の二乗の平均(サンプルの場合は \(n-1\) を使用)。これは二乗単位のため、解釈にはSDが通常推奨されます。
- サンプルと母集団
- サンプルは大きなグループから抽出されたサブセットで、\(n-1\) で割ります。母集団はすべてのメンバーを含み、\(n\) で割ります。このツールはサンプルSDを計算します。
- ベッセルの補正(\(n-1\))
- サンプルを使用する場合、\(n\) の代わりに \(n-1\) で割ります。これはサンプル分散が真の母集団分散を過小評価する傾向を補正します。
- 偏差
- 個々の値と平均の差、\(x_i - \bar{x}\)。これらの偏差を二乗することは、分散計算の中核です。
- カウント(n)
- 入力された値の数 — データセットのサイズです。
- 合計
- すべての値を合わせた合計。これをカウントで割ると平均が得られます。
- 最小値
- データセット内の最小の値です。
- 最大値
- データセット内の最大の値です。最大値から最小値を引くと範囲が得られます。
よくある質問
標本標準偏差ですか?それとも母標準偏差ですか? 本ツールは \(n - 1\) で割る標本標準偏差を計算します。母標準偏差(\(n\) で割る方法)が必要な場合、両者の差はデータ数が多いほど小さく、少ないほど目立ちます。
どんな区切り文字が使えますか? カンマ・セミコロン・スペース・改行のいずれにも対応しているため、表計算ソフトの1列をそのまま貼り付けることもできます。
なぜ標準偏差と一緒に分散も表示されるのですか? 分散は標準偏差を2乗した値です。統計的検定や分散分析(ANOVA)で役立つ一方、標準偏差は元のデータと同じ単位で表されるため解釈しやすいという利点があります。