歪度(スキューネス)とは?
歪度は、確率分布やデータが平均を中心にどれだけ左右非対称になっているかを示す指標です。歪度が0なら左右対称の分布を意味します。歪度がプラスの場合は右側の裾が長く(大きな値に引っ張られて平均が高くなる)、マイナスの場合は左側の裾が長くなります。この計算ツールでは、母集団の歪度、または偏りを補正した標本の歪度のいずれかを、平均と標準偏差とあわせて算出します。
使い方
数値をカンマまたはスペースで区切って入力し、計算方法を選びます。対象とする集団全体のデータがそろっている場合は母集団を、より大きな母集団から抽出した一部のデータを扱う場合は標本(ExcelのSKEW関数や多くの統計ソフトで使われる調整済みフィッシャー・ピアソン推定量)を選んでください。
計算式の解説
母集団の歪度は、標準化した偏差を3乗した値の平均として求めます:
$$g_1 = \frac{1}{n} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{\sigma} \right)^{3}$$ここで \(\sigma\) は \(n\) で割って計算します。標本版では補正係数を掛けます:
$$G_1 = \frac{n}{(n-1)(n-2)} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{s} \right)^{3}$$ここで \(s\) は \(n-1\) で割って計算します。この補正により、小さな標本で生じる下方バイアス(過小評価)が取り除かれます。
計算例
データ 2, 4, 6, 8, 20 の場合、平均は 8 です。
$$\sum (x_i-\bar{x})^3 = (-6)^3+(-4)^3+(-2)^3+(0)^3+(12)^3 = -216-64-8+0+1728 = 1440$$母集団の \(\sigma = \sqrt{160/5} = 6.3246\) なので、
$$g_1 = \frac{1440/5}{6.3246^3} = \frac{288}{252.98} \approx \mathbf{1.1384}$$となります。標本の方法では \(s = \sqrt{160/4} = 7.0711\) となり、
$$G_1 = \frac{5}{4\cdot 3}\cdot\frac{1440}{353.55} = 0.4167\cdot 4.0729 \approx \mathbf{1.6971}$$です。
よくある質問
2つの方法で値が違うのはなぜ? 使用する標準偏差が異なるうえ、標本の方法ではバイアス補正係数を掛けるため、特にデータ数が少ない場合に値の大きさが変わります。
0に近い値は何を意味する? 分布がほぼ左右対称であることを示します。\(\pm 1\) を超える値は一般に「強い歪み」があると考えられます。
どちらを使えばよい? 標本から全体を推測する場合は標本推定量を、データがすべてそろっている場合は母集団の歪度を使ってください。