什麼是偏度?
偏度(skewness)用來衡量機率分布或資料集相對於平均數的不對稱程度。偏度為零代表分布左右對稱;正偏度表示右側拖著一條較長的尾巴(極大值會把平均數往上拉);負偏度則表示左側尾巴較長。本計算器可輸出母體偏度,或經過偏誤校正的樣本偏度,同時附上平均數與標準差,方便你一次掌握資料的全貌。
使用方式
將你的數字以逗號或空格分隔輸入,接著選擇計算方法。若你的資料涵蓋了整個感興趣的對象,請選擇母體;若你手上只是從更大母體中抽取的樣本,則選擇樣本(即 Excel 的 SKEW 函數與許多統計軟體採用的校正 Fisher-Pearson 估計式)。
公式說明
母體偏度為標準化偏差三次方的平均值:
$$g_1 = \frac{1}{n} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{\sigma} \right)^{3}$$其中 \(\sigma\) 以 \(n\) 為分母。樣本版本則加入一個校正因子:
$$G_1 = \frac{n}{(n-1)(n-2)} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{s} \right)^{3}$$其中 \(s\) 以 \(n-1\) 為分母。這個校正因子可以消除小樣本中常見的向下偏誤。
實例演算
以資料 2、4、6、8、20 為例,平均數為 8。
$$\sum (x_i-\bar{x})^3 = (-6)^3+(-4)^3+(-2)^3+(0)^3+(12)^3 = -216-64-8+0+1728 = 1440$$母體 \(\sigma = \sqrt{160/5} = 6.3246\),因此
$$g_1 = \frac{1440/5}{6.3246^3} = \frac{288}{252.98} \approx \mathbf{1.1384}$$若採用樣本方法,\(s = \sqrt{160/4} = 7.0711\),則
$$G_1 = \frac{5}{4\cdot 3}\cdot\frac{1440}{353.55} = 0.4167\cdot 4.0729 \approx \mathbf{1.6971}$$常見問題
為什麼兩種方法算出的數字不一樣?因為兩者使用的標準差不同,而樣本方法又額外加上了偏誤校正因子,所以在小型資料集中數值會有明顯差距。
數值接近 0 代表什麼?表示分布大致對稱。一般而言,超過 \(\pm 1\) 就被視為高度偏斜。
我該採用哪一個結果?若要由樣本推論到整體,請使用樣本估計式;若你掌握的是完整資料集,則使用母體偏度。