Что такое асимметрия?
Асимметрия (skewness) показывает, насколько распределение вероятностей или набор данных смещены относительно своего среднего. Нулевая асимметрия говорит о симметричном распределении. Положительная асимметрия означает более длинный «хвост» справа (крупные значения тянут среднее вверх), отрицательная — более длинный «хвост» слева. Этот калькулятор вычисляет либо асимметрию совокупности, либо выборочную асимметрию с поправкой на смещение, а заодно показывает среднее и стандартное отклонение.
Как пользоваться калькулятором
Введите числа через запятую или пробел и выберите метод расчёта. Вариант Совокупность подходит, если ваши данные описывают всю интересующую группу целиком. Вариант Выборка (скорректированная оценка Фишера–Пирсона, которую используют функция SKEW в Excel и многие статистические пакеты) выбирайте, когда у вас лишь выборка из более крупной совокупности.
Разбор формулы
Асимметрия совокупности — это средний куб стандартизированного отклонения: $$g_1 = \frac{1}{n} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{\sigma} \right)^{3}$$ где \(\sigma\) считается с делением на \(n\). Выборочная версия добавляет поправочный коэффициент: $$G_1 = \frac{n}{(n-1)(n-2)} \sum_{i=1}^{n} \left( \frac{x_i - \bar{x}}{s} \right)^{3}$$ где \(s\) считается с делением на \(n-1\). Эта поправка устраняет занижение оценки, характерное для малых выборок.
Пример расчёта
Для данных 2, 4, 6, 8, 20 среднее равно 8. $$\sum (x_i-\bar{x})^3 = (-6)^3+(-4)^3+(-2)^3+(0)^3+(12)^3 = -216-64-8+0+1728 = 1440$$ Для совокупности \(\sigma = \sqrt{160/5} = 6{,}3246\), поэтому $$g_1 = \frac{1440/5}{6{,}3246^3} = \frac{288}{252{,}98} \approx \mathbf{1{,}1384}$$ Для выборочного метода \(s = \sqrt{160/4} = 7{,}0711\), и $$G_1 = \frac{5}{4 \cdot 3} \cdot \frac{1440}{353{,}55} = 0{,}4167 \cdot 4{,}0729 \approx \mathbf{1{,}6971}$$
Частые вопросы
Почему два метода дают разные значения? Они используют разные стандартные отклонения, а в выборочном методе ещё добавляется поправка на смещение, поэтому для небольших наборов данных результаты заметно отличаются.
Что означает значение около 0? Распределение примерно симметрично. Значения по модулю больше 1, как правило, считаются признаком сильной асимметрии.
Какое значение указывать в отчёте? Берите выборочную оценку, когда вы делаете выводы по выборке для всей совокупности; асимметрию совокупности используйте, когда у вас есть полный набор данных.