Что такое калькулятор выбросов?
Выброс — это значение, которое сильно отличается от остальных данных в выборке. Этот калькулятор использует популярный метод межквартильного размаха (IQR), также известный как «границы Тьюки», чтобы выявить необычно большие или малые значения. Просто введите числа, и калькулятор покажет квартили, межквартильный размах, нижнюю и верхнюю границы, а также список всех найденных выбросов.
Как пользоваться
Введите набор данных в поле, разделяя числа запятыми или пробелами (например, 4, 5, 6, 7, 8, 100). Калькулятор отсортирует значения, вычислит первый квартиль (Q1), третий квартиль (Q3) и межквартильный размах, а затем отметит как выброс любое значение, выходящее за пределы 1,5·IQR от квартилей.
Разбор формулы
Межквартильный размах вычисляется так: \(\text{IQR} = Q_3 - Q_1\). Границы задаются формулами \(\text{Нижняя} = Q_1 - 1{,}5\,\text{IQR}\) и \(\text{Верхняя} = Q_3 + 1{,}5\,\text{IQR}\). Любое значение ниже нижней границы или выше верхней считается выбросом. Множитель 1,5 — это стандартное соглашение; для «экстремальных» выбросов некоторые аналитики берут 3,0.
$$\begin{gathered} \text{Outlier if} \quad x < \text{LB} \quad \text{or} \quad x > \text{UB} \\[1.5em] \text{where}\quad \left\{ \begin{aligned} \text{IQR} &= Q_3 - Q_1 \\ \text{LB} &= Q_1 - 1.5\,\text{IQR} \\ \text{UB} &= Q_3 + 1.5\,\text{IQR} \\ x &\in \text{Data set} \end{aligned} \right. \end{gathered}$$
Пример расчёта
Возьмём набор 10, 12, 14, 15, 18, 20, 22, 25, 90 (\(n = 9\)). Медиана делит данные на нижнюю половину {10, 12, 14, 15} и верхнюю половину {18, 20, 22, 25}. Тогда \(Q_1 = (12+14)/2 = 13\) и \(Q_3 = (20+22)/2 = 21\)... для альтернативного набора здесь \(Q_3 = 23{,}5\). \(\text{IQR} = 10{,}5\), поэтому нижняя граница равна \(-2{,}75\), а верхняя — \(39{,}25\). Значение 90 превышает 39,25, поэтому оно отмечается как единственный выброс.
Частые вопросы
Какой метод расчёта квартилей применяется? Используется «исключающий» метод медианы: при нечётном n общая медиана не входит ни в одну из половин.
Почему именно 1,5·IQR? Это классический порог, предложенный Джоном Тьюки; он отсекает примерно «хвосты», выходящие за обычный разброс данных.
Может ли выброс быть «настоящим» значением? Да — выброс лишь статистически необычен, но это не обязательно ошибка. Прежде чем удалять его, всегда разберитесь в причинах.