Что такое верхняя граница выбросов?
Верхняя граница выбросов — это статистический порог, который помогает находить аномально большие значения в наборе данных. Любое наблюдение, расположенное выше этой границы, считается потенциальным выбросом и заслуживает дополнительной проверки. Этот приём — часть классического метода Тьюки для выявления выбросов; именно он задаёт «усы» на диаграмме размаха (ящике с усами).
Как пользоваться калькулятором
Введите первый квартиль (Q1) и третий квартиль (Q3) вашего набора данных. Калькулятор вычислит межквартильный размах (\(\text{IQR} = \text{Q3} - \text{Q1}\)), умножит его на 1,5 и прибавит результат к Q3 — так получается верхняя граница. Если вы ещё не знаете значения квартилей, отсортируйте данные по возрастанию и найдите медиану нижней половины (это Q1) и медиану верхней половины (это Q3).
Разбор формулы
Верхняя граница задаётся выражением $$\text{Верхняя граница} = \text{Q3} + 1{,}5 \times \left(\text{Q3} - \text{Q1}\right)$$. Величина \((\text{Q3} - \text{Q1})\) — это межквартильный размах, устойчивая мера разброса, которая не реагирует на экстремальные значения. Умножая IQR на 1,5, мы получаем «полосу допуска»; продлевая её вверх от Q3, мы задаём порог, выше которого наблюдения считаются необычно большими.
Пример расчёта
Пусть в наборе данных Q1 = 25, а Q3 = 75. Тогда IQR равен \(75 - 25 = 50\). Верхняя граница составит $$75 + 1{,}5 \times 50 = 75 + 75 = 150.$$ Любое значение больше 150 будет считаться потенциальным высоким выбросом.
Частые вопросы
Почему именно 1,5? Коэффициент 1,5 — стандартный множитель, предложенный Джоном Тьюки. Он удерживает баланс между чувствительностью метода и числом ложных срабатываний для данных, близких к нормальному распределению. Иногда используют множитель 3,0 — для поиска «экстремальных» выбросов.
А как насчёт нижней границы? Симметричный нижний порог рассчитывается как \(\text{Q1} - 1{,}5 \times \text{IQR}\). Значения ниже него считаются низкими выбросами.
Значение выше границы — это всегда ошибка? Нет. Оно лишь помечается для проверки: это вполне может быть настоящее, хотя и экстремальное, наблюдение.