Что такое нижняя граница выбросов?
Нижняя граница (англ. lower fence) — это статистический порог, который помогает выявлять выбросы в нижней части набора данных. Любое значение, оказавшееся ниже этой границы, считается потенциальным выбросом. Расчёт основан на классическом правиле 1,5 × IQR, которое предложил Джон Тьюки. Именно по этому принципу строятся «усы» и отмечаются выбросы на диаграмме размаха («ящик с усами», box-and-whisker plot).
Как пользоваться калькулятором
Введите первый квартиль (Q1) и третий квартиль (Q3) вашего набора данных. Калькулятор вычислит межквартильный размах (\( \text{IQR} = \text{Q3} - \text{Q1} \)), умножит его на 1,5 и вычтет полученное значение из Q1 — так получается нижняя граница. Используйте её вместе с верхней границей, чтобы очертить диапазон «нормальных» значений.
Разбор формулы
Формула выглядит так: $$\text{Нижняя граница} = \text{Q1} - 1{,}5 \times \left( \text{Q3} - \text{Q1} \right)$$. Сначала найдите IQR, вычтя Q1 из Q3. Коэффициент 1,5 определяет, насколько строго отбираются выбросы: чем больше множитель (например, 3,0), тем только самые экстремальные значения попадают под подозрение, а 1,5 — общепринятый выбор для так называемых «умеренных» выбросов.
Пример расчёта
Допустим, в наборе данных Q1 = 25, а Q3 = 75. Тогда \( \text{IQR} = 75 - 25 = 50 \). Умножаем на 1,5 и получаем 75, после чего вычитаем из Q1: $$25 - 75 = \mathbf{-50}$$ Любое наблюдение ниже −50 считается потенциальным выбросом в нижней части распределения.
Частые вопросы
Что означает отрицательная нижняя граница? Это значит, что ни одно реалистичное малое значение не будет отмечено как выброс — порог оказался ниже всего диапазона ваших данных. Такая ситуация типична для симметричных распределений или распределений с правым «хвостом» (правосторонняя асимметрия).
Как найти Q1 и Q3? Отсортируйте данные по возрастанию, затем найдите медиану нижней половины (Q1) и медиану верхней половины (Q3). Во многих табличных редакторах для этого есть функция QUARTILE (КВАРТИЛЬ).
Почему именно 1,5 × IQR? Это общепринятое соглашение, которое для близких к нормальному распределению данных обеспечивает баланс между чувствительностью и числом ложных срабатываний. Если нужно поймать только экстремальные выбросы, используйте множитель 3,0 × IQR.