Что такое пятичисловая сводка?
Пятичисловая сводка — это краткое описание распределения набора данных. Она состоит из пяти величин: минимума, первого квартиля (Q1), медианы (Q2), третьего квартиля (Q3) и максимума. Вместе эти числа показывают центр, разброс и асимметрию ваших данных и служат основой для построения «ящика с усами» (box plot).
Как пользоваться калькулятором
Введите свои числа в поле, разделяя их запятыми, пробелами или переносами строк. Калькулятор автоматически отсортирует их и выдаст все пять значений сводки вместе с межквартильным размахом (\(\text{IQR} = Q_3 - Q_1\)), который характеризует разброс центральных 50% ваших данных.
Формула
После сортировки данных медиана — это среднее значение ряда (или среднее арифметическое двух центральных значений при чётном количестве). Данные делятся на нижнюю и верхнюю половины. Q1 — это медиана нижней половины, а Q3 — медиана верхней. При нечётном количестве элементов центральное значение исключается из обеих половин (исключающий метод, или метод Тьюки). IQR равен просто Q3 − Q1.
$$\begin{gathered} \{\,\text{Min},\ Q_1,\ \text{Median},\ Q_3,\ \text{Max}\,\} \\[1.4em] \text{from sorted}\ \text{Data set} \\[1.2em] \text{where}\quad \left\{ \begin{aligned} \text{Min} &= x_{(1)}, \quad \text{Max} = x_{(n)} \\ \text{Median} &= \operatorname{med}(x_{(1)},\dots,x_{(n)}) \\ Q_1 &= \operatorname{med}(\text{lower half}) \\ Q_3 &= \operatorname{med}(\text{upper half}) \\ \text{IQR} &= Q_3 - Q_1 \end{aligned} \right. \end{gathered}$$
Разбор примера
Возьмём набор данных 2, 4, 6, 8, 10, 12, 14. После сортировки минимум равен 2, а максимум — 14. Медиана — это 4-е значение, то есть 8. Нижняя половина — {2, 4, 6}, её медиана (Q1) равна 4. Верхняя половина — {10, 12, 14}, её медиана (Q3) равна 12. Тогда \(\text{IQR} = 12 - 4 = 8\).
Частые вопросы
Почему существуют разные методы расчёта квартилей? В статистических пакетах используется несколько соглашений. Этот инструмент применяет распространённый исключающий метод, при котором общая медиана не входит в половины при нечётном количестве элементов.
Что показывает IQR? Он отражает, насколько разбросана центральная половина значений, и используется для поиска выбросов (значений, отстоящих от квартилей более чем на \(1{,}5 \times \text{IQR}\)).
Сколько чисел нужно ввести? Достаточно как минимум двух значений, но квартили становятся более показательными, когда данных больше.