Что такое z-тест для одной доли?
Z-тест для одной доли проверяет, значимо ли выборочная доля (\(\hat{p}\)) отличается от известной или предполагаемой доли в генеральной совокупности (\(p_0\)). Этот метод широко применяют в опросах, контроле качества, A/B-тестировании и медицинских исследованиях — везде, где результат измеряется по принципу «да/нет», а вам нужно понять, согласуется ли наблюдаемая частота с заявленным значением.
Как пользоваться калькулятором
Укажите число успехов (\(x\)), общий объём выборки (\(n\)) и гипотетическую долю (\(p_0\)) в диапазоне от 0 до 1. Выберите альтернативную гипотезу — двустороннюю, левостороннюю или правостороннюю. Калькулятор рассчитает выборочную долю, стандартную ошибку, z-статистику и соответствующее p-значение. Сравните p-значение с выбранным уровнем значимости (обычно 0,05): если оно меньше, нулевая гипотеза отклоняется.
Разбор формулы
Стандартная ошибка вычисляется при условии справедливости нулевой гипотезы как \(\sqrt{\dfrac{p_0(1-p_0)}{n}}\). Z-статистика — это расстояние между выборочной долей и \(p_0\), измеренное в стандартных ошибках:
$$z = \frac{\hat{p} - p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}$$P-значение определяется по стандартному нормальному распределению. Тест предполагает, что выборочное распределение приближённо нормально, а это выполняется при \(n \cdot p_0 \geq 10\) и \(n \cdot (1-p_0) \geq 10\).
Пример расчёта
Допустим, новый продукт предпочли 45 человек из 100, и вы хотите проверить гипотезу при \(p_0 = 0{,}5\). Тогда \(\hat{p} = 0{,}45\),
$$SE = \sqrt{\frac{0{,}5 \cdot 0{,}5}{100}} = 0{,}05$$$$z = \frac{0{,}45 - 0{,}5}{0{,}05} = -1{,}0$$Двустороннее p-значение составляет около 0,317, то есть значимого отличия от 50 % нет.
Частые вопросы
Когда выбирать z-тест, а когда t-тест? Для долей при достаточно большой выборке стандартом считается z-тест; t-тест применяют для средних значений при неизвестной дисперсии.
Какой объём выборки считается достаточным? Распространённое правило — не менее 10 ожидаемых успехов и 10 ожидаемых неудач (\(n \cdot p_0 \geq 10\) и \(n \cdot (1-p_0) \geq 10\)).
Что означает малое p-значение? Оно говорит о том, что наблюдаемая доля была бы маловероятна, если бы истинная доля равнялась \(p_0\), — это аргумент в пользу отклонения нулевой гипотезы.