Что делает этот калькулятор
Инструмент оценивает качество модели бинарной классификации, рассчитывая три ключевые метрики: точность (precision), полноту (recall) и F1-меру. Вы вводите исходные значения из матрицы ошибок (confusion matrix) — истинно положительные (TP), ложноположительные (FP) и ложноотрицательные (FN) — а калькулятор возвращает каждую метрику в процентах. Эти показатели применяются повсеместно: в машинном обучении, информационном поиске, медицинской диагностике и любых задачах, где объекты делятся на положительные и отрицательные классы.
Как пользоваться
Укажите количество истинно положительных результатов (TP — верно предсказанные положительные), ложноположительных (FP — отрицательные, ошибочно отнесённые к положительным) и ложноотрицательных (FN — положительные, которые модель пропустила). Нажмите «Рассчитать», чтобы увидеть точность, полноту и F1. Истинно отрицательные значения (TN) для этих метрик не требуются.
Разбор формул
$$\text{Точность} = \frac{\text{TP}}{\text{TP} + \text{FP}}$$ отвечает на вопрос: «Из всего, что я отметил как положительное, сколько оказалось верным?» Высокая точность означает мало ложных срабатываний.
$$\text{Полнота} = \frac{\text{TP}}{\text{TP} + \text{FN}}$$ отвечает на вопрос: «Из всех действительно положительных объектов сколько я обнаружил?» Высокая полнота означает мало пропусков.
F1-мера — это гармоническое среднее двух предыдущих метрик: $$\text{F1} = 2 \cdot \frac{\text{Точность} \cdot \text{Полнота}}{\text{Точность} + \text{Полнота}}$$. Она уравновешивает оба показателя и особенно полезна при несбалансированных классах.
Пример расчёта
Допустим, спам-фильтр пометил как спам 100 писем. Из них 80 действительно спам (TP), а 20 — нет (FP). При этом фильтр пропустил 10 настоящих спам-писем (FN). Тогда точность $$= \frac{80}{80 + 20} = 0{,}80 = 80\%.$$ Полнота $$= \frac{80}{80 + 10} = 0{,}889 = 88{,}89\%.$$ F1 $$= 2 \cdot \frac{0{,}80 \cdot 0{,}889}{0{,}80 + 0{,}889} = 84{,}21\%.$$
Частые вопросы
Когда важнее точность, а когда полнота? Делайте упор на точность, когда дорого обходятся ложные срабатывания (например, когда нормальное письмо попадает в спам). Делайте упор на полноту, когда дорого пропустить положительный случай (например, при онкоскрининге).
Зачем нужна F1-мера? При несбалансированных данных доля верных ответов (accuracy) может вводить в заблуждение. F1 объединяет точность и полноту в одно сбалансированное число.
Что если знаменатель равен нулю? Если TP+FP или TP+FN равно нулю, метрика не определена — в этом случае калькулятор показывает 0%.