Что считает этот калькулятор
Инструмент подбирает прямую \(y = A + Bx\) по набору точек методом наименьших квадратов, причём каждая точка может иметь свой вес — частоту \(f\). Взвешивание по частоте позволяет компактно описывать повторяющиеся наблюдения: вместо того чтобы выписывать одну и ту же пару (x, y) много раз, вы указываете её один раз и задаёте количество повторений. Это универсальный статистический инструмент чистой математики — он работает одинаково в любой стране и не зависит от местных правил.
Как пользоваться
Вводите по одной строке на каждую точку в формате x, y, f. Столбец частоты необязателен: если его не указать, все точки получают одинаковый вес (обычная невзвешенная регрессия). Выберите, сколько значащих цифр выводить в результатах, и нажмите кнопку расчёта. Калькулятор вернёт уравнение прямой регрессии, наклон \(B\) и свободный член \(A\), коэффициент корреляции Пирсона \(r\), суммарную частоту \(n\), средние значения \(x\) и \(y\), а также вспомогательные суммы \(S_{xx}\), \(S_{yy}\) и \(S_{xy}\).
Разбираем формулу
Пусть строки пронумерованы \(i = 1..N\) и содержат значения \(x_i\), \(y_i\) и частоту \(f_i\). Суммарная частота равна \(n = \sum f_i\). Взвешенные средние: \(\bar{x} = \sum x_i f_i / n\) и \(\bar{y} = \sum y_i f_i / n\). Суммы квадратов: $$S_{xx} = \sum x_i^2 f_i - n\cdot\bar{x}^2, \quad S_{yy} = \sum y_i^2 f_i - n\cdot\bar{y}^2, \quad S_{xy} = \sum x_i y_i f_i - n\cdot\bar{x}\cdot\bar{y}.$$ Тогда наклон \(B = S_{xy}/S_{xx}\), свободный член \(A = \bar{y} - B\cdot\bar{x}\), а коэффициент корреляции $$r = \frac{S_{xy}}{\sqrt{S_{xx}}\cdot\sqrt{S_{yy}}}.$$
Пример расчёта
Для строк (1,2,1), (2,3,2), (3,5,1), (4,4,2), (5,6,1), (6,7,1): \(n = 8\), \(\bar{x} = 3{,}375\), \(\bar{y} = 4{,}25\). Далее \(S_{xx} = 19{,}875\), \(S_{yy} = 19{,}5\), \(S_{xy} = 18{,}25\). Значит, $$B = 18{,}25/19{,}875 \approx 0{,}9182, \quad A = 4{,}25 - 0{,}9182\cdot 3{,}375 \approx 1{,}1509,$$ а \(r \approx 0{,}9271\) — сильная положительная связь. Итоговая прямая: $$y = 1{,}1509 + 0{,}9182\cdot x.$$
Частые вопросы
Зачем нужен столбец частоты? Он задаёт вес каждой точки. Точка с \(f = 3\) учитывается так, будто вы наблюдали её три раза. Дробные веса тоже допустимы.
Что если r вычислить нельзя? Если все значения x одинаковы (\(S_{xx} = 0\)), наклон не определён. А если хотя бы одна из величин \(S_{xx}\) или \(S_{yy}\) равна нулю, корреляцию посчитать нельзя — ведь нет разброса значений.
Как оценить силу связи? По модулю \(|r|\): больше 0,7 — сильная связь, от 0,4 до 0,7 — умеренная, от 0,2 до 0,4 — слабая, а меньше 0,2 — связи практически нет.