Подключиться через MCP →

Введите расчет

Каждая строка: значение x, значение y, частота f. Если f не указана, она принимается равной 1 (без весов).

Математическая формула

Show calculation steps (1)
  1. Correlation Coefficient

    Correlation Coefficient: Калькулятор линейной регрессии с частотными весами

    Frequency-weighted Pearson r using sums over the data rows.

Реклама

Результатов

@
Уравнение прямой регрессии
y = 1.150943396226415 + 0.9182389937106918 x
r = 0,927026 (strong correlation)
Свободный член A 1,1509433962
Наклон B 0,9182389937
Коэффициент корреляции r 0,9270261699
Суммарная частота n 8
Среднее значение x 3,375
Среднее значение y 4,25
Sxx 19,875
Syy 19,5
Sxy 18,25

Что считает этот калькулятор

Инструмент подбирает прямую \(y = A + Bx\) по набору точек методом наименьших квадратов, причём каждая точка может иметь свой вес — частоту \(f\). Взвешивание по частоте позволяет компактно описывать повторяющиеся наблюдения: вместо того чтобы выписывать одну и ту же пару (x, y) много раз, вы указываете её один раз и задаёте количество повторений. Это универсальный статистический инструмент чистой математики — он работает одинаково в любой стране и не зависит от местных правил.

Как пользоваться

Вводите по одной строке на каждую точку в формате x, y, f. Столбец частоты необязателен: если его не указать, все точки получают одинаковый вес (обычная невзвешенная регрессия). Выберите, сколько значащих цифр выводить в результатах, и нажмите кнопку расчёта. Калькулятор вернёт уравнение прямой регрессии, наклон \(B\) и свободный член \(A\), коэффициент корреляции Пирсона \(r\), суммарную частоту \(n\), средние значения \(x\) и \(y\), а также вспомогательные суммы \(S_{xx}\), \(S_{yy}\) и \(S_{xy}\).

Разбираем формулу

Пусть строки пронумерованы \(i = 1..N\) и содержат значения \(x_i\), \(y_i\) и частоту \(f_i\). Суммарная частота равна \(n = \sum f_i\). Взвешенные средние: \(\bar{x} = \sum x_i f_i / n\) и \(\bar{y} = \sum y_i f_i / n\). Суммы квадратов: $$S_{xx} = \sum x_i^2 f_i - n\cdot\bar{x}^2, \quad S_{yy} = \sum y_i^2 f_i - n\cdot\bar{y}^2, \quad S_{xy} = \sum x_i y_i f_i - n\cdot\bar{x}\cdot\bar{y}.$$ Тогда наклон \(B = S_{xy}/S_{xx}\), свободный член \(A = \bar{y} - B\cdot\bar{x}\), а коэффициент корреляции $$r = \frac{S_{xy}}{\sqrt{S_{xx}}\cdot\sqrt{S_{yy}}}.$$

Реклама
Схема, показывающая наклон B как подъём на смещение и пересечение A на прямой
Наклон B — это отношение подъёма к смещению прямой, а пересечение A — её значение при x = 0.
Диаграмма рассеяния со взвешенными точками разного размера и линией наилучшей регрессии
Взвешенная по частоте прямая наименьших квадратов y = A + Bx, проведённая через точки, размер маркеров которых отражает их частотный вес.

Пример расчёта

Для строк (1,2,1), (2,3,2), (3,5,1), (4,4,2), (5,6,1), (6,7,1): \(n = 8\), \(\bar{x} = 3{,}375\), \(\bar{y} = 4{,}25\). Далее \(S_{xx} = 19{,}875\), \(S_{yy} = 19{,}5\), \(S_{xy} = 18{,}25\). Значит, $$B = 18{,}25/19{,}875 \approx 0{,}9182, \quad A = 4{,}25 - 0{,}9182\cdot 3{,}375 \approx 1{,}1509,$$ а \(r \approx 0{,}9271\) — сильная положительная связь. Итоговая прямая: $$y = 1{,}1509 + 0{,}9182\cdot x.$$

Частые вопросы

Зачем нужен столбец частоты? Он задаёт вес каждой точки. Точка с \(f = 3\) учитывается так, будто вы наблюдали её три раза. Дробные веса тоже допустимы.

Что если r вычислить нельзя? Если все значения x одинаковы (\(S_{xx} = 0\)), наклон не определён. А если хотя бы одна из величин \(S_{xx}\) или \(S_{yy}\) равна нулю, корреляцию посчитать нельзя — ведь нет разброса значений.

Как оценить силу связи? По модулю \(|r|\): больше 0,7 — сильная связь, от 0,4 до 0,7 — умеренная, от 0,2 до 0,4 — слабая, а меньше 0,2 — связи практически нет.

Последнее обновление: