Подключиться через MCP →

Введите расчет

Enter each data point on its own line as x, y, f. The frequency (weight) f is optional and defaults to 1. Separate values with commas or spaces. Need at least 3 distinct x values.

Математическая формула

Математическая формула: Калькулятор взвешенной квадратичной регрессии

Реклама

Результатов

Подобранная квадратичная модель
y = 3 + -2x + 1x²
подбор полинома второй степени методом наименьших квадратов
A (свободный член) 3.0
B (линейный коэффициент) -2.0
C (квадратичный коэффициент) 1.0
Коэффициент корреляции r 1.0
Интерпретация |r|: 0.7 < |r| ≤ 1 strong correlation · 0.4 < |r| < 0.7 moderate · 0.2 < |r| < 0.4 weak · 0 ≤ |r| < 0.2 no correlation.

Что делает этот калькулятор

Калькулятор взвешенной квадратичной регрессии подбирает полином второй степени \(y = A + Bx + Cx^{2}\) по набору точек \((x, y)\), где каждой точке можно задать частоту или вес \(f\). Это вариант метода наименьших квадратов для квадратичной регрессии, рассчитанный на таблицу частот: точка, встречающаяся \(f\) раз, входит в каждую сумму с весом \(f\). Если для всех точек задать частоту 1, расчёт сводится к обычной (невзвешенной) квадратичной регрессии. Это чистая статистика, которая работает одинаково в любой стране и в любой области.

Как пользоваться

Вводите по одной точке данных в строке в формате x, y, f. Частота \(f\) необязательна и по умолчанию равна 1, если поле оставлено пустым, поэтому запись 2, 5 означает x=2, y=5 с весом 1. Выберите, сколько значащих цифр выводить (по умолчанию 10). Чтобы парабола определялась однозначно, нужно не менее 3 различных значений \(x\). Калькулятор выдаёт коэффициенты A, B, C и множественный коэффициент корреляции \(r\) для построенной модели.

Разбор формулы

Пусть \(n = \Sigma f\) — суммарный вес. Вычислите взвешенные средние \(\bar{x} = \Sigma xf/n\), \(\bar{y} = \Sigma yf/n\) и \(\overline{x^2} = \Sigma x^{2}f/n\). Затем сформируйте центрированные суммы \(S_{xx}\), \(S_{xy}\), \(S_{xx^2}\), \(S_{x^2x^2}\), \(S_{x^2y}\) и решите систему \(2\times 2\) относительно B и C:

$$\hat{y} = A + B\,x + C\,x^{2} \\[1.5em] \text{where}\quad \left\{ \begin{aligned} B &= \frac{S_{xy}\,S_{x^2x^2} - S_{xx^2}\,S_{x^2y}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ C &= \frac{S_{xx}\,S_{x^2y} - S_{xx^2}\,S_{xy}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ A &= \bar{y} - B\,\bar{x} - C\,\overline{x^2} \end{aligned} \right.$$

со знаменателем \(\text{denom} = S_{xx}\cdot S_{x^2x^2} - S_{xx^2}^{2}\): \(B = (S_{xy}\cdot S_{x^2x^2} - S_{xx^2}\cdot S_{x^2y})/\text{denom}\) и \(C = (S_{xx}\cdot S_{x^2y} - S_{xx^2}\cdot S_{xy})/\text{denom}\). Наконец, \(A = \bar{y} - B\cdot\bar{x} - C\cdot\overline{x^2}\). Коэффициент корреляции равен \(r = \sqrt{1 - \text{SSE}/\text{SST}}\), где SSE — взвешенная сумма квадратов остатков, а SST — взвешенная полная сумма квадратов.

Реклама
Диаграмма рассеяния взвешенных точек данных с подогнанной параболой
Взвешенная квадратичная регрессия подгоняет параболу y = A + Bx + Cx² к данным, масштабируя влияние каждой точки по её частоте.

Пример с расчётом

Данные, у которых все \(f = 1\): (1,2), (2,3), (3,6), (4,11), (5,18). Здесь \(n=5\), \(\bar{x}=3\), \(\bar{y}=8\), \(\overline{x^2}=11\). Суммы дают \(S_{xx}=10\), \(S_{xy}=40\), \(S_{xx^2}=60\), \(S_{x^2x^2}=374\), \(S_{x^2y}=254\), а \(\text{denom} = 10\cdot 374 - 60^{2} = 140\). Тогда \(B = (40\cdot 374 - 60\cdot 254)/140 = -2\), \(C = (10\cdot 254 - 60\cdot 40)/140 = 1\), а \(A = 8 - (-2)(3) - 1\cdot 11 = 3\). Модель \(y = 3 - 2x + x^{2}\) точно проходит через все точки, поэтому \(\text{SSE} = 0\) и \(r = 1\).

Таблица частот, сопоставляющая пары данных x и y с весами для подгонки параболы
Каждая пара (x, y) несёт частотный вес, определяющий, насколько сильно она притягивает подогнанную кривую.

Частые вопросы

Зачем нужен столбец частоты? Это вес (количество повторений) данной пары \((x, y)\). Строка с \(f = 4\) учитывается как четыре одинаковых наблюдения — это удобно для сгруппированных или табличных данных.

Почему нужно 3 различных значения x? У параболы три параметра (A, B, C). Если различных значений \(x\) меньше трёх, система становится вырожденной, а модель — неопределённой; в этом случае калькулятор выдаёт ошибку.

Как интерпретировать r? Значение \(r\) изменяется от 0 до 1. Выше 0,7 — сильная связь, 0,4–0,7 — умеренная, 0,2–0,4 — слабая, ниже 0,2 — практически отсутствует.

Последнее обновление: