Что такое квадратичная регрессия?
Квадратичная регрессия подбирает многочлен второй степени вида \(y = A + B\cdot x + C\cdot x^{2}\) к набору парных наблюдений (x, y). В отличие от прямой линии, парабола способна описать кривизну зависимости — данные, которые сначала растут, а затем убывают, или ускоряются. Поэтому такая модель широко применяется в физике (движение тела, брошенного под углом), в экономике (кривые издержек) и в любой задаче, где связь между двумя переменными нелинейна. Это чистая математика и статистика: метод работает одинаково в любой стране и не привязан к каким-либо региональным правилам или единицам измерения.
Как пользоваться калькулятором
Введите свои точки в поле ввода — по одной паре в строке, разделяя x и y пробелом или запятой (например, 3, 5). Чтобы определить три коэффициента A, B и C, нужно как минимум три точки; чем больше точек, тем надёжнее результат. Укажите, сколько значащих цифр выводить, после чего вы увидите значения A, B, C, готовое уравнение регрессии и коэффициент корреляции r.
Разбор формулы
Коэффициенты вычисляются методом наименьших квадратов. Для \(n\) точек сначала находят средние \(\bar{x}\), \(\bar{y}\) и среднее квадратов \(\overline{x^2}\). Затем формируют центрированные суммы \(S_{xx}\), \(S_{xy}\), \(S_{xx^2}\), \(S_{x^2x^2}\) и \(S_{x^2y}\) по тождествам для начальных моментов (например, \(S_{xx} = \Sigma x^{2} - n\cdot\bar{x}^{2}\)). При \(\text{denom} = S_{xx}\cdot S_{x^2x^2} - S_{xx^2}^{2}\) коэффициенты равны:
$$y = A + Bx + Cx^{2}$$$$\left\{ \begin{aligned} B &= \frac{S_{xy}\,S_{x^2x^2} - S_{x^2y}\,S_{xx^2}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ C &= \frac{S_{x^2y}\,S_{xx} - S_{xy}\,S_{xx^2}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ A &= \bar{y} - B\,\bar{x} - C\,\overline{x^2} \end{aligned} \right.$$Коэффициент корреляции r — это квадратный корень из единицы минус отношение остаточной суммы квадратов к общей сумме квадратов.
Разобранный пример
Для точек (1,1), (2,2), (3,5), (4,10), (5,17): \(n = 5\), \(\bar{x} = 3\), \(\bar{y} = 7\), \(\overline{x^2} = 11\). Отсюда \(S_{xx} = 10\), \(S_{xy} = 40\), \(S_{xx^2} = 60\), \(S_{x^2x^2} = 374\), \(S_{x^2y} = 254\), \(\text{denom} = 140\). Получаем \(B = -2\), \(C = 1\), \(A = 2\). Итоговая модель — \(y = 2 - 2x + x^{2}\), и она проходит точно через каждую точку, поэтому \(r = 1\).
Частые вопросы
Сколько точек нужно? Минимум три различных значения x. Если точек меньше или все x совпадают, система вырождается и решения не имеет.
Что означает r? Ориентировочно: \(0{,}7 < |r| \le 1\) — сильная связь, \(0{,}4 < |r| < 0{,}7\) — умеренная, \(0{,}2 < |r| < 0{,}4\) — слабая, а ниже \(0{,}2\) — связь практически отсутствует. Значение 1 означает, что парабола проходит через каждую точку.
Почему здесь r никогда не бывает отрицательным? Калькулятор выводит неотрицательный корень из коэффициента детерминации, поэтому r всегда находится в диапазоне от 0 до 1 независимо от направления кривой.