什么是二次回归?
二次回归是把形如 \(y = A + B\cdot x + C\cdot x^2\) 的二阶多项式拟合到一组成对观测数据 (x, y) 上的方法。与直线不同,抛物线能够刻画"弯曲"的趋势——例如先升后降,或加速变化的数据——因此它在物理学(抛体运动)、经济学(成本曲线)以及任何两个变量之间存在弯曲关系的场景中都被广泛使用。这属于纯粹的数学与统计方法:无论在哪个国家或地区,算法都完全一致,不涉及任何地区性规则或单位。
如何使用本计算器
在文本框中输入你的数据点,每行一对,x 与 y 之间用空格或逗号分隔(例如 3, 5)。要确定 A、B、C 三个系数,至少需要 3 个数据点;点越多,拟合结果越可靠。选择想要显示的有效数字位数后,即可读取 A、B、C、组装好的回归方程以及相关系数 \(r\)。
公式详解
这些系数由最小二乘法求得。设有 \(n\) 个数据点,先计算均值 \(\bar{x}\)、\(\bar{y}\) 以及平方均值 \(\overline{x^2}\)。然后利用原点矩恒等式构造中心化求和量 \(S_{xx}\)、\(S_{xy}\)、\(S_{xx^2}\)、\(S_{x^2x^2}\) 和 \(S_{x^2y}\)(例如 \(S_{xx} = \Sigma x^2 - n\cdot\bar{x}^2\))。令 \(\text{denom} = S_{xx}\cdot S_{x^2x^2} - S_{xx^2}^2\),则各系数为:
$$y = A + Bx + Cx^{2}$$$$\text{where}\quad \left\{ \begin{aligned} B &= \frac{S_{xy}\,S_{x^2x^2} - S_{x^2y}\,S_{xx^2}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ C &= \frac{S_{x^2y}\,S_{xx} - S_{xy}\,S_{xx^2}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ A &= \bar{y} - B\,\bar{x} - C\,\overline{x^2} \end{aligned} \right.$$相关系数 \(r\) 等于:1 减去残差平方和与总平方和之比,再开平方根。
实例演算
以数据点 (1,1)、(2,2)、(3,5)、(4,10)、(5,17) 为例:\(n = 5\),\(\bar{x} = 3\),\(\bar{y} = 7\),\(\overline{x^2} = 11\)。由此得 \(S_{xx} = 10\),\(S_{xy} = 40\),\(S_{xx^2} = 60\),\(S_{x^2x^2} = 374\),\(S_{x^2y} = 254\),\(\text{denom} = 140\)。进而 \(B = -2\),\(C = 1\),\(A = 2\)。拟合结果为 \(y = 2 - 2x + x^2\),它恰好穿过每一个数据点,因此 \(r = 1\)。
常见问题
需要多少个数据点? 至少需要 3 个不同的 \(x\) 值;若数据点更少,或所有 \(x\) 都相同,方程组将出现退化,无法求解。
r 代表什么? 大致可参考:\(0.7<|r|\le 1\) 为强相关,\(0.4<|r|<0.7\) 为中等相关,\(0.2<|r|<0.4\) 为弱相关,低于 0.2 则基本不相关。\(r\) 等于 1 表示抛物线穿过了每一个数据点。
为什么这里的 r 不会是负数? 本计算器给出的是决定系数的非负平方根,因此无论曲线朝哪个方向弯曲,\(r\) 的取值范围都在 0 到 1 之间。