什么是加权曲线回归计算器?
这是一款通用的统计工具,能够对带频数权重的数据集拟合你所选定的曲线模型。你只需逐行输入 (x, y, 频数) 数据,再选择一种模型——线性、对数、e 指数、ab 指数、幂函数、反比例或二次函数,计算器便会返回拟合后的回归系数(A、B,二次模型还包括 C)、相关系数 \(r\),以及对相关强度的通俗解读。它完全基于纯数学运算,因此适用于任何场景,不涉及国家法规或特定单位。
使用方法
每行输入三个数字,用逗号或空格分隔:x、y、频数。频数(权重)表示该 (x, y) 点出现的次数;若留空,则默认为 1(即不加权)。选好模型后点击提交即可。请至少输入 2 个不同的数据点(二次模型需 3 个)。对数和幂函数模型要求 \(x > 0\);指数和幂函数模型要求 \(y > 0\);反比例模型要求 \(x \ne 0\)。
公式详解
大多数模型采用线性化方法进行拟合:先将 x 和/或 y 变换为 (X, Y),使关系式变成一条直线 \(Y = a + b\cdot X\),再以权重 \(w_i = f_i\) 进行加权最小二乘拟合。设 \(N = \Sigma w\),则斜率 $$b = \frac{N\cdot S_{xy} - S_x\cdot S_y}{N\cdot S_{xx} - S_x^{2}}$$ 截距 $$a = \frac{S_y - b\cdot S_x}{N}$$ 其中各求和项均为加权求和。皮尔逊相关系数 \(r\) 在变换后的空间中计算。对于 e 指数和 ab 指数模型,我们用 \(\ln(y)\) 对 \(x\) 拟合;幂函数模型用 \(\ln(y)\) 对 \(\ln(x)\) 拟合;反比例模型用 \(y\) 对 \(1/x\) 拟合。二次模型则直接求解 3×3 的加权正规方程,并给出复相关系数 \(R = \sqrt{1 - \text{SSE}/\text{SST}}\)。
实例演示
数据点 (x, y, f):(1,2,1)、(2,3,1)、(3,5,1)、(4,4,1)、(5,6,1),采用线性模型。\(N=5\),\(S_x=15\),\(S_y=20\),\(S_{xx}=55\),\(S_{xy}=69\),\(S_{yy}=90\)。则 $$b = \frac{5\cdot 69 - 15\cdot 20}{5\cdot 55 - 225} = \frac{45}{50} = 0.9$$ $$a = \frac{20 - 0.9\cdot 15}{5} = 1.3$$ 因此拟合直线为 \(y = 1.3 + 0.9x\),相关系数 \(r = \frac{45}{\sqrt{50\cdot 50}} = 0.9\)——属于强相关。
常见问题
频数那一列有什么作用? 它为每个数据点赋予权重:频数为 3 表示该点在每一项求和中被计入三次,效果与频数分布表完全一致。频数为 0 则该行被舍弃。
相关强度是如何划分的? 依据 \(|r|\) 的大小:大于 0.7 为强相关,0.4–0.7 为中等相关,0.2–0.4 为弱相关,0.2 及以下视为无相关。
为什么会出现错误提示? 如果所有 X 值都相同,分母为零,便无法确定唯一直线;或者你的数据违反了某模型的定义域(例如在指数模型中出现非正的 y 值)。