這個計算器的功能
「加權二次迴歸計算器」能將一組 (x, y) 資料點擬合成二次多項式 \(y = A + Bx + Cx^2\),其中每個點都可以帶有一個次數(或權重)f。這正是次數分配表形式的二次最小平方法:當某個點出現 f 次時,它在所有加總運算中就會被計算 f 次。如果把所有次數都設為 1,公式就會退化為一般(未加權)的二次迴歸。這純粹是統計運算,在任何國家或領域都通用一致。
使用方法
每行輸入一筆資料點,格式為 x, y, f。次數 f 可省略,留空時預設為 1,因此 2, 5 代表 x=2、y=5、權重為 1。你可以選擇要顯示的有效位數(預設 10 位)。由於二次曲線需要三個參數,至少要有 3 個不同的 x 值,二次迴歸才能被唯一決定。計算器會回報係數 A、B、C,以及擬合的複相關係數 r。
公式說明
令 \(n = \sum f\) 為總權重。先計算加權平均數 \(\bar{x} = \sum xf / n\)、\(\bar{y} = \sum yf / n\),以及 \(\overline{x^2} = \sum x^2 f / n\)。接著建立中心化的加總值 \(S_{xx}\)、\(S_{xy}\)、\(S_{xx^2}\)、\(S_{x^2x^2}\)、\(S_{x^2y}\),再以分母 \(\text{denom} = S_{xx}\cdot S_{x^2x^2} - S_{xx^2}^2\) 解出 B 與 C 的二元一次方程組:
$$\hat{y} = A + Bx + Cx^{2} \\[1.5em] \text{where}\quad \left\{ \begin{aligned} B &= \frac{S_{xy}\,S_{x^2x^2} - S_{xx^2}\,S_{x^2y}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ C &= \frac{S_{xx}\,S_{x^2y} - S_{xx^2}\,S_{xy}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ A &= \bar{y} - B\,\bar{x} - C\,\overline{x^2} \end{aligned} \right.$$相關係數則為 \(r = \sqrt{1 - \text{SSE}/\text{SST}}\),其中 SSE 是加權後的殘差平方和,SST 是加權後的總平方和。
實例演算
假設所有 f 都等於 1:(1,2)、(2,3)、(3,6)、(4,11)、(5,18)。此時 \(n=5\)、\(\bar{x}=3\)、\(\bar{y}=8\)、\(\overline{x^2}=11\)。各加總值為 \(S_{xx}=10\)、\(S_{xy}=40\)、\(S_{xx^2}=60\)、\(S_{x^2x^2}=374\)、\(S_{x^2y}=254\),分母 \(\text{denom} = 10\cdot 374 - 60^2 = 140\)。於是 $$B = \frac{40\cdot 374 - 60\cdot 254}{140} = -2$$ $$C = \frac{10\cdot 254 - 60\cdot 40}{140} = 1$$ $$A = 8 - (-2)(3) - 1\cdot 11 = 3$$ 擬合結果 \(y = 3 - 2x + x^2\) 完美通過每一個資料點,因此 \(\text{SSE} = 0\)、\(r = 1\)。
常見問題
次數欄位有什麼作用? 它是該 (x, y) 配對的權重(出現次數)。一筆 \(f = 4\) 的資料就等於四個相同的觀測值,對於分組或表格化的資料特別方便。
為什麼需要 3 個不同的 x 值? 拋物線有三個參數(A、B、C)。若不同的 x 值少於三個,方程組會變成奇異而無法唯一求解,此時計算器會回報錯誤。
r 該如何解讀? r 的範圍介於 0 到 1 之間。大於 0.7 代表擬合度強,0.4–0.7 為中等,0.2–0.4 偏弱,低於 0.2 則幾乎無關聯。