這個計算器能做什麼
本工具會將形如 \(y = A + B\cdot\ln(x)\) 的對數迴歸曲線,擬合到一張觀測資料表上,而表中每一列都帶有一個頻率(權重)f。頻率加權讓你可以用很精簡的方式輸入分組或重複的資料:與其把同一組 (x, y) 重複列出許多次,你只要寫一次,再標上它出現的次數 f 即可。這套方法是純粹的統計運算,在任何地方都一樣適用——不牽涉任何單位或特定國家的規定。
使用方式
每一行輸入一組觀測值,格式為 x y f。頻率欄位可省略;若不填,每一列就視為出現一次(f = 1)。由於要對 x 取自然對數,因此每個 x 都必須大於零。請至少提供兩列、且 x 值彼此相異,迴歸直線才能被確定。你也可以挑選顯示精度(預設為 10 位有效位數)——這只會影響顯示數字的四捨五入,完全不會改變底層的實際計算。
公式說明
設各組為 i = 1..m,令 \(n = \sum f_i\)。加權平均為 $$\text{meanLnX} = \frac{\sum f_i\,\ln x_i}{n}$$ 與 $$\text{meanY} = \frac{\sum f_i\,y_i}{n}$$。加權平方和為 $$S_{xx} = \sum f_i(\ln x_i)^2 - n\cdot\text{meanLnX}^2$$ $$S_{yy} = \sum f_i y_i^2 - n\cdot\text{meanY}^2$$ 以及 $$S_{xy} = \sum f_i\,\ln x_i\,y_i - n\cdot\text{meanLnX}\cdot\text{meanY}$$ 接著 \(B = S_{xy}/S_{xx}\)、\(A = \text{meanY} - B\cdot\text{meanLnX}\),而 $$r = \frac{S_{xy}}{\sqrt{S_{xx}}\,\sqrt{S_{yy}}}$$
範例試算
以五列、所有 f = 1 的資料——(1,2)、(2,3)、(3,3)、(4,4)、(5,4)——為例,可得 \(\text{meanLnX} = 0.9574984\)、\(\text{meanY} = 3.2\)、\(S_{xx} = 1.6154888\)、\(S_{yy} = 2.8\)、\(S_{xy} = 2.0382328\)。於是 \(B = 1.2616933\)、\(A = 1.9919295\)、\(r = 0.9583567\)。擬合曲線為 $$y = 1.9919 + 1.2617\cdot\ln(x)$$ 相關性相當強。
常見問題
頻率欄位有什麼作用?它會對每一列加權。f = 5 的那一列會被當成五筆相同的觀測值,因此它對擬合結果的影響力,是 f = 1 那一列的五倍。
該如何判讀 r?\(|r|\) 大於 0.7 代表強相關,0.4~0.7 為中度,0.2~0.4 為弱,低於 0.2 則幾乎沒有相關性。
為什麼會顯示「無法擬合」?擬合需要至少兩個相異的 x 值(否則 \(S_{xx} = 0\)),且總頻率必須為正。此外所有 x 值都必須大於零,\(\ln(x)\) 才有定義。