この計算ツールでできること
度数付き二次回帰計算は、二次式 \(y = A + Bx + Cx^2\) を \((x, y)\) のデータ群にあてはめるツールです。各データ点には度数(重み)\(f\) を持たせることができます。これは度数分布表に対応した二次の最小二乗法で、\(f\) 回出現する点はすべての合計に \(f\) 倍だけ寄与します。すべての度数を 1 にすれば、通常の(重みなしの)二次回帰と完全に一致します。純粋な統計計算なので、国や分野を問わず同じように使えます。
使い方
1 行につき 1 つのデータ点を x, y, f の形式で入力します。度数 \(f\) は省略可能で、空欄のときは 1 とみなされます。したがって 2, 5 は x=2、y=5、重み 1 を意味します。表示する有効数字の桁数も選べます(初期値は 10 桁)。二次式を一意に決定するには、少なくとも 3 つの異なる \(x\) の値が必要です。計算結果として、係数 A・B・C とあてはめの重相関係数 \(r\) が表示されます。
計算式の解説
\(n = \Sigma f\) を総重み(度数の合計)とします。重み付き平均 \(\bar{x} = \Sigma xf / n\)、\(\bar{y} = \Sigma yf / n\)、\(\text{meanX2} = \Sigma x^2 f / n\) を求めます。続いて中心化した合計 \(S_{xx}\)、\(S_{xy}\)、\(S_{xx^2}\)、\(S_{x^2x^2}\)、\(S_{x^2y}\) を計算し、分母を \(\text{denom} = S_{xx} \cdot S_{x^2x^2} - S_{xx^2}^2\) として、B と C についての 2×2 連立方程式を解きます。$$\hat{y} = A + B\,x + C\,x^{2} \\[1.5em] \text{where}\quad \left\{ \begin{aligned} B &= \frac{S_{xy}\,S_{x^2x^2} - S_{xx^2}\,S_{x^2y}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ C &= \frac{S_{xx}\,S_{x^2y} - S_{xx^2}\,S_{xy}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ A &= \bar{y} - B\,\bar{x} - C\,\overline{x^2} \end{aligned} \right.$$ 最後に \(A = \bar{y} - B \cdot \bar{x} - C \cdot \text{meanX2}\) として定数項を求めます。相関係数は \(r = \sqrt{1 - \text{SSE}/\text{SST}}\) で計算され、SSE は重み付き残差平方和、SST は重み付き全平方和です。
計算例
すべて \(f = 1\) のデータ:\((1,2)\)、\((2,3)\)、\((3,6)\)、\((4,11)\)、\((5,18)\)。このとき n=5、\(\bar{x}=3\)、\(\bar{y}=8\)、\(\text{meanX2}=11\) となります。各合計は \(S_{xx}=10\)、\(S_{xy}=40\)、\(S_{xx^2}=60\)、\(S_{x^2x^2}=374\)、\(S_{x^2y}=254\)、\(\text{denom} = 10 \cdot 374 - 60^2 = 140\) です。これより $$B = \frac{40 \cdot 374 - 60 \cdot 254}{140} = -2$$ $$C = \frac{10 \cdot 254 - 60 \cdot 40}{140} = 1$$ $$A = 8 - (-2)(3) - 1 \cdot 11 = 3$$ となります。回帰式 \(y = 3 - 2x + x^2\) はすべての点を正確に再現するため、\(\text{SSE} = 0\)、\(r = 1\) です。
よくある質問
度数の列は何のためにあるの? その \((x, y)\) の組の重み(出現回数)を表します。\(f = 4\) の行は同じ観測値が 4 回あったものとして扱われるため、集計済みやグループ化されたデータを入力するのに便利です。
なぜ x の異なる値が 3 つ必要なの? 放物線には 3 つのパラメータ(A・B・C)があります。異なる \(x\) の値が 3 つ未満だと連立方程式が特異になり、あてはめが定まりません。その場合はエラーが表示されます。
r はどう読めばいい? \(r\) は 0 から 1 の範囲をとります。0.7 を超えると強い相関、0.4〜0.7 は中程度、0.2〜0.4 は弱い、0.2 未満はほとんど相関なしと判断します。