MCPで接続 →

計算を入力してください

Enter each data point on its own line as x, y, f. The frequency (weight) f is optional and defaults to 1. Separate values with commas or spaces. Need at least 3 distinct x values.

公式

公式: 度数付き二次回帰計算

広告

結果

あてはめた二次回帰モデル
y = 3 + -2x + 1x²
二次式による最小二乗あてはめ
A(定数項) 3.0
B(一次の係数) -2.0
C(二次の係数) 1.0
相関係数 r 1.0
|r| の判断の目安: 0.7 < |r| ≤ 1 strong correlation · 0.4 < |r| < 0.7 moderate · 0.2 < |r| < 0.4 weak · 0 ≤ |r| < 0.2 no correlation.

この計算ツールでできること

度数付き二次回帰計算は、二次式 \(y = A + Bx + Cx^2\) を \((x, y)\) のデータ群にあてはめるツールです。各データ点には度数(重み)\(f\) を持たせることができます。これは度数分布表に対応した二次の最小二乗法で、\(f\) 回出現する点はすべての合計に \(f\) 倍だけ寄与します。すべての度数を 1 にすれば、通常の(重みなしの)二次回帰と完全に一致します。純粋な統計計算なので、国や分野を問わず同じように使えます。

使い方

1 行につき 1 つのデータ点を x, y, f の形式で入力します。度数 \(f\) は省略可能で、空欄のときは 1 とみなされます。したがって 2, 5 は x=2、y=5、重み 1 を意味します。表示する有効数字の桁数も選べます(初期値は 10 桁)。二次式を一意に決定するには、少なくとも 3 つの異なる \(x\) の値が必要です。計算結果として、係数 A・B・C とあてはめの重相関係数 \(r\) が表示されます。

計算式の解説

\(n = \Sigma f\) を総重み(度数の合計)とします。重み付き平均 \(\bar{x} = \Sigma xf / n\)、\(\bar{y} = \Sigma yf / n\)、\(\text{meanX2} = \Sigma x^2 f / n\) を求めます。続いて中心化した合計 \(S_{xx}\)、\(S_{xy}\)、\(S_{xx^2}\)、\(S_{x^2x^2}\)、\(S_{x^2y}\) を計算し、分母を \(\text{denom} = S_{xx} \cdot S_{x^2x^2} - S_{xx^2}^2\) として、B と C についての 2×2 連立方程式を解きます。$$\hat{y} = A + B\,x + C\,x^{2} \\[1.5em] \text{where}\quad \left\{ \begin{aligned} B &= \frac{S_{xy}\,S_{x^2x^2} - S_{xx^2}\,S_{x^2y}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ C &= \frac{S_{xx}\,S_{x^2y} - S_{xx^2}\,S_{xy}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ A &= \bar{y} - B\,\bar{x} - C\,\overline{x^2} \end{aligned} \right.$$ 最後に \(A = \bar{y} - B \cdot \bar{x} - C \cdot \text{meanX2}\) として定数項を求めます。相関係数は \(r = \sqrt{1 - \text{SSE}/\text{SST}}\) で計算され、SSE は重み付き残差平方和、SST は重み付き全平方和です。

広告
当てはめた放物線と重み付きデータ点の散布図
重み付き二次回帰は放物線 \(y = A + Bx + Cx^2\) をデータに当てはめ、各点の影響を頻度に応じて調整します。

計算例

すべて \(f = 1\) のデータ:\((1,2)\)、\((2,3)\)、\((3,6)\)、\((4,11)\)、\((5,18)\)。このとき n=5、\(\bar{x}=3\)、\(\bar{y}=8\)、\(\text{meanX2}=11\) となります。各合計は \(S_{xx}=10\)、\(S_{xy}=40\)、\(S_{xx^2}=60\)、\(S_{x^2x^2}=374\)、\(S_{x^2y}=254\)、\(\text{denom} = 10 \cdot 374 - 60^2 = 140\) です。これより $$B = \frac{40 \cdot 374 - 60 \cdot 254}{140} = -2$$ $$C = \frac{10 \cdot 254 - 60 \cdot 40}{140} = 1$$ $$A = 8 - (-2)(3) - 1 \cdot 11 = 3$$ となります。回帰式 \(y = 3 - 2x + x^2\) はすべての点を正確に再現するため、\(\text{SSE} = 0\)、\(r = 1\) です。

x と y のデータペアを重みに対応づけ、放物線当てはめに渡す頻度表
各 \((x, y)\) ペアは頻度の重みを持ち、当てはめ曲線をどれだけ強く引き寄せるかを決めます。

よくある質問

度数の列は何のためにあるの? その \((x, y)\) の組の重み(出現回数)を表します。\(f = 4\) の行は同じ観測値が 4 回あったものとして扱われるため、集計済みやグループ化されたデータを入力するのに便利です。

なぜ x の異なる値が 3 つ必要なの? 放物線には 3 つのパラメータ(A・B・C)があります。異なる \(x\) の値が 3 つ未満だと連立方程式が特異になり、あてはめが定まりません。その場合はエラーが表示されます。

r はどう読めばいい? \(r\) は 0 から 1 の範囲をとります。0.7 を超えると強い相関、0.4〜0.7 は中程度、0.2〜0.4 は弱い、0.2 未満はほとんど相関なしと判断します。

最終更新: