加重(度数)曲線回帰計算ツールとは?
これは、度数で重み付けしたデータに任意の曲線モデルを当てはめる汎用の統計ツールです。(x, y, 度数) の行を入力し、線形・対数・e指数・ab指数・累乗・反比例・二次のいずれかのモデルを選ぶだけで、当てはめた係数(A、B、二次の場合は C)、相関係数 \(r\)、そして相関の強さをわかりやすい言葉で表示します。純粋な数学計算なので、国や単位を問わずどこでも利用できます。
使い方
1 行につき x, y, 度数 の 3 つの数値を、カンマまたはスペースで区切って入力します。度数(重み)は、その (x, y) の組が何回現れるかを表します。空欄にすると初期値の 1(重み付けなし)として扱われます。モデルを選んで計算を実行してください。少なくとも 2 つの異なる点(二次の場合は 3 つ)が必要です。対数モデルと累乗モデルは \(x > 0\)、指数モデルと累乗モデルは \(y > 0\)、反比例モデルは \(x \ne 0\) が条件となります。
計算式の解説
ほとんどのモデルは「線形化」によって当てはめます。x や y を変換して (X, Y) とし、関係を直線 \(Y = a + b\cdot X\) の形にしてから、重み \(w_i = f_i\) を用いた加重最小二乗法で当てはめます。\(N = \Sigma w\) とすると、傾きは $$ b = \frac{N\cdot S_{xy} - S_x \cdot S_y}{N\cdot S_{xx} - S_x^{2}} $$ 切片は $$ a = \frac{S_y - b\cdot S_x}{N} $$ で、各和は重み付きで計算します。ピアソンの相関係数 \(r\) は変換後の空間で求めます。e指数・ab指数モデルでは \(\ln(y)\) を x に対して当てはめ、累乗モデルでは \(\ln(y)\) を \(\ln(x)\) に対して、反比例モデルでは y を \(1/x\) に対して当てはめます。二次モデルは 3×3 の加重正規方程式を直接解き、重相関係数 \(R = \sqrt{1 - SSE/SST}\) を報告します。
計算例
点 (x, y, f):(1,2,1)、(2,3,1)、(3,5,1)、(4,4,1)、(5,6,1)、線形モデルの場合。\(N=5\)、\(S_x=15\)、\(S_y=20\)、\(S_{xx}=55\)、\(S_{xy}=69\)、\(S_{yy}=90\) となります。すると $$ b = \frac{5\cdot 69 - 15\cdot 20}{5\cdot 55 - 225} = \frac{45}{50} = 0.9 $$ $$ a = \frac{20 - 0.9\cdot 15}{5} = 1.3 $$ です。したがって \(y = 1.3 + 0.9x\)、 $$ r = \frac{45}{\sqrt{50\cdot 50}} = 0.9 $$ となり、これは強い相関を示します。
よくある質問
度数の列は何のためにありますか? 各点に重みを付けるためのものです。度数 3 は、その組をすべての和の中で 3 回数えることを意味し、度数分布表とまったく同じ仕組みです。度数 0 にすると、その行は計算から除外されます。
相関の強さはどう分類されますか? \(|r|\) の値で判定します。0.7 を超えると「強い」、0.4〜0.7 は「中程度」、0.2〜0.4 は「弱い」、0.2 以下は「相関なし」です。
エラーが出るのはなぜですか? すべての X 値が同じ場合は分母が 0 になり、一意の直線が定まりません。また、データがモデルの定義域に反している場合(例:指数モデルで y が正でない値を含む場合)にもエラーになります。