逆数回帰とは
逆数回帰(反比例回帰とも呼ばれます)は、対になった観測データを \(y = A + \dfrac{B}{x}\) というモデルに当てはめる手法です。この曲線は、ある量が \(1/x\) に比例して減衰していくとき——たとえば \(x\) が小さいうちは応答が大きく、\(x\) が大きくなるにつれて一定のベースライン \(A\) に近づいていくような場合に自然な選択肢となります。このモデルは変換後の説明変数 \(u = 1/x\) に対して線形なので、通常の最小二乗法によって厳密に解くことができます。数学・統計の普遍的なツールであり、計算式は世界中どこでも同じです。
使い方
データは 1 行につき 1 点ずつ、x, y の形式(カンマまたはスペース区切り)で入力してください。点は最低 2 つ必要で、モデルが \(1/x\) を用いるため、すべての \(x\) は 0 以外でなければなりません。表示結果の有効桁数を選べます(これは表示の整形にのみ影響し、内部計算には影響しません)。計算結果として、切片 \(A\)、分子の係数 \(B\)、\(1/x\) と \(y\) の相関係数 \(r\)、値を代入した完全な式、そして散布図に重ねて描ける回帰曲線のサンプル点が得られます。
計算式の解説
各点について \(u_i = 1/x_i\) を求め、\(y\) を \(u\) に対して単回帰します。平均 \(\bar{u}\) と \(\bar{y}\) を使って、\(S_{uu} = \sum u^2 - n\cdot\bar{u}^2\)、\(S_{uy} = \sum (u\cdot y) - n\cdot\bar{u}\cdot\bar{y}\)、\(S_{yy} = \sum y^2 - n\cdot\bar{y}^2\) を計算します。すると傾きは $$B = \frac{S_{uy}}{S_{uu}}$$ 切片は $$A = \bar{y} - B\cdot\bar{u}$$ 相関係数は $$r = \frac{S_{uy}}{\sqrt{S_{uu}} \cdot \sqrt{S_{yy}}}$$ となります。
計算例
\(x = [1, 2, 3, 4, 5]\)、\(y = [6, 3, 2, 1.5, 1.2]\) の場合:\(\bar{u} = 0.456667\)、\(\bar{y} = 2.74\)、\(S_{uu} = 0.420889\)、\(S_{uy} = 2.525333\)、\(S_{yy} = 15.152\) です。したがって $$B = \frac{2.525333}{0.420889} = 6.000$$ $$A = 2.74 - 6\cdot 0.456667 = 0.000$$ $$r = \frac{2.525333}{0.648759 \cdot 3.892557} = 1.000$$ となります。当てはめ結果はちょうど \(y = 6/x\)、つまり完全な反比例の関係です。
よくある質問
なぜ \(x\) は 0 にできないのですか? モデルは \(1/x\) を用いますが、これは \(x = 0\) で定義できません。そのため該当する行はスキップされ、その旨が表示されます。
ここでの \(r\) は何を表しますか? \(1/x\) が \(y\) をどれだけうまく線形に予測できるかを示します。\(|r|\) が 0.7 を超えると強い相関、0.4〜0.7 で中程度、0.2〜0.4 で弱い相関、0.2 未満ではほぼ相関なしと判断します。
当てはめがうまくいかないのはどんなとき? すべての \(x\) が同じ値だと、\(1/x\) もすべて同じになり、\(S_{uu} = 0\) となって傾きを求められません。