対数回帰とは?
対数回帰は、データに \(y = A + B\cdot\ln(x)\) という形の曲線を当てはめる手法です。最初は急激に増加し、その後ゆるやかに頭打ちになるような量を扱うときに役立ちます。つまり、x が一定の倍率で増えるごとに、y がほぼ一定量ずつ増えるような関係を表現できます。すべての x の値に自然対数をとると、変換後の変数 \(u = \ln(x)\) における通常の直線(最小二乗法)の当てはめ問題に置き換わります。
この計算ツールの使い方
表の入力欄に、(x, y) のペアを1行に1組ずつ、カンマまたはスペースで区切って入力してください。\(\ln(x)\) は 0 や負の数では定義できないため、x の値は必ず正でなければなりません。条件を満たさない行や空白行は無視されます。表示する有効桁数を選んだら、当てはめた切片 A、係数 B、相関係数 r、各平均値を確認できます。
計算式の解説
\(u_i = \ln(x_i)\) とします。まず u と y の平均を求め、続いて平方和 \(S_{xx} = \sum (u-\bar{u})^2\)、\(S_{yy} = \sum (y-\bar{y})^2\)、積和 \(S_{xy} = \sum (u-\bar{u})(y-\bar{y})\) を計算します。傾きは $$ B = \frac{S_{xy}}{S_{xx}} $$ 切片は $$ A = \bar{y} - B\cdot\bar{u} $$ 相関係数は $$ r = \frac{S_{xy}}{\sqrt{S_{xx}} \cdot \sqrt{S_{yy}}} $$ で求められます。なお、表示される「x の平均」は算術平均ではなく幾何平均 \(\exp(\bar{u})\) です。これは当てはめが対数空間で行われるためです。
計算例
点 (1, 2.0), (2, 4.0), (3, 5.0), (4, 5.5), (5, 6.0) の場合:\(\text{meanLnX} = 0.957498\)、\(\text{meanY} = 4.5\)、\(S_{xx} = 1.615493\)、\(S_{yy} = 10.0\)、\(S_{xy} = 4.003192\) となります。したがって \(B = 2.4780\)、\(A = 2.1273\)、\(r = 0.9963\)(強い相関)です。当てはめた直線は $$ y = 2.1273 + 2.4780\cdot\ln(x) $$ であり、幾何平均 \(x = \exp(0.957498) = 2.6051\) となります。
よくある質問
なぜ「x の平均」が入力した x の単純平均にならないのですか? 回帰計算は \(\ln(x)\) に対して行われるため、このモデルにおける x データの自然な中心は幾何平均 \(\exp(\overline{\ln x})\) になります。そのため、その値が表示されます。
相関係数 r はどう読めばよいですか? \(|r|\) が 0.7 以上なら強い関係、0.4〜0.7 なら中程度、0.2〜0.4 なら弱い関係、0.2 未満ならほぼ相関なしと判断できます。
x の値がすべて同じ場合はどうなりますか? その場合 \(S_{xx} = 0\) となり傾きが定義できなくなる(ゼロ除算)ため、当てはめは計算できません。少なくとも 2 つの異なる x の値が必要です。