この計算ツールでできること
このツールは、最小二乗法を用いて一連のデータ点に直線 \(y = A + Bx\) を当てはめます。各データ点には度数(重み)\(f\) を持たせることができます。度数を使えば、同じ (x, y) の組を何度も書き並べる必要はなく、回数を添えて一度書くだけで繰り返し観測をコンパクトにまとめられます。これは国や地域を問わず同じように使える、純粋な数学・統計のツールです。
使い方
1行につき1組のデータを x, y, f の形式で入力します。度数列の入力は任意で、省略した場合はすべての点が等しい重み(=通常の重みなし回帰)として扱われます。表示する有効数字の桁数を選んでから計算を実行してください。計算結果として、回帰直線、傾き B と切片 A、ピアソンの相関係数 r、総度数 n、x と y の平均、そして補助的な平方和 Sxx・Syy・Sxy が表示されます。
計算式の解説
各行を \(i = 1 \sim N\) とし、その値を \(x_i\)、\(y_i\)、度数を \(f_i\) とします。総度数は \(n = \sum f_i\) です。加重平均は \(\bar{x} = \sum x_i f_i / n\)、\(\bar{y} = \sum y_i f_i / n\) となります。平方和は $$S_{xx} = \sum x_i^2 f_i - n\cdot\bar{x}^2$$ $$S_{yy} = \sum y_i^2 f_i - n\cdot\bar{y}^2$$ $$S_{xy} = \sum x_i y_i f_i - n\cdot\bar{x}\cdot\bar{y}$$ です。傾きは $$B = \frac{S_{xy}}{S_{xx}}$$ 切片は $$A = \bar{y} - B\cdot\bar{x}$$ 相関係数は $$r = \frac{S_{xy}}{\sqrt{S_{xx}}\cdot\sqrt{S_{yy}}}$$ で求められます。
計算例
行 (1,2,1)、(2,3,2)、(3,5,1)、(4,4,2)、(5,6,1)、(6,7,1) の場合:\(n = 8\)、\(\bar{x} = 3.375\)、\(\bar{y} = 4.25\) となります。このとき \(S_{xx} = 19.875\)、\(S_{yy} = 19.5\)、\(S_{xy} = 18.25\) です。よって $$B = \frac{18.25}{19.875} \approx 0.9182$$ $$A = 4.25 - 0.9182\cdot 3.375 \approx 1.1509$$ $$r \approx 0.9271$$ となり、強い正の相関を示します。当てはめた回帰直線は $$y = 1.1509 + 0.9182\cdot x$$ です。
よくある質問
度数の列は何のためにあるのですか? 各点に重みを付けるためのものです。\(f = 3\) の点は、その点を3回観測したのと同じように扱われます。小数の重みも指定できます。
r が計算できないのはどんなときですか? すべての x が等しい(\(S_{xx} = 0\))場合は傾きが定義できません。また \(S_{xx}\) または \(S_{yy}\) のどちらかが 0 のときは、ばらつきが存在しないため相関係数を計算できません。
相関の強さはどう判断しますか? \(|r|\) の値で判断します。0.7 を超えると強い相関、0.4〜0.7 で中程度、0.2〜0.4 で弱い相関、0.2 未満ではほとんど相関がないとみなします。