이 계산기는 무엇을 하나요
이 도구는 짝지어진 관측값 (x, y) 표에 원하는 곡선 회귀 모형을 최소제곱법으로 적합합니다. 적합된 계수(A, B, 그리고 이차 모형의 경우 C), 모형이 데이터를 얼마나 잘 설명하는지 나타내는 상관계수 r, 그리고 적합된 식에서 직접 계산한 추정값을 함께 알려줍니다. 특정 국가의 규칙에 얽매이지 않는, 어디서나 쓸 수 있는 수학·통계 도구입니다.
7가지 모형
선형(\(y = A + B\cdot x\)), 로그(\(y = A + B\cdot\ln x\)), e-지수(\(y = A\cdot e^{Bx}\)), ab-지수(\(y = A\cdot B^{x}\)), 거듭제곱(\(y = A\cdot x^{B}\)), 역수(\(y = A + B/x\)), 이차(\(y = A + B\cdot x + C\cdot x^{2}\)) 중에서 고를 수 있습니다. 이차를 제외한 모든 모형은 \(Y = a + b\cdot X\) 형태로 선형화한 뒤 일반 최소제곱법을 적용해 적합하며, 이차 모형은 \(3\times 3\) 정규방정식을 풀어 구합니다.
사용 방법
x 값과 y 값을 길이가 같은 쉼표 구분 목록으로 입력하고, 회귀 유형을 선택한 뒤, x로 y를 추정할지 y로 x를 추정할지 정하고 알고 있는 입력값을 적으면 됩니다. 계산기는 계수, 상관계수 r, 추정값을 돌려줍니다.
공식 설명
선형화한 짝 (X, Y)에 대해 \(b = S_{xy} / S_{xx}\), \(a = \bar{Y} - b\cdot\bar{X}\) 입니다. 여기서 \(S_{xx} = \sum X^2 - n\bar{X}^2\), \(S_{xy} = \sum XY - n\bar{X}\bar{Y}\) 입니다. 상관계수는 $$r = \frac{S_{xy}}{\sqrt{S_{xx}\cdot S_{yy}}}$$ 입니다. 이렇게 구한 값을 다시 대입해 계수를 복원합니다(예: 지수·거듭제곱 모형에서는 \(A = e^{a}\)).
풀이 예시
x = [1,2,3,4,5,6,7], y = [3,5,7,8,11,13,14] 를 선형으로 적합하면 \(S_{xx} = 28\), \(S_{xy} = 53\) 이므로 \(B = 53/28 = 1.892857\), \(A = 8.714286 - 1.892857\cdot 4 = 1.142857\) 입니다. 상관계수는 $$r = \frac{53}{\sqrt{28\cdot 101.4286}} = 0.99453$$ 입니다. x = 64 에서 y를 추정하면 \(1.142857 + 1.892857\cdot 64 = 122.2857\) 이 나오는데, 이는 데이터 범위를 크게 벗어난 외삽입니다.
자주 묻는 질문
r은 어떻게 해석하나요? 대략적으로 \(0.7 < |r| \le 1\) 이면 강한 상관, \(0.4 < |r| < 0.7\) 이면 중간, \(0.2 < |r| < 0.4\) 이면 약한 상관, 0.2 미만이면 무시할 수준입니다.
일부 모형이 거부되는 이유는 무엇인가요? 로그·거듭제곱 모형은 \(x > 0\), 지수·거듭제곱 모형은 \(y > 0\), 역수 모형은 \(x \ne 0\) 이어야 합니다. 로그나 역수 변환을 사용하기 때문입니다.
외삽해도 되나요? 가능합니다. 다만 관측된 데이터 범위 밖의 추정값은 외삽이므로 주의해서 다뤄야 합니다.