이 계산기의 기능
곡선 회귀분석 계산기는 (x, y) 데이터 표에 원하는 수학 곡선을 적합시켜 줍니다. 적합된 계수(A, B, 그리고 2차 모델의 경우 C), 명시적인 적합 방정식, 그리고 곡선이 데이터와 얼마나 잘 맞는지 알려 주는 상관계수 \(r\)을 함께 제공합니다. 순수한 통계 계산이므로 어느 나라에서나 동일하게 적용되며, 모든 값은 단위가 없는 무차원 수입니다.
지원하는 모델
다음 일곱 가지 곡선 계열을 적합할 수 있습니다. 선형(\(y = A + B\,x\)), 로그(\(y = A + B\ln x\)), e-지수(\(y = A\,e^{B\,x}\)), ab-지수(\(y = A\,B^{x}\)), 거듭제곱(\(y = A\,x^{B}\)), 역수(\(y = A + B/x\)), 2차(\(y = A + B\,x + C\,x^{2}\))입니다. 2차를 제외한 모든 모델은 변수를 변환(로그나 역수를 취함)한 뒤 최소제곱법으로 적합하고, 그 계수를 다시 원래대로 역변환하는 방식으로 계산됩니다.
사용 방법
한 줄에 (x, y) 쌍 하나씩 입력하세요. 예: 1,2. 드롭다운에서 회귀 유형을 고르고, 표시할 자릿수를 설정한 뒤 실행합니다. 로그와 거듭제곱 모델은 모든 x > 0이어야 하고, 지수와 거듭제곱 모델은 모든 y > 0이어야 하며, 역수 모델은 x ≠ 0이어야 합니다. 2차 모델은 최소 3개의 점이 필요합니다.
공식 설명
변환된 변수 u, v에 대해 최소제곱법은 기울기 $$B = \frac{N\sum uv - \sum u\sum v}{N\sum u^{2} - (\sum u)^{2}}$$ 절편 $$A = \frac{\sum v - B\sum u}{N}$$ 을 줍니다. 상관계수 \(r\)은 같은 분자를 x 변동항과 y 변동항의 곱의 제곱근으로 나눈 값입니다. 비선형 모델에서는 로그 공간에서 적합한 뒤 \(\exp(\dots)\)를 통해 A와 B를 복원합니다.
계산 예시 (선형)
데이터: (1,2), (2,3), (3,5), (4,4), (5,6). 여기서 \(N=5\), \(\sum x=15\), \(\sum y=20\), \(\sum x^{2}=55\), \(\sum xy=69\), \(\sum y^{2}=90\)입니다. 그러면 $$B = \frac{5\cdot 69 - 15\cdot 20}{5\cdot 55 - 225} = \frac{45}{50} = 0.9$$ 이고 $$A = \frac{20 - 0.9\cdot 15}{5} = 1.3$$ 입니다. 적합된 직선은 $$y = 1.3 + 0.9x$$ 이며, \(r = \dfrac{45}{\sqrt{50\cdot 50}} = 0.9\)로 강한 양의 상관관계를 보입니다.
자주 묻는 질문
r은 무엇을 뜻하나요? \(|r|\) 값이 0.7을 넘으면 강한 상관, 0.4~0.7은 중간, 0.2~0.4는 약한 상관, 0.2 미만이면 사실상 상관이 없음을 의미합니다.
지수 모델은 왜 음수 y를 받지 않나요? 적합 과정이 \(\ln(y)\)를 기준으로 이루어지는데, \(\ln(y)\)는 0 이하의 값에서 정의되지 않기 때문에 이러한 모델은 y > 0을 요구합니다.
어떤 모델을 골라야 하나요? 먼저 데이터를 그래프로 그려 보세요. 대체로 직선이면 선형, 점점 가팔라지는 성장이면 지수나 거듭제곱, 한 번 꺾이는 곡선이면 2차 모델이 적합합니다.