이 계산기의 기능
가중 이차 회귀 계산기는 각 점에 도수(빈도) 또는 가중치 f가 부여될 수 있는 (x, y) 데이터에 2차 다항식 \(y = A + Bx + Cx^{2}\)를 적합시킵니다. 이는 도수분포표 형태의 이차 최소제곱법으로, 어떤 점이 f번 나타나면 모든 합산에 f배만큼 기여합니다. 모든 도수를 1로 두면 일반적인(가중하지 않은) 이차 회귀와 동일해집니다. 순수한 통계 계산이므로 국가나 분야에 관계없이 똑같이 적용됩니다.
사용 방법
한 줄에 데이터 점 하나씩 x, y, f 형식으로 입력하세요. 도수 f는 선택 사항이며 비워 두면 기본값 1이 적용됩니다. 즉 2, 5는 x=2, y=5에 가중치 1을 의미합니다. 표시할 유효숫자 자릿수를 선택하세요(기본값 10). 이차식이 유일하게 결정되려면 서로 다른 x 값이 최소 3개 필요합니다. 계산기는 계수 A, B, C와 적합의 다중상관계수 \(r\)을 함께 보여 줍니다.
공식 설명
전체 가중치를 \(n = \Sigma f\)라 합니다. 가중 평균 \(\bar{x} = \Sigma xf/n\), \(\bar{y} = \Sigma yf/n\), \(\text{meanX2} = \Sigma x^{2}f/n\)을 계산합니다. 그다음 중심화된 합 \(S_{xx}\), \(S_{xy}\), \(S_{xx^2}\), \(S_{x^2x^2}\), \(S_{x^2y}\)를 구성하고, 분모 \(\text{denom} = S_{xx}\cdot S_{x^2x^2} - S_{xx^2}^{2}\)을 사용해 B와 C에 대한 2×2 연립방정식을 풉니다.
$$\hat{y} = A + B\,x + C\,x^{2} \\[1.5em] \text{where}\quad \left\{ \begin{aligned} B &= \frac{S_{xy}\,S_{x^2x^2} - S_{xx^2}\,S_{x^2y}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ C &= \frac{S_{xx}\,S_{x^2y} - S_{xx^2}\,S_{xy}}{S_{xx}\,S_{x^2x^2} - S_{xx^2}^{2}} \\ A &= \bar{y} - B\,\bar{x} - C\,\overline{x^2} \end{aligned} \right.$$마지막으로 \(A = \bar{y} - B\cdot\bar{x} - C\cdot\text{meanX2}\)가 됩니다. 상관계수는 \(r = \sqrt{1 - \text{SSE}/\text{SST}}\)로, 여기서 SSE는 가중 잔차제곱합, SST는 가중 총제곱합입니다.
계산 예시
모든 f = 1인 데이터: (1,2), (2,3), (3,6), (4,11), (5,18). 이때 \(n=5\), \(\bar{x}=3\), \(\bar{y}=8\), \(\text{meanX2}=11\)입니다. 합산 결과 \(S_{xx}=10\), \(S_{xy}=40\), \(S_{xx^2}=60\), \(S_{x^2x^2}=374\), \(S_{x^2y}=254\)이고, \(\text{denom} = 10\cdot 374 - 60^{2} = 140\)입니다. 따라서
$$B = \frac{40\cdot 374 - 60\cdot 254}{140} = -2, \quad C = \frac{10\cdot 254 - 60\cdot 40}{140} = 1, \quad A = 8 - (-2)(3) - 1\cdot 11 = 3$$적합식 \(y = 3 - 2x + x^{2}\)는 모든 점을 정확히 재현하므로 \(\text{SSE} = 0\), \(r = 1\)이 됩니다.
자주 묻는 질문
도수 열은 어떤 역할을 하나요? 해당 (x, y) 쌍의 가중치(개수)입니다. f = 4인 행은 동일한 관측값 4개로 계산되므로, 그룹화되거나 표로 정리된 데이터에 편리합니다.
왜 서로 다른 x 값이 3개 필요한가요? 포물선에는 세 개의 매개변수(A, B, C)가 있습니다. 서로 다른 x 값이 3개 미만이면 연립방정식이 특이(singular)해져 적합이 결정되지 않으며, 이때 계산기는 오류를 표시합니다.
r은 어떻게 해석하나요? \(r\)은 0에서 1 사이의 값입니다. 0.7 초과는 강한 적합, 0.4~0.7은 보통, 0.2~0.4는 약함, 0.2 미만은 사실상 상관 없음을 의미합니다.