이 계산기의 기능
이 도구는 데이터 점들의 집합에 \(y = A\cdot x^{B}\) 형태의 거듭제곱 추세선을 적합합니다. 이때 각 점 (x, y)는 빈도(frequency) 또는 가중치 f를 가질 수 있습니다. 이는 자연로그 공간에서 수행되는 빈도 가중 최소제곱 회귀로, 거듭제곱 곡선을 \(\ln y = \ln A + B\cdot\ln x\) 라는 직선으로 바꿔 줍니다. 이 방법은 순수한 수학·통계 기법이므로 지역별 규정과 무관하게 어디서나 동일하게 적용됩니다.
사용 방법
x 값, y 값, 빈도를 길이가 같은 세 개의 쉼표 구분 목록으로 입력하세요. 모든 x와 y는 반드시 양수여야 하며(0이나 음수에서는 로그가 정의되지 않습니다), 모든 빈도는 0 이상이어야 합니다. 표시할 결과의 유효 숫자 자릿수를 선택한 다음, 적합된 계수 A, 지수 B, 그리고 피어슨 상관계수 \(r\)을 확인하면 됩니다.
공식 설명
각 행에 대해 \(X = \ln x\), \(Y = \ln y\)로 둡니다. 전체 가중치를 \(n = \sum f\)라 하면, 가중 평균은 다음과 같습니다.
$$\overline{\ln x} = \frac{\sum f\cdot\ln x}{n}, \quad \overline{\ln y} = \frac{\sum f\cdot\ln y}{n}$$가중 제곱합은 다음과 같이 계산됩니다.
$$S_{xx} = \sum f(\ln x)^2 - n\cdot\overline{\ln x}^{\,2}$$$$S_{yy} = \sum f(\ln y)^2 - n\cdot\overline{\ln y}^{\,2}$$$$S_{xy} = \sum f(\ln x)(\ln y) - n\cdot\overline{\ln x}\cdot\overline{\ln y}$$그러면 다음과 같이 됩니다.
$$B = \frac{S_{xy}}{S_{xx}}, \quad A = \exp\!\left(\overline{\ln y} - B\cdot\overline{\ln x}\right), \quad r = \frac{S_{xy}}{\sqrt{S_{xx}}\cdot\sqrt{S_{yy}}}$$각 점은 사실상 f번 반복된 것처럼 계산에 반영됩니다.
계산 예시
\(x = [1, 2, 3, 4, 5]\), \(y = [1, 4, 9, 16, 25]\)(정확히 \(y = x^2\))를 모든 빈도 1로 두고 계산해 봅시다. 결과는 \(S_{xx} \approx 1.615494\), \(S_{xy} \approx 3.230987\), \(S_{yy} \approx 6.461972\) 이므로 다음과 같습니다.
$$B = \frac{3.230987}{1.615494} = 2, \quad A = \exp(0) = 1, \quad r = 1$$즉 \(y = 1\cdot x^2\) 으로 예상대로 완벽하게 적합됩니다.
자주 묻는 질문
상관계수는 무엇을 의미하나요? \(|r|\)이 1에 가까울수록 거듭제곱 관계가 강함을 뜻합니다. 0.4–0.7은 보통, 0.2–0.4는 약함, 0.2 미만이면 거의 관계가 없다고 볼 수 있습니다.
왜 x와 y가 양수여야 하나요? 이 적합은 자연로그를 사용하는데, 로그는 양수에 대해서만 정의됩니다. 따라서 0 이하인 점은 계산에서 제외됩니다.
모든 x 값이 같으면 어떻게 되나요? 이 경우 \(S_{xx} = 0\) 이 되어 지수 B를 구할 수 없으므로 계산기가 오류를 표시합니다.