MCP로 연결 →

계산 입력

모든 X·Y 값은 반드시 0보다 커야 합니다. 0 이하의 값이 있는 행은 무시됩니다. 유효한 점이 최소 2개 이상 필요합니다.

공식

광고

결과

거듭제곱 회귀 방정식
y = 1.765548701 * x^1.754405692
Strong correlation
계수 A 1.765549
지수 B 1.754406
상관계수 r 0.993169
데이터 점 개수 5

거듭제곱 회귀란?

거듭제곱 회귀(power regression)는 데이터 점들에 \(y = A \cdot x^{B}\) 형태의 모델을 적합시키는 방법입니다. 이 곡선은 한 양이 다른 양의 거듭제곱에 비례해 변할 때 자주 나타나며, 물리학·생물학·경제학 전반에서 흔히 볼 수 있습니다. 대표적으로 상대성장(allometric growth), 학습 곡선, 그리고 수많은 스케일링 법칙이 이에 해당합니다. 지수 \(B\)는 양이 얼마나 빠르게 변하는지(스케일링 속도)를 알려 주고, 계수 \(A\)는 전체적인 크기 수준을 결정합니다.

x-y축의 흩어진 데이터 점에 적합된 거듭제곱 법칙 곡선 추세선
거듭제곱 회귀는 흩어진 데이터 점에 곡선 \(y = A \cdot x^{B}\)를 적합시킵니다.

계산기 사용 방법

X 값과 Y 값을 쉼표 또는 공백으로 구분해 입력하세요. 입력 순서대로 짝이 지어지므로 첫 번째 X는 첫 번째 Y와 대응됩니다. 적합 과정에서 자연로그를 사용하기 때문에 모든 값은 반드시 0보다 커야 하며, 0 이하의 값이 들어간 행은 자동으로 무시됩니다. 표시할 유효 숫자 자릿수를 선택한 뒤 계수와 상관계수 \(r\)을 확인하면 됩니다.

공식 풀이

핵심은 선형화입니다. \(y = A \cdot x^{B}\)의 양변에 자연로그를 취하면 \(\ln y = \ln A + B \cdot \ln x\)가 되어, \(t = \ln x\), \(u = \ln y\)로 변환한 변수에서는 직선이 됩니다. 이제 일반 최소제곱 회귀를 적용합니다. 평균을 구하고, 제곱합 \(S_{xx}\)와 \(S_{yy}\), 그리고 교차곱 \(S_{xy}\)를 계산합니다. 기울기 \(B = S_{xy}/S_{xx}\)가 바로 지수이고, \(A = \exp(\overline{\ln y} - B \cdot \overline{\ln x})\)로 구합니다. 상관계수 \(r = S_{xy}/\sqrt{S_{xx} \cdot S_{yy}}\)는 로그 변환된 점들이 얼마나 잘 직선에 들어맞는지를 나타냅니다.

$$y = A \cdot x^{B}$$ $$\text{where}\quad \left\{ \begin{aligned} B &= \frac{n\sum \ln x_i \ln y_i - \sum \ln x_i \sum \ln y_i}{n\sum (\ln x_i)^2 - \left(\sum \ln x_i\right)^2} \\ A &= \exp\!\left( \overline{\ln y} - B\,\overline{\ln x} \right) \\ x_i &= \text{X values},\quad y_i = \text{Y values} \end{aligned} \right.$$
광고
로그-로그 축에서 직선으로 변환된 곡선형 거듭제곱 데이터
로그를 취하면 거듭제곱 곡선이 직선이 되어 최소제곱 적합이 가능해집니다.

풀이 예제

데이터 \((1,2)\), \((2,5)\), \((3,11)\), \((4,21)\), \((5,33)\), \(n = 5\)에 대해 로그 합을 계산하면 \(S_{xx} \approx 1.6155\), \(S_{xy} \approx 2.8340\), \(S_{yy} \approx 5.0410\)입니다. 따라서 \(B = 2.8340/1.6155 \approx 1.7544\), \(A = \exp(2.2483 - 1.7544 \cdot 0.9575) \approx 1.7655\)가 됩니다. 상관계수는 \(r \approx 0.9933\)으로 매우 강한 적합도를 보입니다. 최종 모델은 \(y \approx 1.7655 \cdot x^{1.7544}\)입니다.

자주 묻는 질문

왜 모든 값이 양수여야 하나요? 이 방법은 \(\ln(x)\)와 \(\ln(y)\)를 사용하는데, 0이나 음수의 로그는 정의되지 않습니다. 그래서 0 이하의 점은 계산에 쓸 수 없습니다.

상관계수 r은 어떻게 해석하나요? \(|r|\)이 0.7보다 크면 강한 상관관계, 0.4~0.7이면 중간 정도, 0.2~0.4이면 약한 상관관계, 0.2 미만이면 사실상 상관관계가 없다고 봅니다.

자연로그를 쓰든 상용로그(밑이 10)를 쓰든 차이가 있나요? 없습니다. 지수 \(B\)와 상관계수 \(r\)은 어느 쪽을 쓰더라도 동일합니다. 이 계산기는 자연로그를 사용하고 \(\exp()\)로 \(A\)를 일관되게 계산하므로 표준 참고 자료와 결과가 일치합니다.

최종 업데이트: