이 계산기의 기능
이 도구는 각 행에 빈도(가중치) f가 부여된 관측 데이터 표에 \(y = A + B\cdot\ln(x)\) 형태의 로그 회귀 곡선을 적합합니다. 빈도 가중을 이용하면 그룹화되었거나 반복되는 데이터를 간결하게 입력할 수 있습니다. 동일한 (x, y) 쌍을 여러 번 나열하는 대신, 한 번만 적고 그 개수를 f로 표시하면 됩니다. 이 방법은 순수한 통계 계산이므로 어디서나 동일하게 작동하며, 별도의 단위나 특정 국가의 규정이 적용되지 않습니다.
사용 방법
한 줄에 관측 그룹 하나씩 x y f 형식으로 입력하세요. 빈도 열은 선택 사항이며, 생략하면 각 행이 한 번씩 계산됩니다(\(f = 1\)). 자연로그 \(\ln(x)\)를 취하기 때문에 모든 x 값은 0보다 커야 합니다. 직선을 결정할 수 있도록 서로 다른 x 값을 가진 행을 최소 두 개 이상 입력하세요. 표시 정밀도(기본값 유효숫자 10자리)는 자유롭게 선택할 수 있는데, 이는 화면에 보이는 숫자의 반올림만 바꿀 뿐 실제 계산에는 전혀 영향을 주지 않습니다.
공식 설명
그룹을 \(i = 1..m\)이라 하고 \(n = \sum f_i\)라 합시다. 가중 평균은 $$\text{meanLnX} = \frac{\sum f_i\cdot\ln x_i}{n}, \qquad \text{meanY} = \frac{\sum f_i\cdot y_i}{n}$$로 정의됩니다. 가중 제곱합은 $$S_{xx} = \sum f_i(\ln x_i)^2 - n\cdot\text{meanLnX}^2,$$ $$S_{yy} = \sum f_i y_i^2 - n\cdot\text{meanY}^2,$$ $$S_{xy} = \sum f_i\cdot\ln x_i\cdot y_i - n\cdot\text{meanLnX}\cdot\text{meanY}$$가 됩니다. 이로부터 $$B = \frac{S_{xy}}{S_{xx}}, \qquad A = \text{meanY} - B\cdot\text{meanLnX}, \qquad r = \frac{S_{xy}}{\sqrt{S_{xx}}\cdot\sqrt{S_{yy}}}$$를 구합니다.
계산 예시
모든 \(f = 1\)인 다섯 개의 행 — (1,2), (2,3), (3,3), (4,4), (5,4) — 을 사용하면 $$\text{meanLnX} = 0.9574984, \quad \text{meanY} = 3.2,$$ $$S_{xx} = 1.6154888, \quad S_{yy} = 2.8, \quad S_{xy} = 2.0382328$$이 됩니다. 따라서 $$B = 1.2616933, \quad A = 1.9919295, \quad r = 0.9583567$$입니다. 적합된 곡선은 \(y = 1.9919 + 1.2617\cdot\ln(x)\)이며 강한 상관관계를 보입니다.
자주 묻는 질문
빈도 열은 어떤 역할을 하나요? 각 행에 가중치를 부여합니다. \(f = 5\)인 행은 동일한 관측값 다섯 개로 취급되므로, \(f = 1\)인 행보다 적합에 다섯 배 더 큰 영향을 미칩니다.
r 값은 어떻게 해석하나요? \(|r|\)이 0.7을 넘으면 강한 상관, 0.4–0.7은 중간 정도, 0.2–0.4는 약한 상관, 0.2 미만이면 사실상 상관관계가 없다고 봅니다.
"회귀를 적합할 수 없습니다"라고 표시되는 이유는? 적합을 위해서는 서로 다른 x 값이 최소 두 개 있어야 하며(그렇지 않으면 \(S_{xx} = 0\)), 총 빈도가 양수여야 합니다. 또한 \(\ln(x)\)가 정의되도록 모든 x 값은 0보다 커야 합니다.