MCP로 연결 →

계산 입력

각 줄: x 값, y 값, 도수 f. f를 생략하면 기본값 1로 처리됩니다(비가중).

공식

Show calculation steps (1)
  1. Correlation Coefficient

    Correlation Coefficient: 도수가중 선형회귀 계산기

    Frequency-weighted Pearson r using sums over the data rows.

광고

결과

@
회귀 직선
y = 1.150943396226415 + 0.9182389937106918 x
r = 0.927026 (strong correlation)
절편 A 1.1509433962
기울기 B 0.9182389937
상관계수 r 0.9270261699
전체 도수 n 8
x의 평균 3.375
y의 평균 4.25
Sxx 19.875
Syy 19.5
Sxy 18.25

이 계산기의 기능

이 도구는 최소제곱법을 사용해 데이터 점들에 직선 \(y = A + Bx\)를 적합합니다. 이때 각 점은 도수(빈도) 또는 가중치 \(f\)를 가질 수 있습니다. 도수 가중을 활용하면 반복되는 관측값을 간결하게 요약할 수 있습니다. 같은 (x, y) 쌍을 여러 번 나열하는 대신, 한 번만 입력하고 그 횟수를 함께 적어 주면 됩니다. 특정 국가에 한정되지 않은 순수 수학·통계 도구이므로 어디서나 동일하게 작동합니다.

사용 방법

한 줄에 한 행씩 x, y, f 형식으로 입력하세요. 도수 열은 선택 사항입니다. 생략하면 모든 점에 동일한 가중치가 적용됩니다(일반적인 비가중 회귀). 결과에 표시할 유효숫자 자릿수를 선택한 뒤 실행하세요. 계산기는 회귀 직선, 기울기 B와 절편 A, 피어슨 상관계수 \(r\), 전체 도수 \(n\), x와 y의 평균, 그리고 보조 제곱합 \(S_{xx}\), \(S_{yy}\), \(S_{xy}\)를 함께 돌려줍니다.

공식 설명

각 행을 \(i = 1..N\)으로 두고 값 \(x_i\), \(y_i\), 도수 \(f_i\)를 가진다고 합시다. 전체 도수는 \(n = \sum f_i\)입니다. 가중 평균은 \(\bar{x} = \sum x_i f_i / n\), \(\bar{y} = \sum y_i f_i / n\) 입니다. 제곱합은 다음과 같이 구합니다.

$$S_{xx} = \sum x_i^2 f_i - n\cdot\bar{x}^2, \quad S_{yy} = \sum y_i^2 f_i - n\cdot\bar{y}^2, \quad S_{xy} = \sum x_i y_i f_i - n\cdot\bar{x}\cdot\bar{y}$$

기울기는 \(B = S_{xy}/S_{xx}\), 절편은 \(A = \bar{y} - B\cdot\bar{x}\), 상관계수는 다음과 같습니다.

$$r = \frac{S_{xy}}{\sqrt{S_{xx}}\cdot\sqrt{S_{yy}}}$$
광고
기울기 B를 수직÷수평으로, 절편 A를 직선 위에 표시한 다이어그램
기울기 B는 직선의 수직 변화량을 수평 변화량으로 나눈 값이고, 절편 A는 x = 0일 때의 값입니다.
크기가 다른 가중 점들과 최적 회귀 직선을 보여주는 산점도
마커 크기가 빈도 가중치를 나타내는 점들에 맞춘 빈도 가중 최소제곱 직선 y = A + Bx.

계산 예시

행 (1,2,1), (2,3,2), (3,5,1), (4,4,2), (5,6,1), (6,7,1)에 대해 계산해 보면 \(n = 8\), \(\bar{x} = 3.375\), \(\bar{y} = 4.25\) 입니다. 이어서 \(S_{xx} = 19.875\), \(S_{yy} = 19.5\), \(S_{xy} = 18.25\) 이므로

$$B = \frac{18.25}{19.875} \approx 0.9182, \quad A = 4.25 - 0.9182\cdot 3.375 \approx 1.1509, \quad r \approx 0.9271$$

로 강한 양의 상관관계를 보입니다. 적합된 직선은 다음과 같습니다.

$$y = 1.1509 + 0.9182\cdot x$$

자주 묻는 질문

도수 열은 어떤 역할을 하나요? 각 점에 가중치를 부여합니다. \(f = 3\)인 점은 같은 관측을 세 번 한 것과 동일하게 취급됩니다. 소수 형태의 가중치도 사용할 수 있습니다.

r을 계산할 수 없는 경우는? 모든 x 값이 같으면(\(S_{xx} = 0\)) 기울기를 정의할 수 없고, \(S_{xx}\)나 \(S_{yy}\) 중 하나라도 0이면 변동성이 없으므로 상관계수를 정의할 수 없습니다.

상관관계의 강도는 어떻게 판단하나요? \(|r|\) 값을 기준으로 합니다. 0.7 초과는 강함, 0.4~0.7은 보통, 0.2~0.4는 약함, 0.2 미만은 사실상 상관관계가 없는 것으로 봅니다.

최종 업데이트: