이 계산기의 기능
이 도구는 로그정규분포의 백분위수(분위수)를 계산합니다. 누적확률과 분포의 모수를 입력하면, 로그정규분포의 누적분포함수(CDF)가 해당 확률에 도달하는 값 x를 돌려줍니다. 이를 역CDF, 또는 분위수 함수(quantile function)라고 부릅니다. 로그정규분포는 값이 항상 양수이고 오른쪽으로 긴 꼬리를 갖는(우편향) 데이터에 널리 쓰입니다. 소득 분포, 입자 크기, 주가, 신뢰성 수명, 생물학적 농도 등이 대표적인 예입니다. 이는 전 세계 어디서나 동일하게 적용되는 보편적인 수학 도구입니다.
사용 방법
먼저 입력하려는 확률이 하측 누적확률 \(\text{P}(X \le x)\)인지, 상측 누적확률 \(\text{P}(X > x)\)인지 선택하세요. 그다음 확률값(반드시 0과 1 사이, 양 끝값 제외)을 입력합니다. 이어서 \(\ln(X)\)가 따르는 정규분포의 두 모수를 입력합니다. 즉 위치 모수 \(\mu\)(\(\ln X\)의 평균)와 척도 모수 \(\sigma\)(\(\ln X\)의 표준편차, 반드시 양수)를 입력하세요. 계산 버튼을 누르면 백분위수 \(x\)를 얻을 수 있습니다.
공식 설명
확률변수 \(X\)가 로그정규분포를 따른다는 것은, \(\ln(X)\)가 평균 \(\mu\), 표준편차 \(\sigma\)인 정규분포를 따른다는 뜻입니다. 하측 CDF는 $$P(x) = \Phi\!\left( \frac{\ln x - \mu}{\sigma} \right)$$로 표현되며, 여기서 \(\Phi\)는 표준정규분포의 CDF입니다. 이를 역으로 풀면 $$x = \exp\!\left( \mu + \sigma \cdot \Phi^{-1}(p) \right)$$가 됩니다. 상측 확률 \(Q\)를 입력한 경우에는 먼저 \(p = 1 - Q\)로 변환합니다. 표준정규 분위수 \(\Phi^{-1}\)은 Acklam의 유리 근사식으로 계산하며, 오차는 약 1e-9 수준입니다. 한 가지 유의할 점은, \(\mu\)와 \(\sigma\)는 \(X\) 자체가 아니라 \(\ln X\)를 설명하는 값이라는 것입니다. \(X\)의 평균은 \(\exp(\mu + \sigma^2/2)\)입니다.
계산 예시
하측 모드, 확률 = 0.975, \(\mu = 0\), \(\sigma = 1\)을 입력해 봅시다. 그러면 \(p = 0.975\)이고 \(\Phi^{-1}(0.975) = 1.959964\)(통계에서 익숙한 1.96 임계값)입니다. 따라서 $$x = \exp(0 + 1 \times 1.959964) = 7.0994$$가 됩니다. 즉 표준 로그정규분포의 97.5 백분위수는 약 7.099입니다.
자주 묻는 질문
상측 모드를 쓰면 어떻게 되나요? 상측 모드에서 \(Q = 0.025\)를 입력하면 \(p = 1 - 0.025 = 0.975\)가 되어, 위 예시와 동일하게 \(x \approx 7.099\)가 나옵니다.
중앙값은 얼마인가요? \(p = 0.5\)일 때 \(\Phi^{-1}(0.5) = 0\)이므로 \(x = \exp(\mu)\)입니다. 로그정규분포의 중앙값은 \(\sigma\) 값과 관계없이 항상 \(\exp(\mu)\)입니다.
왜 \(0 < p < 1\)이어야 하나요? \(p\)가 0에 가까워지면 백분위수는 0에 수렴하고, \(p\)가 1에 가까워지면 무한대로 발산하기 때문에 양 끝값은 허용되지 않습니다. 또한 지수함수이므로 결과는 언제나 양수입니다.