์ฌ๋ถ์์๋?
์ฌ๋ถ์์๋ ์ ๋ ฌ๋ ๋ฐ์ดํฐ๋ฅผ ๋ค ๋ฑ๋ถ์ผ๋ก ๋๋๋ ๊ธฐ์ค๊ฐ์ ๋๋ค. ์ 1์ฌ๋ถ์์(Q1)๋ 25๋ฒ์งธ ๋ฐฑ๋ถ์์๋ก, ์ ์ฒด ๊ฐ์ 25%๊ฐ ์ด๋ณด๋ค ์์ต๋๋ค. ์ 2์ฌ๋ถ์์(Q2)๋ ์ค์๊ฐ์ด๋ฉฐ 50๋ฒ์งธ ๋ฐฑ๋ถ์์์ ํด๋นํฉ๋๋ค. ์ 3์ฌ๋ถ์์(Q3)๋ 75๋ฒ์งธ ๋ฐฑ๋ถ์์์ ๋๋ค. ์ด ์ธ ๊ฐ์ ํจ๊ป ๋ณด๋ฉด ๋ฐ์ดํฐ๊ฐ ์ฃผ๋ก ์ด๋์ ๋ชจ์ฌ ์๊ณ ์ผ๋ง๋ ๋๊ฒ ํผ์ ธ ์๋์ง ํ๋์ ํ์ ํ ์ ์์ต๋๋ค.
๊ณ์ฐ๊ธฐ ์ฌ์ฉ๋ฒ
์ ๋ ฅ๋์ ์ซ์๋ฅผ ์ผํ๋ ๊ณต๋ฐฑ์ผ๋ก ๊ตฌ๋ถํด ์ ๋ ฅํ ๋ค ์คํํ์ธ์(์: 3, 7, 8, 5, 12). ๊ณ์ฐ๊ธฐ๊ฐ ๊ฐ์ ์๋์ผ๋ก ์ ๋ ฌํ๋ฏ๋ก ์ ๋ ฅ ์์๋ ์๊ด์์ต๋๋ค. ๊ฒฐ๊ณผ๋ก Q1, Q2, Q3์ ์ฌ๋ถ์์ ๋ฒ์(\(IQR = Q_3 - Q_1\))๋ ๋ฌผ๋ก , ์ฐธ๊ณ ์ฉ์ผ๋ก ์ต์๊ฐ, ์ต๋๊ฐ, ๋ฐ์ดํฐ ๊ฐ์๊น์ง ํจ๊ป ๋ณด์ฌ์ค๋๋ค.
๊ณ์ฐ ๊ณต์ ํ์ด
์ด ๊ณ์ฐ๊ธฐ๋ ์ ํ ๋ณด๊ฐ๋ฒ(๋ง์ ํต๊ณ ํจํค์ง์์ ์ฌ์ฉํ๋ ๋ฐฉ์)์ ์ ์ฉํฉ๋๋ค. ๋ฐฑ๋ถ์์ \(p\)์ ๋ํด, 0๋ถํฐ ์์ํ๋ ์ธ๋ฑ์ค๋ก ์ ๋ ฌํ ๋ชฉ๋ก์์ ์์ ์์น \(r = \tfrac{p}{100}(n-1)\)์ ๊ตฌํฉ๋๋ค. ์ฌ๊ธฐ์ \(n\)์ ๋ฐ์ดํฐ ๊ฐ์์ ๋๋ค.
$$Q_p = x_{\lfloor r \rfloor} + (r - \lfloor r \rfloor)\,(x_{\lceil r \rceil} - x_{\lfloor r \rfloor}),\quad r = \tfrac{p}{100}(n-1)$$
\(r\)์ด ์ ์์ด๋ฉด ํด๋น ์์น์ ๊ฐ์ด ๊ณง ์ฌ๋ถ์์๊ฐ ๋๊ณ , ๊ทธ๋ ์ง ์์ผ๋ฉด ์์ ๋ถ๋ถ์ ๋น์จ์ ๋ง์ถฐ ์ด์ํ ๋ ๊ฐ ์ฌ์ด๋ฅผ ๋ณด๊ฐํฉ๋๋ค.
์์ ๋ก ์ดํด๋ณด๊ธฐ
๋ฐ์ดํฐ 3, 7, 8, 5, 12, 14, 21, 13, 18์ ์๋ก ๋ค์ด ๋ณด๊ฒ ์ต๋๋ค. ์ ๋ ฌํ๋ฉด 3, 5, 7, 8, 12, 13, 14, 18, 21์ด ๋๊ณ \(n = 9\)์ ๋๋ค. Q1์ \(r = 0.25 \times 8 = 2\)์ด๋ฏ๋ก ์ธ๋ฑ์ค 2์ ๊ฐ์ธ 7์ ๋๋ค. Q2๋ \(r = 0.5 \times 8 = 4\)์ด๋ฏ๋ก ์ธ๋ฑ์ค 4์ ๊ฐ์ธ 12์ ๋๋ค. Q3๋ \(r = 0.75 \times 8 = 6\)์ด๋ฏ๋ก ์ธ๋ฑ์ค 6์ ๊ฐ์ธ 14์ ๋๋ค. ๋ฐ๋ผ์ \(Q_1 = 7\), \(Q_2 = 12\), \(Q_3 = 14\)์ด๊ณ \(IQR = 14 - 7 = 7\)์ด ๋ฉ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
๋ค๋ฅธ ๊ณ์ฐ๊ธฐ์ ๊ฒฐ๊ณผ๊ฐ ๋ค๋ฅธ ์ด์ ๋? ์ฌ๋ถ์์๋ฅผ ๊ตฌํ๋ ๋ฐฉ๋ฒ์ ์ฌ๋ฌ ๊ฐ์ง์ ๋๋ค(์: ์ค์๊ฐ์ ํฌํจํ๋ ๋ฐฉ์๊ณผ ์ ์ธํ๋ ๋ฐฉ์). ์ด ๊ณ์ฐ๊ธฐ๋ \((n - 1)\) ๊ธฐ์ค์ ์ ํ ๋ณด๊ฐ๋ฒ์ ์ฌ์ฉํ๋ฉฐ, ์ด๋ ๋๋ฆฌ ์ฐ์ด๋ ๋ฐฉ์์ผ๋ก NumPy์ ๊ธฐ๋ณธ๊ฐ์ด๋ ์ฌ๋ฌ ์คํ๋ ๋์ํธ์ PERCENTILE ํจ์์ ๊ฒฐ๊ณผ๊ฐ ์ผ์นํฉ๋๋ค.
IQR์ ์ด๋์ ์ฐ๋์? ์ฌ๋ถ์์ ๋ฒ์(IQR)๋ ๊ฐ์ด๋ฐ 50% ๊ฐ์ด ์ผ๋ง๋ ํผ์ ธ ์๋์ง๋ฅผ ๋ํ๋ด๋ฉฐ, ์ด์์น๋ฅผ ์ฐพ๋ ๊ธฐ์ค์ด ๋ฉ๋๋ค(\(Q_1 - 1.5\cdot IQR\)๋ณด๋ค ์๊ฑฐ๋ \(Q_3 + 1.5\cdot IQR\)๋ณด๋ค ํฐ ๊ฐ).
์์๋ ์์๋ ์ ๋ ฅํ ์ ์๋์? ๋ค, ์ผํ๋ ๊ณต๋ฐฑ์ผ๋ก ๊ตฌ๋ถํ๊ธฐ๋ง ํ๋ฉด ์ด๋ค ์ค์๋ ์ ๋ ฅํ ์ ์์ต๋๋ค.