์๋ ์ํธ๋กํผ๋?
์๋ ์ํธ๋กํผ๋ ์ด๋ค ํ๋ฅ ๋ณ์๊ฐ ๋ด๊ณ ์๋ ํ๊ท ์ ์ธ ๋ถํ์ค์ฑ, ์ฆ '๋๋ผ์'์ด๋ ์ ๋ณด์ ์์ ์์น๋ก ๋ํ๋ธ ๊ฐ์ ๋๋ค. 1948๋ ํด๋ก๋ ์๋(Claude Shannon)์ด ์ฒ์ ์ ์ํ์ผ๋ฉฐ, ์ ๋ณด ์ด๋ก (information theory)์ ์ถ๋ฐ์ ์ด ๋ ๊ฐ๋ ์ ๋๋ค. ๋ฐ์ด 2์ธ ๋ก๊ทธ๋ฅผ ์ฌ์ฉํ๋ฉด ๋จ์๋ ๋นํธ(bit)๊ฐ ๋๋ฉฐ, ์ํธ๋กํผ 1๋นํธ๋ ๊ณต์ ํ ๋์ ํ ๋ฒ์ ๋์ง ๋์ ๋ถํ์ค์ฑ๊ณผ ๊ฐ์ต๋๋ค.
๊ณ์ฐ๊ธฐ ์ฌ์ฉ ๋ฐฉ๋ฒ
๊ฐ๋ฅํ ๊ฒฐ๊ณผ(์ฌ๊ฑด)๋ณ ํ๋ฅ ์ ์ผํ๋ ๊ณต๋ฐฑ์ผ๋ก ๊ตฌ๋ถํด ์
๋ ฅํ์ธ์(์: 0.5, 0.25, 0.25). ํ๋ฅ ๋์ ๋น๋์๋ ๊ฐ์(์: 10, 5, 5)๋ฅผ ๊ทธ๋๋ก ๋ฃ์ด๋ ๋ฉ๋๋ค. ์ด ๊ฒฝ์ฐ ๊ฐ ๊ฐ์ ์ ์ฒด ํฉ์ผ๋ก ๋๋์ด ์๋์ผ๋ก ํ๋ฅ ๋ก ํ์ฐํฉ๋๋ค. 0์ด๋ ์์ ๊ฐ์ ๋ฌด์๋ฉ๋๋ค. ๊ณ์ฐ๊ธฐ๋ ์ํธ๋กํผ(๋นํธ), ๊ฐ๋ฅํ ์ต๋ ์ํธ๋กํผ, ๊ทธ๋ฆฌ๊ณ ๋ถํฌ์ ํจ์จ์ ํจ๊ป ๋ณด์ฌ์ค๋๋ค.
๊ณต์ ํ์ด
์ํธ๋กํผ๋ ๋ชจ๋ ๊ฒฐ๊ณผ i์ ๋ํด ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐํฉ๋๋ค:
$$H = -\sum_{i=1}^{n} p_i \log_2 p_i \qquad p_i = \frac{x_i}{\sum_{j=1}^{n} x_j}$$๊ฐ ํญ์ ํด๋น ๊ฒฐ๊ณผ์ ์ ๋ณด๋ \(-\log_2 p_i\)์ ๋ฐ์ ํ๋ฅ \(p_i\)๋ฅผ ๊ฐ์ค์น๋ก ๊ณฑํ ๊ฒ์ ๋๋ค. ๋๋ฌผ๊ฒ ์ผ์ด๋๋ ์ฌ๊ฑด์ผ์๋ก ๋ ๋ง์ ์ ๋ณด๋ฅผ ๋ด๊ณ , ๋ฐ๋์ ์ผ์ด๋๋ ์ฌ๊ฑด(\(p_i = 1\))์ ์ ๋ณด๋์ด 0์ ๋๋ค. ๊ฒฐ๊ณผ๊ฐ \(n\)๊ฐ์ผ ๋ ์ต๋ ์ํธ๋กํผ๋ \(\log_2(n)\)์ด๋ฉฐ, ๋ชจ๋ ๊ฒฐ๊ณผ์ ๋ฐ์ ํ๋ฅ ์ด ๋๊ฐ์ ๋ ๋ฌ์ฑ๋ฉ๋๋ค. ํจ์จ์ \(H\)๊ฐ ์ด ์ต๋๊ฐ์ ๋ช ํผ์ผํธ์ธ์ง๋ฅผ ๋ํ๋ ๋๋ค.
์์ ๋ก ๋ฐ๋ผํ๊ธฐ
๋ถํฌ {0.5, 0.25, 0.25}๋ฅผ ์๊ฐํด ๋ด ์๋ค. ์ํธ๋กํผ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
$$-[0.5\cdot\log_2(0.5) + 0.25\cdot\log_2(0.25) + 0.25\cdot\log_2(0.25)] = -[0.5\cdot(-1) + 0.25\cdot(-2) + 0.25\cdot(-2)] = 0.5 + 0.5 + 0.5 = 1.5\,\text{๋นํธ}$$๊ฒฐ๊ณผ๊ฐ 3๊ฐ์ผ ๋ ์ต๋ ์ํธ๋กํผ๋ \(\log_2(3) \approx 1.585\) ๋นํธ์ด๋ฏ๋ก, ํจ์จ์ ์ฝ 94.64%๊ฐ ๋ฉ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ(FAQ)
์ ๋นํธ ๋จ์์ธ๊ฐ์? ๋ฐ์ด 2์ธ ๋ก๊ทธ๋ฅผ ์ฐ๋ฉด ์ํธ๋กํผ๊ฐ ๋นํธ๋ก ํํ๋๋๋ฐ, ์ด๋ ๋์งํธ ์ ๋ณด์ ๊ฐ์ฅ ์์ฐ์ค๋ฌ์ด ๋จ์์ ๋๋ค. ๋ฐ์ด e์ด๋ฉด '๋ดํธ(nat)', ๋ฐ์ด 10์ด๋ฉด 'ํํ๋ฆฌ(hartley)'๊ฐ ๋ฉ๋๋ค.
ํ๋ฅ ์ ํฉ์ด ๊ผญ 1์ด์ด์ผ ํ๋์? ์๋๋๋ค. ๊ณ์ฐ๊ธฐ๊ฐ ๋ชจ๋ ์์ ๊ฐ์ ์๋์ผ๋ก ์ ๊ทํํ๋ฏ๋ก, ๊ฐ๊ณตํ์ง ์์ ๋น๋์๋ฅผ ๊ทธ๋๋ก ๋ถ์ฌ๋ฃ์ด๋ ๋ฉ๋๋ค.
์ต๋ ์ํธ๋กํผ๋ ์ผ๋ง์ธ๊ฐ์? ๋ฐ์ ํ๋ฅ ์ด ๋๊ฐ์ ๊ฒฐ๊ณผ \(n\)๊ฐ์ ๊ฒฝ์ฐ \(\log_2(n)\)์ ๋๋ค. ๊ณต์ ํ ๋์ (\(n=2\))์ ์ต๋ ์ํธ๋กํผ๋ 1๋นํธ, ๊ณต์ ํ ์ฃผ์ฌ์(\(n=6\))๋ ์ฝ 2.585๋นํธ์ ๋๋ค.