ํด๋ฐ ๊ฑฐ๋ฆฌ๋?
ํด๋ฐ ๊ฑฐ๋ฆฌ(Hamming distance)๋ ๊ธธ์ด๊ฐ ๊ฐ์ ๋ ๋ฌธ์์ด์์ ๊ฐ์ ์์น์ ์๋ ๊ธฐํธ๊ฐ ์๋ก ๋ค๋ฅธ ์์น์ ๊ฐ์๋ฅผ ๋งํฉ๋๋ค. ๋ฏธ๊ตญ์ ์ํ์ ๋ฆฌ์ฒ๋ ํด๋ฐ(Richard Hamming)์ ์ด๋ฆ์์ ๋ฐ์จ ์ด ๊ฐ๋ ์ ์ ๋ณด ์ด๋ก , ๋ถํธํ ์ด๋ก , ์ปดํจํฐ ๊ณผํ์ ๊ธฐ์ด๊ฐ ๋๋ ํต์ฌ ๊ฐ๋ ์ ๋๋ค. ํ ๋ฌธ์์ด์ ๋ค๋ฅธ ๋ฌธ์์ด๋ก ๋ฐ๊พธ๋ ๋ฐ ํ์ํ ์ต์ ์นํ ํ์๋ฅผ ๋ํ๋ด๋ฉฐ, ์ค๋ฅ ๊ฒ์ถ ๋ฐ ์ค๋ฅ ์ ์ ์ฝ๋์์ ํญ๋๊ฒ ํ์ฉ๋ฉ๋๋ค.
๊ณ์ฐ๊ธฐ ์ฌ์ฉ ๋ฐฉ๋ฒ
๋น๊ตํ ๋ ๋ฌธ์์ด์ ์
๋ ฅํ์ธ์. 1011101 ๊ฐ์ ์ด์ง์ ๋นํธ์ด, DNA ์ผ๊ธฐ ์์ด, ๋๋ ์ผ๋ฐ ํ
์คํธ ๋ฑ ๋ฌด์์ด๋ ๊ฐ๋ฅํฉ๋๋ค. ๊ณ์ฐ๊ธฐ๋ ๋ ๋ฌธ์์ด์ ํ ๊ธ์์ฉ ๋น๊ตํ์ฌ ์๋ก ๋ค๋ฅธ ์์น๊ฐ ๋ช ๊ฐ์ธ์ง ์ธ์ด ์ค๋๋ค. ๋ ๋ฌธ์์ด์ ๊ธธ์ด๊ฐ ๋ค๋ฅผ ๊ฒฝ์ฐ, ๋ ๊ธด ์ชฝ์ ๋จ๋ ๊ธ์๋ ๋ชจ๋ ์ฐจ์ด๋ก ๊ณ์ฐ๋ฉ๋๋ค.
๊ณต์ ์์ธํ ๋ณด๊ธฐ
๋ ๋ฌธ์์ด a์ b์ ๋ํด, ํด๋ฐ ๊ฑฐ๋ฆฌ๋ ๋ชจ๋ ์์น i์ ๋ํด \(a_i \neq b_i\)์ผ ๋ 1, ๊ฐ์ ๋ 0์ด ๋๋ ์ง์ ํจ์๋ฅผ ๋ชจ๋ ๋ํ ๊ฐ์ ๋๋ค.
$$d(a, b) = \sum_{i=1}^{\min(|a|,|b|)} \left[\, \text{A}_i \neq \text{B}_i \,\right] + \Big|\; |\text{A}| - |\text{B}| \;\Big|$$
๊ฒฐ๊ณผ๋ ํญ์ 0(์์ ํ ๋์ผ) ์ด์, ๋ฌธ์์ด ๊ธธ์ด(๋ชจ๋ ์์น๊ฐ ๋ค๋ฆ) ์ดํ์ธ ์์๊ฐ ์๋ ์ ์์ ๋๋ค.
์์ ๋ก ํ์ด ๋ณด๊ธฐ
1011101๊ณผ 1001001์ ๋น๊ตํด ๋ด
์๋ค. ๋ ๋ฌธ์์ด์ ๋๋ํ ๋ง์ถฐ ๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
10111011001001
3๋ฒ์งธ ์์น(1 vs 0)์ 5๋ฒ์งธ ์์น(1 vs 0)์์ ๊ฐ์ด ๋ค๋ฆ ๋๋ค. ๋ฐ๋ผ์ ํด๋ฐ ๊ฑฐ๋ฆฌ๋ 2์ ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
๋ ๋ฌธ์์ด์ ๊ธธ์ด๊ฐ ๋ฐ๋์ ๊ฐ์์ผ ํ๋์? ๋ณธ๋ ํด๋ฐ ๊ฑฐ๋ฆฌ๋ ๊ธธ์ด๊ฐ ๊ฐ์ ๋ฌธ์์ด์์๋ง ์ ์๋ฉ๋๋ค. ๋ค๋ง ์ด ๋๊ตฌ๋ ๊ธธ์ด๊ฐ ๋ค๋ฅธ ๊ฒฝ์ฐ์๋ ๋จ๋ ๊ธ์๋ฅผ ๊ฐ๊ฐ ๋ถ์ผ์น๋ก ๊ณ์ฐํ์ฌ ์ ์ฉํ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํฉ๋๋ค.
์ด์ง์๊ฐ ์๋ ์ผ๋ฐ ํ ์คํธ์๋ ์ฌ์ฉํ ์ ์๋์? ๋ค. ๋ฌธ์, ์ซ์, ๊ธฐํธ ๋ฑ ์ด๋ค ๊ธ์๋ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ ๋ฒค์ํ์ธ ๊ฑฐ๋ฆฌ์๋ ๋ฌด์์ด ๋ค๋ฅธ๊ฐ์? ํด๋ฐ ๊ฑฐ๋ฆฌ๋ ๊ณ ์ ๋ ์์น์์์ ์นํ๋ง ๊ณ์ฐํ์ง๋ง, ๋ ๋ฒค์ํ์ธ ๊ฑฐ๋ฆฌ๋ ์ฝ์ ๊ณผ ์ญ์ ๊น์ง ํ์ฉํ๋ค๋ ์ ์ด ๋ค๋ฆ ๋๋ค.