์ด ๊ณ์ฐ๊ธฐ์ ๊ธฐ๋ฅ
์ด ๋๊ตฌ๋ ์ด์ง ๋ถ๋ฅ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๊ธฐ ์ํด ์ธ ๊ฐ์ง ํต์ฌ ์งํ์ธ ์ ๋ฐ๋(precision), ์ฌํ์จ(recall), F1 ์ ์๋ฅผ ๊ณ์ฐํฉ๋๋ค. ํผ๋ ํ๋ ฌ(confusion matrix)์์ ๋์จ ์์ ๊ฐ์, ์ฆ ์ฐธ ์์ฑ(TP), ๊ฑฐ์ง ์์ฑ(FP), ๊ฑฐ์ง ์์ฑ(FN)์ ์ ๋ ฅํ๋ฉด ๊ฐ ์งํ๋ฅผ ๋ฐฑ๋ถ์จ๋ก ๋ณด์ฌ์ค๋๋ค. ์ด ์งํ๋ค์ ๋จธ์ ๋ฌ๋, ์ ๋ณด ๊ฒ์, ์๋ฃ ๊ฒ์ฌ ๋ฑ ํญ๋ชฉ์ ์์ฑ๊ณผ ์์ฑ์ผ๋ก ๋ถ๋ฅํ๋ ๋ชจ๋ ๋ถ์ผ์์ ๋๋ฃจ ์ฐ์ ๋๋ค.
์ฌ์ฉ ๋ฐฉ๋ฒ
์ฐธ ์์ฑ(TP, ์์ฑ์ ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ ๊ฒฝ์ฐ), ๊ฑฐ์ง ์์ฑ(FP, ์์ฑ์ ์์ฑ์ผ๋ก ์๋ชป ์์ธกํ ๊ฒฝ์ฐ), ๊ฑฐ์ง ์์ฑ(FN, ๋ชจ๋ธ์ด ๋์น ์์ฑ)์ ๊ฐ์๋ฅผ ์ ๋ ฅํ์ธ์. ๊ณ์ฐ ๋ฒํผ์ ๋๋ฅด๋ฉด ์ ๋ฐ๋, ์ฌํ์จ, F1 ์ ์๊ฐ ํ์๋ฉ๋๋ค. ์ด ์งํ๋ค์ ๊ตฌํ๋ ๋ฐ๋ ์ฐธ ์์ฑ(TN)์ด ํ์ํ์ง ์์ต๋๋ค.
๊ณต์ ์ค๋ช
$$\text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}}$$๋ "๋ด๊ฐ ์์ฑ์ด๋ผ๊ณ ํ๋จํ ๊ฒ ์ค์์ ์ค์ ๋ก ๋ง์ ๋น์จ์ ์ผ๋ง์ธ๊ฐ?"๋ผ๋ ์ง๋ฌธ์ ๋ตํฉ๋๋ค. ์ ๋ฐ๋๊ฐ ๋์์๋ก ์๋ชป๋ ๊ฒฝ๋ณด(์คํ)๊ฐ ์ ์ต๋๋ค.
$$\text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}}$$๋ "์ค์ ์์ฑ ๊ฐ์ด๋ฐ ๋ด๊ฐ ์ ๋๋ก ์ก์๋ธ ๋น์จ์ ์ผ๋ง์ธ๊ฐ?"๋ผ๋ ์ง๋ฌธ์ ๋ตํฉ๋๋ค. ์ฌํ์จ์ด ๋์์๋ก ๋์น๋ ๊ฒฝ์ฐ๊ฐ ์ ์ต๋๋ค.
F1 ์ ์๋ ๋ ์งํ์ ์กฐํ ํ๊ท ์ ๋๋ค. $$\text{F1} = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}}$$. ์ ๋ฐ๋์ ์ฌํ์จ์ ๊ท ํ์ ์ก์ ์ฃผ๋ฉฐ, ํด๋์ค๊ฐ ๋ถ๊ท ํํ ๋ ํนํ ์ ์ฉํฉ๋๋ค.
๊ณ์ฐ ์์
์คํธ ํํฐ๊ฐ ์ด๋ฉ์ผ 100ํต์ ์คํธ์ผ๋ก ๋ถ๋ฅํ๋ค๊ณ ๊ฐ์ ํด ๋ด ์๋ค. ์ด ์ค 80ํต์ ์ค์ ์คํธ(TP)์ด๊ณ 20ํต์ ์คํธ์ด ์๋๋๋ค(FP). ๋ํ ์ค์ ์คํธ 10ํต์ ๋์ณค์ต๋๋ค(FN). ์ ๋ฐ๋ $$= \frac{80}{80 + 20} = 0.80 = 80\%.$$ ์ฌํ์จ $$= \frac{80}{80 + 10} = 0.889 = 88.89\%.$$ F1 $$= 2 \cdot \frac{0.80 \cdot 0.889}{0.80 + 0.889} = 84.21\%.$$
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
์ ๋ฐ๋์ ์ฌํ์จ ์ค ๋ฌด์์ ์ฐ์ ํด์ผ ํ๋์? ๊ฑฐ์ง ์์ฑ์ ๋น์ฉ์ด ํฐ ๊ฒฝ์ฐ(์: ์ ์ ๋ฉ์ผ์ ์คํธ์ผ๋ก ์ฐจ๋จ)์๋ ์ ๋ฐ๋๋ฅผ ์ฐ์ ํ์ธ์. ์์ฑ์ ๋์น๋ ๋น์ฉ์ด ํฐ ๊ฒฝ์ฐ(์: ์ ๊ฒ์ง)์๋ ์ฌํ์จ์ ์ฐ์ ํ์ธ์.
F1 ์ ์๋ ์ ์ฐ๋์? ๋ฐ์ดํฐ๊ฐ ๋ถ๊ท ํํ๋ฉด ์ ํ๋(accuracy)๋ง์ผ๋ก๋ ์คํด๋ฅผ ๋ถ๋ฅผ ์ ์์ต๋๋ค. F1 ์ ์๋ ์ ๋ฐ๋์ ์ฌํ์จ์ ํ๋์ ๊ท ํ ์กํ ์์น๋ก ํฉ์ณ ์ค๋๋ค.
๋ถ๋ชจ๊ฐ 0์ด๋ฉด ์ด๋ป๊ฒ ๋๋์? TP+FP ๋๋ TP+FN์ด 0์ด๋ฉด ํด๋น ์งํ๋ ์ ์๋์ง ์์ต๋๋ค. ์ด ๊ณ์ฐ๊ธฐ๋ ๊ทธ ๊ฒฝ์ฐ 0%๋ก ํ์ํฉ๋๋ค.