F1 ์ ์๋?
F1 ์ ์๋ ์ ๋ฐ๋(precision)์ ์ฌํ์จ(recall)์ ํ๋์ ๊ฐ์ผ๋ก ๊ฒฐํฉํ ์งํ๋ก, ๋จธ์ ๋ฌ๋๊ณผ ์ ๋ณด ๊ฒ์, ํต๊ณ ๋ถ์ผ์์ ๋ถ๋ฅ ๋ชจ๋ธ์ ํ๊ฐํ ๋ ๋๋ฆฌ ์ฐ์ ๋๋ค. ์ ๋ฐ๋์ ์ฌํ์จ์ ์กฐํํ๊ท (harmonic mean)์ด๊ธฐ ๋๋ฌธ์, ์ด๋ ํ์ชฝ๋ง ๋ฐ์ด๋ ๋ชจ๋ธ๋ณด๋ค ๋ ์งํ์ ๊ท ํ์ด ์ ์กํ ๋ชจ๋ธ์ ๋์ ์ ์๋ฅผ ์ค๋๋ค.
๊ณ์ฐ๊ธฐ ์ฌ์ฉ๋ฒ
ํผ๋ ํ๋ ฌ(confusion matrix)์์ ์ธ ๊ฐ์ง ๊ฐ์ ์ ๋ ฅํ์ธ์. True Positive(TP, ์์ฑ์ ์์ฑ์ผ๋ก ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ ์), False Positive(FP, ์์ฑ์ธ๋ฐ ์์ฑ์ผ๋ก ์๋ชป ์์ธกํ ์), False Negative(FN, ์์ฑ์ธ๋ฐ ๋์น ์)์ ๋๋ค. ๊ฐ์ ์ ๋ ฅํ๋ฉด ์ ๋ฐ๋, ์ฌํ์จ, ๊ทธ๋ฆฌ๊ณ ๊ทธ์ ๋ฐ๋ฅธ F1 ์ ์๊ฐ ์ฆ์ ๊ณ์ฐ๋ฉ๋๋ค.
๊ณต์ ํ์ด
์ ๋ฐ๋ = \( \dfrac{\text{TP}}{\text{TP} + \text{FP}} \) ๋ ๋ชจ๋ธ์ด ์์ฑ์ด๋ผ๊ณ ์์ธกํ ๊ฒ ์ค ์ค์ ๋ก ๋ง์ ๋น์จ์ ๋ํ๋ ๋๋ค. ์ฌํ์จ = \( \dfrac{\text{TP}}{\text{TP} + \text{FN}} \) ์ ์ค์ ์์ฑ ์ค์์ ๋ชจ๋ธ์ด ์ฐพ์๋ธ ๋น์จ์ ์๋ฏธํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ F1 ์ ์๋ ๋ค์๊ณผ ๊ฐ์ด ๊ตฌํฉ๋๋ค.
$$ F_1 = 2 \cdot \frac{\text{์ ๋ฐ๋} \cdot \text{์ฌํ์จ}}{\text{์ ๋ฐ๋} + \text{์ฌํ์จ}} $$์กฐํํ๊ท ์ด๊ธฐ ๋๋ฌธ์ ์ ๋ฐ๋๋ ์ฌํ์จ ์ค ์ด๋ ํ๋๋ผ๋ ๋ฎ์ผ๋ฉด F1 ์ ์๊ฐ ํฐ ํญ์ผ๋ก ๋จ์ด์ง๋๋ค.
์์ ๋ก ์ดํด๋ณด๊ธฐ
\( \text{TP} = 70 \), \( \text{FP} = 30 \), \( \text{FN} = 10 \) ์ด๋ผ๊ณ ๊ฐ์ ํด ๋ด ์๋ค. ์ ๋ฐ๋ = \( \dfrac{70}{100} = 0.70 \), ์ฌํ์จ = \( \dfrac{70}{80} = 0.875 \) ์ ๋๋ค. ๋ฐ๋ผ์
$$ F_1 = 2 \cdot \frac{0.70 \cdot 0.875}{0.70 + 0.875} = 2 \cdot \frac{0.6125}{1.575} \approx 0.7778 $$์ฆ ์ฝ 77.78%๊ฐ ๋ฉ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
์ ํ๋(accuracy) ๋์ F1 ์ ์๋ฅผ ์จ์ผ ํ ๋๋ ์ธ์ ์ธ๊ฐ์? ํด๋์ค๊ฐ ๋ถ๊ท ํํ ๋๋ F1 ์ ์๊ฐ ๋ ์ ํฉํฉ๋๋ค. ํ ํด๋์ค๊ฐ ๋ฐ์ดํฐ์ ๋๋ถ๋ถ์ ์ฐจ์งํ๋ฉด ์ ํ๋๊ฐ ์ค์ ๋ณด๋ค ๋๊ฒ ๋์ ์คํด๋ฅผ ๋ถ๋ฅผ ์ ์๊ธฐ ๋๋ฌธ์ ๋๋ค.
F1 ์ ์๋ ์ด๋ ์ ๋๋ฉด ์ข์ ๊ฑด๊ฐ์? F1 ์ ์๋ 0์์ 1 ์ฌ์ด์ ๊ฐ์ ๊ฐ์ง๋ฉฐ 1์ ๊ฐ๊น์ธ์๋ก ์ข์ต๋๋ค. '์ข๋ค'์ ๊ธฐ์ค์ ๊ณผ์ ๋ง๋ค ๋ค๋ฅด์ง๋ง, ๋ณดํต 0.8 ์ด์์ด๋ฉด ์ฐ์ํ ํธ์ผ๋ก ๋ด ๋๋ค.
์ ์กฐํํ๊ท ์ ์ฌ์ฉํ๋์? ์กฐํํ๊ท ์ ๋จ์ ์ฐ์ ํ๊ท ๋ณด๋ค ์ ๋ฐ๋์ ์ฌํ์จ ์ฌ์ด์ ๊ทน๋จ์ ์ธ ๋ถ๊ท ํ์ ๋ ๊ฐํ๊ฒ ํจ๋ํฐ๋ฅผ ์ค๋๋ค. ๋๋ถ์ ๋ ์งํ๊ฐ ๋ชจ๋ ์ ์ ํ ๋์์ผ๋ง ์ข์ F1 ์ ์๋ฅผ ์ป์ ์ ์์ต๋๋ค.