Leaky ReLU ํ์ฑํ ํจ์๋?
Leaky ReLU(Leaky Rectified Linear Unit)๋ ์ฌ์ธต ์ ๊ฒฝ๋ง์์ ๋๋ฆฌ ์ฐ์ด๋ ํ์ฑํ ํจ์์ ๋๋ค. ์ผ๋ฐ ReLU์ฒ๋ผ ์์ ์ ๋ ฅ์ ๊ทธ๋๋ก ํต๊ณผ์ํค์ง๋ง, ์์ ์ ๋ ฅ์ 0์ผ๋ก ๋๋ฌ ๋ฒ๋ฆฌ๋ ๋์ ์์ ๊ธฐ์ธ๊ธฐ alpha๋ฅผ ๋ถ์ฌํ๋ค๋ ์ ์ด ๋ค๋ฆ ๋๋ค. ๋๋ถ์ ์์ ์์ญ์์๋ ์์ ๊ธฐ์ธ๊ธฐ(๊ทธ๋๋์ธํธ)๊ฐ ๊ณ์ ํ๋ฅด๊ฒ ๋์ด, ๋ด๋ฐ์ด 0๋ง ์ถ๋ ฅํ ์ฑ ํ์ต์ ๋ฉ์ถฐ ๋ฒ๋ฆฌ๋ ์ด๋ฅธ๋ฐ 'dying ReLU(์ฃฝ์ ReLU)' ๋ฌธ์ ๋ฅผ ์ํํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
์์
์ ๋ ฅ \(x\)์ ๋์ค ๊ธฐ์ธ๊ธฐ \(\alpha\)์ ๋ํด ์ถ๋ ฅ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$f(x) = \begin{cases} x & \text{if } x > 0 \\[0.5em] \alpha \cdot x & \text{if } x \le 0 \end{cases}$$๊ธฐ๋ณธ ๋์ค ๊ฐ์ \(\alpha = 0.01\) ์ ๋๋ค. ๋ ๊ฐ์ง ํน์ํ ๊ฒฝ์ฐ๋ฅผ ์์ ๋๋ฉด ์ข์ต๋๋ค. \(\alpha = 0\)์ด๋ฉด ์ผ๋ฐ ReLU(\(\max(0, x)\))์ ๊ฐ์์ง๊ณ , \(\alpha = 1\)์ด๋ฉด ํจ์๊ฐ ํญ๋ฑ ์ง์ \(f(x) = x\)๋ก ๋ฐ๋๋๋ค.
๊ณ์ฐ๊ธฐ ์ฌ์ฉ๋ฒ
์์ \(x\) ๊ฐ, ์ ์ฌ์ด์ ๊ฐ๊ฒฉ(step), ์์ฑํ ์ ์ ๊ฐ์, ๊ทธ๋ฆฌ๊ณ ๋์ค ๊ธฐ์ธ๊ธฐ \(\alpha\)๋ฅผ ์ ๋ ฅํ์ธ์. ๊ณ์ฐ๊ธฐ๋ \(i = 0\)๋ถํฐ \(\text{count}-1\)๊น์ง ๋ค์ ์์ด์ ๋ง๋ค๊ณ ,
$$x_i = \text{startX} + i \cdot \text{stepX}$$๊ฐ ์ ์์ \(f\)๋ฅผ ๊ณ์ฐํด \((x, f(x))\) ์์ ๋ชฉ๋ก๊ณผ ๊ณก์ ๊ทธ๋ํ๋ฅผ ํจ๊ป ๋ณด์ฌ ์ค๋๋ค. \(x\) ๊ฐ ํ๋๋ง ์ ๋ ฅํด \(f(x)\)๋ฅผ ๋ฐ๋ก ํ ๋ฒ ๊ณ์ฐํด ๋ณผ ์๋ ์์ต๋๋ค.
๊ณ์ฐ ์์
\(\alpha = 0.01\)์ธ ๊ฒฝ์ฐ: \(x = -4\)๋ 0 ์ดํ์ด๋ฏ๋ก \(f = 0.01 \times (-4) = -0.04\) ์ ๋๋ค. \(x = 0\)์์๋ \(f = 0\)์ด๊ณ , \(x = 3\)์ ์์์ด๋ฏ๋ก \(f = 3\) ์ ๋๋ค. ๊ธฐ๋ณธ๊ฐ(\(\text{startX} = -4\), \(\text{stepX} = 0.05\), \(\text{count} = 101\))์ ์ฌ์ฉํ๋ฉด ๊ตฌ๊ฐ์ \(x = -4\)(\(f = -0.04\))์์ ์์ํด \(x = +1.0\)(\(f = 1.0\))๊น์ง ์งํ๋๋ฉฐ, 81๋ฒ์งธ ์ (\(i = 80\))์์ 0์ ์ง๋๊ฒ ๋ฉ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
Leaky ReLU๋ ReLU์ ์ด๋ป๊ฒ ๋ค๋ฅธ๊ฐ์? ReLU๋ ๋ชจ๋ ์์ ์ ๋ ฅ์ ๋ํด ์ ํํ 0์ ์ถ๋ ฅํ์ง๋ง, Leaky ReLU๋ \(\alpha \cdot x\)๋ผ๋ ์์ ์์ ๊ฐ์ ์ถ๋ ฅํด ๊ธฐ์ธ๊ธฐ๋ฅผ ๋ณด์กดํฉ๋๋ค.
alpha ๊ฐ์ ์ผ๋ง๊ฐ ์ ์ ํ๊ฐ์? 0.01์ด ํํ ์ฐ์ด๋ ๊ธฐ๋ณธ๊ฐ์ ๋๋ค. Parametric ReLU ๊ฐ์ ๋ณํ์์๋ ํ์ต ๊ณผ์ ์์ \(\alpha\)๋ฅผ ์ง์ ํ์ตํ๊ธฐ๋ ํฉ๋๋ค.
alpha๊ฐ ์์์ผ ์๋ ์๋์? ์ํ์ ์ผ๋ก๋ ๊ฐ๋ฅํ์ง๋ง ํ์น ์์ผ๋ฉฐ, ์ผ๋ฐ์ ์ธ ์ ๊ฒฝ๋ง์์๋ ๊ถ์ฅํ์ง ์์ต๋๋ค.