Leaky ReLU рдПрдХреНрдЯрд┐рд╡реЗрд╢рди рдлрдВрдХреНрд╢рди рдХреНрдпрд╛ рд╣реИ?
Leaky ReLU (Leaky Rectified Linear Unit) рдбреАрдк рдиреНрдпреВрд░рд▓ рдиреЗрдЯрд╡рд░реНрдХ рдореЗрдВ рдЗрд╕реНрддреЗрдорд╛рд▓ рд╣реЛрдиреЗ рд╡рд╛рд▓рд╛ рдПрдХ рд▓реЛрдХрдкреНрд░рд┐рдп рдПрдХреНрдЯрд┐рд╡реЗрд╢рди рдлрдВрдХреНрд╢рди рд╣реИред рд╕рд╛рдорд╛рдиреНрдп ReLU рдХреА рддрд░рд╣ рдпрд╣ рдкреЙрдЬрд╝рд┐рдЯрд┐рд╡ рдЗрдирдкреБрдЯ рдХреЛ рд╕реАрдзреЗ рдЖрдЧреЗ рднреЗрдЬ рджреЗрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдиреЗрдЧреЗрдЯрд┐рд╡ рдЗрдирдкреБрдЯ рдХреЛ рд╢реВрдиреНрдп рдкрд░ рд╕рдкрд╛рдЯ рдХрд░рдиреЗ рдХреЗ рдмрдЬрд╛рдп рдЙрдиреНрд╣реЗрдВ рдПрдХ рдЫреЛрдЯрд╛-рд╕рд╛ рдиреЙрди-рдЬрд╝реАрд░реЛ рдврд▓рд╛рди \(\alpha\) рджреЗрддрд╛ рд╣реИред рдЗрд╕рд╕реЗ рдиреЗрдЧреЗрдЯрд┐рд╡ рдкреНрд░реА-рдПрдХреНрдЯрд┐рд╡реЗрд╢рди рдХреЗ рд▓рд┐рдП рднреА рдПрдХ рд╣рд▓реНрдХрд╛ рдЧреНрд░реЗрдбрд┐рдПрдВрдЯ рдмрд╣рддрд╛ рд░рд╣рддрд╛ рд╣реИ рдФрд░ "dying ReLU" рдХреА рд╕рдорд╕реНрдпрд╛ рд╕реЗ рдмрдЪрд╛рд╡ рд╣реЛрддрд╛ рд╣реИ тАФ рд╡рд╣ рд╕реНрдерд┐рддрд┐ рдЬрд╣рд╛рдБ рдиреНрдпреВрд░реЙрди рд╣рдореЗрд╢рд╛ рд╢реВрдиреНрдп рджреЗрдиреЗ рд▓рдЧрддреЗ рд╣реИрдВ рдФрд░ рд╕реАрдЦрдирд╛ рдмрдВрдж рдХрд░ рджреЗрддреЗ рд╣реИрдВред
рдлреЙрд░реНрдореВрд▓рд╛
рдХрд┐рд╕реА рдЗрдирдкреБрдЯ \(x\) рдФрд░ рд▓реАрдХ рдврд▓рд╛рди \(\alpha\) рдХреЗ рд▓рд┐рдП рдЖрдЙрдЯрдкреБрдЯ рд╣реЛрддрд╛ рд╣реИ
$$f(x) = \begin{cases} x & \text{if } x > 0 \\[0.5em] \alpha \cdot x & \text{if } x \le 0 \end{cases}$$рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд▓реАрдХ \(\alpha = 0.01\) рд╣реИред рджреЛ рдЦрд╛рд╕ рдорд╛рдорд▓реЗ рдзреНрдпрд╛рди рджреЗрдиреЗ рд▓рд╛рдпрдХ рд╣реИрдВ: \(\alpha = 0\) рд╣реЛрдиреЗ рдкрд░ рдпрд╣ рд╕рд╛рдорд╛рдиреНрдп ReLU (\(\max(0, x)\)) рдмрди рдЬрд╛рддрд╛ рд╣реИ, рдФрд░ \(\alpha = 1\) рд╣реЛрдиреЗ рдкрд░ рдлрдВрдХреНрд╢рди рдЖрдЗрдбреЗрдВрдЯрд┐рдЯреА рд░реЗрдЦрд╛ \(f(x) = x\) рдореЗрдВ рдмрджрд▓ рдЬрд╛рддрд╛ рд╣реИред
рдЗрд╕ рдХреИрд▓рдХреБрд▓реЗрдЯрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХреИрд╕реЗ рдХрд░реЗрдВ
\(x\) рдХрд╛ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдорд╛рди, рдмрд┐рдВрджреБрдУрдВ рдХреЗ рдмреАрдЪ рдХрд╛ рд╕реНрдЯреЗрдк рд╕рд╛рдЗрдЬрд╝, рдХрд┐рддрдиреЗ рдмрд┐рдВрджреБ рдмрдирд╛рдиреЗ рд╣реИрдВ рдЙрдирдХреА рд╕рдВрдЦреНрдпрд╛, рдФрд░ рд▓реАрдХ рдврд▓рд╛рди \(\alpha\) рджрд░реНрдЬ рдХрд░реЗрдВред рдпрд╣ рдЯреВрд▓ рдХреНрд░рдо
$$x_i = \text{startX} + i \cdot \text{stepX}, \quad i = 0, 1, \dots, \text{count} - 1$$рдмрдирд╛рддрд╛ рд╣реИ, рд╣рд░ рдмрд┐рдВрджреБ рдкрд░ \(f\) рдХрд╛ рдорд╛рди рдирд┐рдХрд╛рд▓рддрд╛ рд╣реИ, рдФрд░ \((x, f(x))\) рдЬреЛрдбрд╝реЛрдВ рдХреА рд╕реВрдЪреА рдХреЗ рд╕рд╛рде рдХрд░реНрд╡ рдХрд╛ рдкреНрд▓реЙрдЯ рджрд┐рдЦрд╛рддрд╛ рд╣реИред рдЖрдк рдХрд┐рд╕реА рдПрдХ \(x\) рдорд╛рди рдХреЛ рдЯрд╛рдЗрдк рдХрд░рдХреЗ рд╕реАрдзреЗ \(f(x)\) рдХрд╛ рдПрдХ рдорд╛рди рднреА рдкрд╛ рд╕рдХрддреЗ рд╣реИрдВред
рд╣рд▓ рдХрд┐рдпрд╛ рд╣реБрдЖ рдЙрджрд╛рд╣рд░рдг
\(\alpha = 0.01\) рдХреЗ рд╕рд╛рде: \(x = -4\) рдкрд░ рдЗрдирдкреБрдЯ рдиреЙрди-рдкреЙрдЬрд╝рд┐рдЯрд┐рд╡ рд╣реИ, рдЗрд╕рд▓рд┐рдП \(f = 0.01 \times (-4) = -0.04\)ред \(x = 0\) рдкрд░ \(f = 0\)ред \(x = 3\) рдкрд░ рдЗрдирдкреБрдЯ рдкреЙрдЬрд╝рд┐рдЯрд┐рд╡ рд╣реИ, рдЗрд╕рд▓рд┐рдП \(f = 3\)ред рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдорд╛рдиреЛрдВ (\(\text{startX} = -4\), \(\text{stepX} = 0.05\), \(\text{count} = 101\)) рдХреЗ рд╕рд╛рде рд╕реНрд╡реАрдк \(x = -4\) (\(f = -0.04\)) рд╕реЗ рд╢реБрд░реВ рд╣реЛрдХрд░ \(x = +1.0\) (\(f = 1.0\)) рддрдХ рдЪрд▓рддреА рд╣реИ, рдФрд░ 81рд╡реЗрдВ рдмрд┐рдВрджреБ (\(i = 80\)) рдкрд░ рд╢реВрдиреНрдп рдХреЛ рдкрд╛рд░ рдХрд░рддреА рд╣реИред
рдЕрдХреНрд╕рд░ рдкреВрдЫреЗ рдЬрд╛рдиреЗ рд╡рд╛рд▓реЗ рд╕рд╡рд╛рд▓
Leaky ReLU, ReLU рд╕реЗ рдХреИрд╕реЗ рдЕрд▓рдЧ рд╣реИ? ReLU рд╣рд░ рдиреЗрдЧреЗрдЯрд┐рд╡ рдЗрдирдкреБрдЯ рдХреЗ рд▓рд┐рдП рдареАрдХ 0 рджреЗрддрд╛ рд╣реИ; рдЬрдмрдХрд┐ Leaky ReLU рдПрдХ рдЫреЛрдЯрд╛ рдиреЗрдЧреЗрдЯрд┐рд╡ рдорд╛рди \(\alpha \cdot x\) рджреЗрддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдЧреНрд░реЗрдбрд┐рдПрдВрдЯ рдмрдирд╛ рд░рд╣рддрд╛ рд╣реИред
\(\alpha\) рдХрд╛ рдЕрдЪреНрдЫрд╛ рдорд╛рди рдХреНрдпрд╛ рд╣реИ? 0.01 рдЖрдо рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд╣реИред Parametric ReLU рдЬреИрд╕реЗ рд╡реИрд░рд┐рдПрдВрдЯ рдЯреНрд░реЗрдирд┐рдВрдЧ рдХреЗ рджреМрд░рд╛рди \(\alpha\) рдХреЛ рдЦреБрдж рд╕реАрдЦ рд▓реЗрддреЗ рд╣реИрдВред
рдХреНрдпрд╛ \(\alpha\) рдиреЗрдЧреЗрдЯрд┐рд╡ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ? рдЧрдгрд┐рддреАрдп рд░реВрдк рд╕реЗ рд╣рд╛рдБ, рд▓реЗрдХрд┐рди рдпрд╣ рдЕрд╕рд╛рдорд╛рдиреНрдп рд╣реИ рдФрд░ рд╕рд╛рдорд╛рдиреНрдп рдиреЗрдЯрд╡рд░реНрдХ рдХреЗ рд▓рд┐рдП рдЗрд╕рдХреА рд╕рд▓рд╛рд╣ рдирд╣реАрдВ рджреА рдЬрд╛рддреАред