tanh fonksiyonu nedir?
tanh(x) olarak yazılan hiperbolik tanjant, her gerçek x sayısı için tanımlı, pürüzsüz S biçimli (sigmoid) bir fonksiyondur. \(e^{x}\) ve \(e^{-x}\) üstel ifadelerinin farkının toplamlarına oranı şeklinde tanımlanır. Çıktısı her zaman -1 ile 1 arasında, bu uçlara değmeden kalır ve tek fonksiyondur; yani \(\tanh(-x) = -\tanh(x)\). Makine öğreniminde tanh, sıfır merkezli olması sayesinde yaygın bir nöron aktivasyon fonksiyonudur; bu özellik gradyan tabanlı eğitimin 0–1 aralığındaki sigmoid'e kıyasla genellikle daha hızlı yakınsamasına yardımcı olur.
Bu hesaplama aracı nasıl kullanılır?
x için herhangi bir gerçek sayı girin; araç anında tanh(x) sonucunu ve kalkülüs, fizik ve geri yayılım (back-propagation) için kullanışlı iki isteğe bağlı türevi verir. Negatif sayılar, ondalıklı değerler ve çok büyük büyüklükler kabul edilir. Büyük pozitif x değerlerinde sonuç +1'e doğru, büyük negatif x değerlerinde ise -1'e doğru doyuma ulaşır.
Formülün açıklaması
Temel tanım şudur: $$\tanh\!\left(x\right) = \frac{e^{x} - e^{-x}}{e^{x} + e^{-x}}$$ Payda her zaman en az 2 olduğundan sıfıra bölme durumu asla oluşmaz. Birinci türev şık bir özdeşliği izler: $$\frac{d}{dx}\tanh\!\left(x\right) = 1 - \tanh^{2}\!\left(x\right)$$ bu da \(\operatorname{sech}^{2}(x)\) olarak yazılır. Tekrar türev alındığında ikinci türev elde edilir: $$\frac{d^{2}}{dx^{2}}\tanh\!\left(x\right) = -2\,\tanh\!\left(x\right)\left(1 - \tanh^{2}\!\left(x\right)\right)$$ Çok büyük |x| değerlerinde sayısal kararlılığı korumak için dahili olarak \(e^{-2x}\) üstel ifadesine dayalı bir yeniden düzenleme kullanılır; böylece taşma (overflow) önlenir.
Çözümlü örnek (x = 0.5)
\(e^{0.5} = 1.6487212707\) ve \(e^{-0.5} = 0.6065306597\) değerleriyle, $$\tanh(0.5) = \frac{1.0421906110}{2.2552519304} = 0.4621171573$$ bulunur. Birinci türev \(1 - 0.4621171573^{2} = 0.7864477623\), ikinci türev ise \(-2 \times 0.4621171573 \times 0.7864477623 = -0.7269989018\)'dir.
Sıkça Sorulan Sorular
tanh fonksiyonunun değer aralığı nedir? Açık aralık (-1, 1); uç noktalara yaklaşır ama onlara asla ulaşmaz.
tanh(0) kaçtır? Tam olarak 0'dır; \(f'(0) = 1\) ve \(f''(0) = 0\) olur.
Sigmoid yerine neden tanh kullanılır? tanh sıfır merkezlidir (çıktılar 0 etrafında simetriktir) ve bu, sinir ağı öğrenmesini hızlandırabilir; oysa lojistik sigmoid yalnızca 0 ile 1 arasında pozitif değerler üretir.