Sigmoid fonksiyonu nedir?
Sigmoid ya da lojistik fonksiyon, herhangi bir gerçek sayıyı yumuşak, S biçimli bir eğriyle (0, 1) açık aralığına sıkıştırır. \(\sigma(x) = \frac{1}{1 + e^{-\text{a}\,x}}\) şeklinde tanımlanan bu fonksiyon, yapay sinir ağlarında en sık kullanılan aktivasyon fonksiyonlarından biridir; ayrıca lojistik regresyon, olasılık modelleme ve büyüme eğrilerinin de vazgeçilmezidir. Kazanç parametresi \(\text{a}\), geçişin ne kadar dik olacağını belirler: \(\text{a} = 1\) olduğunda ders kitaplarındaki klasik sigmoid'i elde edersiniz, daha büyük \(\text{a}\) değerleri ise geçişi adım fonksiyonuna doğru sıkıştırır.
Bu hesaplayıcı nasıl kullanılır?
Önce kazanç değeri \(\text{a}\)'yı, ardından fonksiyonu değerlendirmek istediğiniz aralığı girin: x minimum, x maksimum ve x adımı (artış miktarı). Araç her adımda \(\sigma(x)\), birinci türevi \(\sigma^{\prime}(x)\) ve ikinci türevi \(\sigma^{\prime\prime}(x)\) için bir tablo oluşturur; isteğe bağlı olarak girdiğiniz tek bir x değeri için de noktasal sonuçları gösterir. Adımın sıfırdan büyük ve x maksimumun en az x minimum kadar olduğundan emin olun; aksi takdirde tabloda hiçbir satır oluşmaz.
Formüllerin açıklaması
Türevler, \(\sigma\)'nın kendisi cinsinden yazıldığında oldukça sade biçimler alır. Türev alındığında $$\sigma^{\prime}(x) = \text{a}\,\sigma(x)\bigl(1 - \sigma(x)\bigr)$$ elde edilir; bu ifade her zaman pozitiftir (eğri tekdüze artar) ve büküm noktası olan \(x = 0\)'da en yüksek değeri olan \(\frac{\text{a}}{4}\)'e ulaşır. İkinci türev $$\sigma^{\prime\prime}(x) = \text{a}^{2}\,\sigma(x)\bigl(1 - \sigma(x)\bigr)\bigl(1 - 2\,\sigma(x)\bigr)$$ \(\sigma\)'nın 0,5 olduğu \(x = 0\) noktasında işaret değiştirir ve bu da büküm noktasını doğrular.
Örnek çözüm
\(\text{a} = 1\) ve \(x = 2\) alalım. Bu durumda \(e^{-2} = 0{,}135335\) olur ve $$\sigma(2) = \frac{1}{1{,}135335} = 0{,}880797$$ bulunur. Birinci türev \(0{,}880797 \cdot (1 - 0{,}880797) = 0{,}104994\)'tür. İkinci türev ise $$0{,}104994 \cdot (1 - 2 \cdot 0{,}880797) = 0{,}104994 \cdot (-0{,}761594) = -0{,}079963$$ olur. \(x = 0\) noktasında değerler \(\sigma = 0{,}5\), \(\sigma^{\prime} = 0{,}25\) ve \(\sigma^{\prime\prime} = 0\)'dır.
Sık Sorulan Sorular
Kazanç \(\text{a}\) ne işe yarar? Girdiyi ölçekler. Daha büyük bir \(\text{a}\), eğrinin \(x = 0\) çevresinde daha hızlı yükselmesini sağlar; \(\text{a}\) büyüdükçe sigmoid keskin bir adım fonksiyonuna yaklaşır, \(\text{a} = 0\) olduğunda ise 0,5 düzeyinde düz bir çizgi elde edilir.
En dik nokta neresidir? Her zaman \(x = 0\)'dır; bu noktada eğim \(\frac{\text{a}}{4}\)'e eşittir ve ikinci türev sıfırdır.
Çıktı neden hiçbir zaman tam olarak 0 veya 1 olmaz? Üstel fonksiyon sonlu bir x için asla sıfıra ulaşmaz; bu nedenle \(\sigma\) her zaman (0, 1) aralığının kesin olarak içinde kalır. \(|\text{a}\cdot x|\) çok büyük olduğunda değer sayısal olarak 0 veya 1'e yuvarlanır ve bu hesaplayıcı bu durumu güvenli şekilde ele alır.