Bu hesaplayıcı ne işe yarar?
Bu araç, standart iki değişkenli normal dağılımı hesaplar. Söz konusu dağılım, her iki eksende de ortalaması sıfır, varyansı bir olan iki boyutlu bir Gauss dağılımıdır ve tek bir serbest parametreye sahiptir: korelasyon katsayısı ρ. Belirli bir (x, y) noktası verildiğinde araç iki değer döndürür: o noktadaki ortak olasılık yoğunluğu \(f(x, y, \rho)\) ve üst kuyruk (orthant) kümülatif olasılığı \(Q(x, y, \rho) = P(U_1 > x \text{ VE } U_2 > y)\). Tüm girdiler zaten standartlaştırılmış ve boyutsuz skorlar olduğundan, bu hesaplayıcı evrenseldir ve herhangi bir birim dönüşümüne ihtiyaç duymaz.
Nasıl kullanılır?
Yüzdelik noktası x'i, yüzdelik noktası y'yi ve ρ korelasyonunu girin. Buradaki "yüzdelik nokta" ifadesi, 0-1 aralığındaki bir yüzdelik dilim değil, z benzeri standartlaştırılmış bir eşik (yani bir koordinat) anlamına gelir. Korelasyon \(-1 < \rho < 1\) koşulunu sağlamalıdır; \(\pm 1\) değerleri kabul edilmez, çünkü bu durumda yoğunluk tekil hale gelir (\(\sqrt{1-\rho^{2}}\) ifadesinde sıfıra bölme ortaya çıkar).
Formüllerin açıklaması
Yoğunluk, yukarıda gösterilen kapalı form Gauss ifadesidir.
$$\varphi(x,y;\rho) = \frac{1}{2\pi\sqrt{1-\rho^{2}}}\,\exp\!\left(-\frac{x^{2}-2\rho\,x\,y+y^{2}}{2\left(1-\rho^{2}\right)}\right)$$Orthant olasılığı ise Sheppard özdeşliğini kullanır: ρ = 0 olduğunda değişkenler bağımsızdır ve \(Q = Q_1(x)\cdot Q_1(y)\) olur; burada \(Q_1(t)\), tek değişkenli üst kuyruk standart normal fonksiyonudur. ρ'nun sıfırdan farklı olduğu durumlarda, 0'dan ρ'ya kadar bir düzeltme integrali eklenir; bu integral, doğruluk için burada 24 düğümlü Gauss–Legendre kuadratürü ile hesaplanır.
$$\begin{gathered} Q(x,y;\rho) = Q_1(x)\,Q_1(y) + \frac{1}{2\pi}\int_{0}^{\rho}\frac{\exp\!\left(-\dfrac{x^{2}-2r\,x\,y+y^{2}}{2(1-r^{2})}\right)}{\sqrt{1-r^{2}}}\,dr \\[1.5em] \text{where}\quad \left\{ \begin{aligned} x &= \text{Percentile point x} \\ y &= \text{Percentile point y} \\ \rho &= \text{Correlation }\rho \\ Q_1(t) &= \tfrac{1}{2}\,\operatorname{erfc}\!\left(\tfrac{t}{\sqrt{2}}\right) \end{aligned} \right. \end{gathered}$$
Çözümlü örnek
\(x = 2\), \(y = 0.7\), \(\rho = 0.8\) için: \(1 - \rho^{2} = 0.36\), karekök \(= 0.6\), ön çarpan \(= 1/(2\pi\cdot 0.6) = 0.265258\). Üs payı \(= 4 - 2\cdot 0.8\cdot 2\cdot 0.7 + 0.49 = 2.25\), bunu 0.72'ye böldüğümüzde \(3.125\) elde edilir. Böylece \(f = 0.265258 \cdot e^{-3.125} \approx 0.011655\) olur. Üst olasılık \(Q \approx 0.0212\) çıkar — bu değer, bağımsızlık durumundaki 0.0055'ten daha yüksektir; çünkü pozitif korelasyon her iki değişkeni de birlikte yukarı doğru iter.
Korelasyon Ortant Olasılığını Nasıl Değiştirir
Ortant olasılığı \(Q(x,y;\rho)=P(U_1>x,\,U_2>y)\) iki standart normal değişkenin aynı anda eşiklerini aşma şansını ölçer. Kesim noktaları \(x=1\) ve \(y=1\)'de sabitlenmiş ve korelasyon \(\rho\) taranırken bağımlılığın saf etkisini izole eder. \(\rho=0\) olduğunda değişkenler bağımsızdır ve \(Q\) iki univaryat üst kuyrukların çarpımına ayrılır: \(Q_1(x)\,Q_1(y)\). Standart normal için \(Q_1(1)=P(U>1)\approx 0.158655\), bu nedenle bağımsızlık karşılaştırma değeri \(0.158655^2\approx 0.025172\)'dir.
| \(\rho\) | Yoğunluk \(f(1,1;\rho)\) | Ortant \(Q(1,1;\rho)\) | Bağımsızlık \(Q_1(1)Q_1(1)\) |
|---|---|---|---|
| \(-0.8\) | 0.0476 | 0.0049 | 0.0252 |
| \(-0.4\) | 0.0780 | 0.0145 | 0.0252 |
| \(0\) | 0.0585 | 0.0252 | 0.0252 |
| \(0.4\) | 0.1063 | 0.0438 | 0.0252 |
| \(0.8\) | 0.2643 | 0.0826 | 0.0252 |
Desen monotondur: pozitif korelasyon ortak aşımı daha olası hale getirir (büyük değerler birlikte meydana gelme eğilimindedir), bu nedenle \(Q\) bağımsızlık değerinin üzerine çıkar; negatif korelasyon iki değişkeni zıt yönlere çeker, bu nedenle ortak aşım daha nadir hale gelir ve \(Q\) \(Q_1 Q_1\)'in altına düşer. \(\rho=0\) olduğunda ortant olasılığı tam olarak çarpım \(0.0252\)'ye eşit olur ve bağımsızlık faktörizasyonunu doğrular.
Yoğunluk ve Ortant Olasılığını Yorumlama
Yoğunluk \(f\) bir olasılık değildir. \(\varphi(x,y;\rho)\) değeri \((x,y)\) düzlemindeki birim alan başına bir olasılık yoğunluğudur; yalnızca bir bölge üzerindeki integrali bir olasılık döndürür. Yüzey orijinde \((0,0)\) maksimumuna ulaşır; burada üstel terim 1'e eşittir ve
$$f(0,0;\rho)=\frac{1}{2\pi\sqrt{1-\rho^{2}}}.$$\(\rho=0\) için bu tepe \(1/(2\pi)\approx 0.159\)'dur ve rahatça 1'in altındadır. \(\rho\to\pm 1\) olduğunda \(1/\sqrt{1-\rho^2}\) faktörü ıraksak olur, bu nedenle tepe yoğunluğu 1'i aşabilir — bu bir yoğunluk için normaldir, çünkü olasılık kütlesini \(y=\rho x\) çizgisine yoğunlaştırır.
Ortant olasılığı \(Q\) hakiki bir olasılıktır ve her zaman \([0,1]\) aralığında yer alır. Bu \(\{U_1>x,\,U_2>y\}\) dörttebessine yönelik yoğunluk yüzeyi altındaki hacimdir. Yararlı yapısal gerçekler:
- Bağımsızlık (\(\rho=0\)): \(Q(x,y;0)=Q_1(x)\,Q_1(y)\), iki univaryat üst kuyrukların çarpımı.
- Argümanlarda simetri: iki koordinatın rollerini değiştirerek, \(Q(x,y;\rho)=Q(y,x;\rho)\).
- Yansıma özdeşliği: \(Q(-x,-y;\rho)=Q(x,y;\rho)+ \Phi(-x)+\Phi(-y)-1\) (bivaryat CDF aracılığıyla eşdeğer olarak ifade edilebilir) ve bir argümanın işaretini ters çevirmek etkili korelasyonu çevirir: \(P(U_1>x,\,U_2
- Sınır davranışı \(\rho\to 1^{-}\): değişkenler tam mühendis hal alır, \(U_2\approx U_1\), bu nedenle \(Q(x,y;\rho)\to Q_1(\max(x,y))\) — her iki aşım da çakışır.
- Sınır davranışı \(\rho\to -1^{+}\): değişkenler tam tersine mühendis hal alır, \(U_2\approx -U_1\). Ortak üst aşım ancak her iki eşik aynı anda aşılabilirse mümkündür ve \(Q\to\max\!\big(0,\;1-\Phi(x)-\Phi(y)\big)\) verir, bu da \(x+y\ge 0\) olduğunda 0'dır.
\(Q\) genel \(\rho\) için kapalı forma sahip olmadığından sayısal olarak değerlendirilir — tipik olarak Owen'ın T fonksiyonu veya Gauss–Legendre kadratürü kullanılarak \(\rho\) üzerinde tek boyutlu integral aracılığıyla, her ikisi de karşılaştırma tablosunda gösterilen değerleri yüksek kesinlikle yeniden üretir.
Tanımlar ve Sözlük
- Standartlaştırılmış skor (\(x\), \(y\))
- Bir değerin ortalamasından kaç standart sapma uzak olduğunu ölçen z benzeri bir koordinat. \(x\) ve \(y\) girdileri zaten standartlaştırılmışdır, bu nedenle her biri marjinal olarak standart normal \(N(0,1)\) dağılımını takip eder.
- Korelasyon katsayısı \(\rho\)
- İki standart normal değişken arasındaki doğrusal (Pearson) korelasyon; \(-1<\rho<1\). İki koordinatın birlikte ne kadar güçlü hareket ettiğini yöneten tek parametredir; \(\rho=0\) burada bağımsızlık anlamına gelirken \(\rho\to\pm1\) neredeyse belirlenimci doğrusal ilişki anlamına gelir. Gözlenen \(\rho\) eşleştirilmiş verilerden bir Pearson korelasyon hesaplayıcısı ile tahmin edilebilir.
- Ortak yoğunluk \(f(x,y;\rho)\)
- Standart bivaryat normal olasılık yoğunluğu, \(\varphi(x,y;\rho)=\dfrac{1}{2\pi\sqrt{1-\rho^2}}\exp\!\left(-\dfrac{x^2-2\rho xy+y^2}{2(1-\rho^2)}\right)\). Birim alan başına olasılık tanımlar, kendisi bir olasılık değildir.
- Ortant olasılığı \(Q(x,y;\rho)\)
- Üst kuyruk ortak olasılığı \(P(U_1>x,\,U_2>y)\) — iki eşik tarafından tanımlanan üst sağ dörtte yoğunluk yüzeyi altındaki hacim. Her zaman 0 ile 1 arasında.
- Univaryat üst kuyruk \(Q_1(t)\)
- Standart normal hayatta kalma fonksiyonu \(Q_1(t)=P(U>t)=1-\Phi(t)\), \(t\) ötesindeki sağ kuyrukta alan. Örneğin \(Q_1(1)\approx 0.1587\). \(\rho=0\) olduğunda \(Q=Q_1(x)Q_1(y)\).
- Tamamlayıcı hata fonksiyonu (\(\operatorname{erfc}\))
- Normal kuyruk ile \(Q_1(t)=\tfrac{1}{2}\operatorname{erfc}\!\left(t/\sqrt{2}\right)\) ile ilişkili özel bir fonksiyon. \(Q\)'da kullanılan univaryat kuyruk olasılıklarını hesaplamak için sayısal olarak kararlı bir yol sağlar.
- Gauss–Legendre kadratürü
- Belirli bir integrali integrandın en uygun seçilmiş düğümlerde ağırlıklı toplamı ile yaklaşık alan sayısal entegrasyon şeması. \(Q(x,y;\rho)\) temel kapalı forma sahip olmadığından, yoğunluğu (veya \(\rho\)'nın bir fonksiyonunu) entegre ederek bu yöntemle değerlendirilir ve doğru sonuçlar elde edilir.
Sıkça sorulan sorular
ρ neden tam olarak 1 olamaz? \(\rho = \pm 1\) olduğunda iki değişken birbirine tam bağımlıdır ve dağılım bir doğru üzerine çöker; yoğunluk, bu doğrunun dışında sonlu bir değer almaz.
Q neyi temsil eder? Her iki eşiğin de ötesinde, sağ üst "orthant" bölgesindeki olasılık kütlesini ifade eder: \(P(U_1 > x, U_2 > y)\).
Büyük x veya y değerlerinde ne olur? Yoğunluk 0'a doğru azalır ve Q da 0'a yaklaşır; çünkü her iki standartlaştırılmış değişkenin de büyük pozitif eşikleri aynı anda aşması giderek daha düşük olasılıklı hale gelir.