यह कैलकुलेटर क्या करता है
यह टूल मानक द्विचर सामान्य वितरण (standard bivariate normal distribution) का मान निकालता है — यानी एक द्वि-आयामी गॉसियन वितरण जिसमें दोनों अक्षों के माध्य शून्य, प्रसरण (variance) एक होता है, और सिर्फ़ एक स्वतंत्र पैरामीटर रहता है: सहसंबंध गुणांक ρ। किसी बिंदु (x, y) के लिए यह दो मान लौटाता है: उस बिंदु पर संयुक्त प्रायिकता घनत्व \(f(x, y, \rho)\), और ऊपरी-पुच्छ (ऑर्थेंट) संचयी प्रायिकता \(Q(x, y, \rho) = P(U_1 > x \text{ तथा } U_2 > y)\)। चूँकि हर इनपुट पहले से ही मानकीकृत और इकाई-रहित (dimensionless) स्कोर है, इसलिए यह कैलकुलेटर सार्वभौमिक है और किसी भी इकाई रूपांतरण की ज़रूरत नहीं पड़ती।
इसका उपयोग कैसे करें
पर्सेंटाइल बिंदु x, पर्सेंटाइल बिंदु y और सहसंबंध ρ दर्ज करें। यहाँ "पर्सेंटाइल बिंदु" का मतलब है z-जैसा मानकीकृत सीमा-मान (एक निर्देशांक), न कि 0 से 1 के बीच का कोई पर्सेंटाइल। सहसंबंध की शर्त है \(-1 < \rho < 1\); मान \(\pm 1\) स्वीकार नहीं किए जाते क्योंकि उन पर घनत्व अनंत हो जाता है (\(\sqrt{1-\rho^{2}}\) से भाग देने पर शून्य से विभाजन की स्थिति बनती है)।
सूत्रों की व्याख्या
घनत्व ऊपर दिखाया गया बंद-रूप (closed-form) गॉसियन सूत्र है।
$$\varphi(x,y;\rho) = \frac{1}{2\pi\sqrt{1-\rho^{2}}}\,\exp\!\left(-\frac{x^{2}-2\rho\,x\,y+y^{2}}{2\left(1-\rho^{2}\right)}\right)$$ऑर्थेंट प्रायिकता के लिए शेपर्ड की सर्वसमिका (Sheppard's identity) का उपयोग होता है: जब \(\rho = 0\) हो, तो दोनों चर स्वतंत्र होते हैं और \(Q = Q_1(x)\cdot Q_1(y)\), जहाँ \(Q_1(t)\) एकचर मानक सामान्य का ऊपरी-पुच्छ फ़ंक्शन है।
$$\begin{gathered} Q(x,y;\rho) = Q_1(x)\,Q_1(y) + \frac{1}{2\pi}\int_{0}^{\rho}\frac{\exp\!\left(-\dfrac{x^{2}-2r\,x\,y+y^{2}}{2(1-r^{2})}\right)}{\sqrt{1-r^{2}}}\,dr \\[1.5em] \text{where}\quad \left\{ \begin{aligned} x &= \text{Percentile point x} \\ y &= \text{Percentile point y} \\ \rho &= \text{Correlation }\rho \\ Q_1(t) &= \tfrac{1}{2}\,\operatorname{erfc}\!\left(\tfrac{t}{\sqrt{2}}\right) \end{aligned} \right. \end{gathered}$$शून्येतर \(\rho\) के लिए हम 0 से \(\rho\) तक एक सुधार समाकल (correction integral) जोड़ते हैं, जिसे यहाँ उच्च सटीकता के लिए 24-नोड गॉस–लेजान्ड्र चतुष्कोणीयन (Gauss–Legendre quadrature) से हल किया जाता है।
हल किया हुआ उदाहरण
मान लीजिए \(x = 2\), \(y = 0.7\), \(\rho = 0.8\): तब \(1 - \rho^{2} = 0.36\), \(\sqrt{} = 0.6\), और पूर्व-गुणक (prefactor) \(= 1/(2\pi\cdot 0.6) = 0.265258\)। घातांक का अंश \(= 4 - 2\cdot 0.8\cdot 2\cdot 0.7 + 0.49 = 2.25\), इसे 0.72 से भाग देने पर 3.125 मिलता है। इसलिए \(f = 0.265258 \cdot e^{-3.125} \approx 0.011655\)। ऊपरी प्रायिकता \(Q \approx 0.0212\) — जो स्वतंत्रता की स्थिति वाले मान 0.0055 से ज़्यादा है, क्योंकि धनात्मक सहसंबंध दोनों चरों को एक साथ ऊपर की ओर खींचता है।
सहसंबंध ऑर्थेंट प्रायिकता को कैसे बदलता है
ऑर्थेंट प्रायिकता \(Q(x,y;\rho)=P(U_1>x,\,U_2>y)\) दो मानक सामान्य चर एक साथ अपनी सीमाओं से अधिक होने की संभावना को मापता है। कट-पॉइंट्स को \(x=1\) और \(y=1\) पर स्थिर रखते हुए और सहसंबंध \(\rho\) को स्वीप करते हुए निर्भरता के शुद्ध प्रभाव को अलग किया जाता है। जब \(\rho=0\) चर स्वतंत्र हैं और \(Q\) दो एकचर ऊपरी पूंछों के उत्पाद में विभाजित होता है, \(Q_1(x)\,Q_1(y)\)। एक मानक सामान्य के लिए, \(Q_1(1)=P(U>1)\approx 0.158655\), इसलिए स्वतंत्रता बेंचमार्क \(0.158655^2\approx 0.025172\) है।
| \(\rho\) | घनत्व \(f(1,1;\rho)\) | ऑर्थेंट \(Q(1,1;\rho)\) | स्वतंत्रता \(Q_1(1)Q_1(1)\) |
|---|---|---|---|
| \(-0.8\) | 0.0476 | 0.0049 | 0.0252 |
| \(-0.4\) | 0.0780 | 0.0145 | 0.0252 |
| \(0\) | 0.0585 | 0.0252 | 0.0252 |
| \(0.4\) | 0.1063 | 0.0438 | 0.0252 |
| \(0.8\) | 0.2643 | 0.0826 | 0.0252 |
यह पैटर्न मोनोटोन है: सकारात्मक सहसंबंध संयुक्त अतिक्रमण को अधिक संभावित बनाता है (बड़े मान एक साथ होते हैं), इसलिए \(Q\) स्वतंत्रता मान से ऊपर उठता है; नकारात्मक सहसंबंध दोनों चरों को विपरीत दिशाओं में खींचता है, इसलिए संयुक्त अतिक्रमण दुर्लभ हो जाता है और \(Q\) \(Q_1 Q_1\) से नीचे गिरता है। \(\rho=0\) पर ऑर्थेंट प्रायिकता बिल्कुल उत्पाद \(0.0252\) के बराबर है, स्वतंत्रता गुणनखंडन की पुष्टि करते हुए।
घनत्व और ऑर्थेंट प्रायिकता की व्याख्या
घनत्व \(f\) एक प्रायिकता नहीं है। मान \(\varphi(x,y;\rho)\) \((x,y)\) तल में प्रति इकाई क्षेत्र एक प्रायिकता घनत्व है; केवल एक क्षेत्र पर इसका समाकल एक प्रायिकता लौटाता है। सतह मूल \((0,0)\) पर अपनी अधिकतम तक पहुंचती है, जहां घातांकी पद 1 के बराबर है और
$$f(0,0;\rho)=\frac{1}{2\pi\sqrt{1-\rho^{2}}}.$$\(\rho=0\) के लिए यह शिखर \(1/(2\pi)\approx 0.159\) है, आराम से 1 से नीचे। जैसे-जैसे \(\rho\to\pm 1\) गुणक \(1/\sqrt{1-\rho^2}\) विचलित होता है, इसलिए शिखर घनत्व 1 से अधिक हो सकता है — यह एक घनत्व के लिए सामान्य है, क्योंकि यह प्रायिकता द्रव्यमान को रेखा \(y=\rho x\) पर संकेंद्रित करता है।
ऑर्थेंट प्रायिकता \(Q\) एक वास्तविक प्रायिकता है और हमेशा \([0,1]\) में निहित है। यह घनत्व सतह के नीचे चतुर्थांश \(\{U_1>x,\,U_2>y\}\) के ऊपर की मात्रा है। उपयोगी संरचनात्मक तथ्य:
- स्वतंत्रता (\(\rho=0\)): \(Q(x,y;0)=Q_1(x)\,Q_1(y)\), दो एकचर ऊपरी पूंछों का उत्पाद।
- तर्कों में समरूपता: दोनों निर्देशांकों की भूमिकाओं को विनिमय करके, \(Q(x,y;\rho)=Q(y,x;\rho)\)।
- प्रतिबिंब पहचान: \(Q(-x,-y;\rho)=Q(x,y;\rho)+ \Phi(-x)+\Phi(-y)-1\) (द्विचर सीडीएफ के माध्यम से समानतः व्यक्त), और एक तर्क के चिन्ह को उलटने से प्रभावी सहसंबंध को पलट देता है: \(P(U_1>x,\,U_2
- सीमांत व्यवहार \(\rho\to 1^{-}\): चर पूरी तरह से सहदिशात्मक बन जाते हैं, \(U_2\approx U_1\), इसलिए \(Q(x,y;\rho)\to Q_1(\max(x,y))\) — दोनों अतिक्रमण मेल खाते हैं।
- सीमांत व्यवहार \(\rho\to -1^{+}\): चर पूरी तरह से विपरीत दिशा में होते हैं, \(U_2\approx -U_1\)। संयुक्त ऊपरी अतिक्रमण तब संभव है जब दोनों सीमाएं एक साथ पार की जा सकें, \(Q\to\max\!\big(0,\;1-\Phi(x)-\Phi(y)\big)\) देते हुए, जो 0 होता है जब भी \(x+y\ge 0\) हो।
क्योंकि सामान्य \(\rho\) के साथ \(Q\) के लिए कोई बंद रूप नहीं है, इसका मूल्यांकन संख्यात्मक रूप से किया जाता है — आम तौर पर Owen के T फ़ंक्शन के माध्यम से या Gauss–Legendre चतुष्पाद का उपयोग करके \(\rho\) पर एक-आयामी समाकल के माध्यम से, दोनों ही तुलना तालिका में दिए गए मानों को उच्च परिशुद्धता तक पुनः प्राप्त करते हैं।
परिभाषाएं और शब्दावली
- मानकीकृत स्कोर (\(x\), \(y\))
- एक z-जैसा निर्देशांक जो मापता है कि एक मान अपने माध्य से कितने मानक विचलन दूर है। इनपुट \(x\) और \(y\) पहले से मानकीकृत हैं, इसलिए प्रत्येक सीमांत रूप से मानक सामान्य \(N(0,1)\) वितरण का पालन करता है।
- सहसंबंध गुणांक \(\rho\)
- दो मानक सामान्य चर के बीच रैखिक (Pearson) सहसंबंध, \(-1<\rho<1\) के साथ। यह एकमात्र पैरामीटर है जो नियंत्रित करता है कि दोनों निर्देशांक कितनी दृढ़ता से एक साथ चलते हैं; \(\rho=0\) का अर्थ यहाँ स्वतंत्रता है, जबकि \(\rho\to\pm1\) का अर्थ एक निकट-नियतात्मक रैखिक संबंध है। एक देखी गई \(\rho\) को युग्मित डेटा से एक Pearson सहसंबंध कैलकुलेटर के साथ अनुमानित किया जा सकता है।
- संयुक्त घनत्व \(f(x,y;\rho)\)
- मानक द्विचर सामान्य प्रायिकता घनत्व, \(\varphi(x,y;\rho)=\dfrac{1}{2\pi\sqrt{1-\rho^2}}\exp\!\left(-\dfrac{x^2-2\rho xy+y^2}{2(1-\rho^2)}\right)\)। यह प्रति इकाई क्षेत्र प्रायिकता का वर्णन करता है, स्वयं एक प्रायिकता नहीं।
- ऑर्थेंट प्रायिकता \(Q(x,y;\rho)\)
- ऊपरी-पूंछ संयुक्त प्रायिकता \(P(U_1>x,\,U_2>y)\) — दो सीमाओं द्वारा परिभाषित ऊपरी-दाएं चतुर्थांश के ऊपर घनत्व सतह के नीचे की मात्रा। हमेशा 0 और 1 के बीच।
- एकचर ऊपरी पूंछ \(Q_1(t)\)
- मानक सामान्य अस्तित्व फलन \(Q_1(t)=P(U>t)=1-\Phi(t)\), \(t\) से परे दाहिनी पूंछ में क्षेत्र। उदाहरण के लिए \(Q_1(1)\approx 0.1587\)। \(\rho=0\) पर, \(Q=Q_1(x)Q_1(y)\)।
- पूरक त्रुटि फलन (\(\operatorname{erfc}\))
- एक विशेष फलन जो सामान्य पूंछ से \(Q_1(t)=\tfrac{1}{2}\operatorname{erfc}\!\left(t/\sqrt{2}\right)\) द्वारा संबंधित है। यह \(Q\) में उपयोग की जाने वाली एकचर पूंछ प्रायिकताओं की गणना करने के लिए संख्यात्मक रूप से स्थिर तरीका प्रदान करता है।
- Gauss–Legendre चतुष्पाद
- एक संख्यात्मक समाकल योजना जो एक निश्चित समाकल को इष्टतमतः चुने हुए नोड्स पर इंटीग्रेंड के भारित योग द्वारा अनुमानित करती है। क्योंकि \(Q(x,y;\rho)\) का कोई प्राथमिक बंद रूप नहीं है, इसका आमतौर पर घनत्व को एकीकृत करके (या \(\rho\) के एक फलन) इस विधि से मूल्यांकन किया जाता है ताकि सटीक परिणाम प्राप्त हों।
अक्सर पूछे जाने वाले प्रश्न
ρ बिलकुल 1 क्यों नहीं हो सकता? \(\rho = \pm 1\) पर दोनों चर पूरी तरह एक-दूसरे पर निर्भर हो जाते हैं और वितरण सिकुड़कर एक रेखा पर आ जाता है; उस रेखा से बाहर घनत्व का कोई सीमित मान नहीं होता।
Q किसका प्रतिनिधित्व करता है? यह दोनों सीमा-मानों से आगे के ऊपरी-दाएँ "ऑर्थेंट" में मौजूद प्रायिकता द्रव्यमान है: \(P(U_1 > x, U_2 > y)\)।
x या y के बड़े मानों पर क्या होता है? घनत्व घटकर 0 की ओर जाता है और Q भी 0 के पास पहुँच जाता है, क्योंकि दोनों मानकीकृत चरों का एक साथ बड़े धनात्मक सीमा-मानों को पार करना उत्तरोत्तर असंभव होता जाता है।