標準二元常態分配計算器｜聯合密度與上尾機率

Upper cumulative probability Q(x, y, ρ)	0.022035922476
意義	P(U1 > x and U2 > y)

這個計算器的用途

本工具用來計算標準二元常態分配，也就是一個二維高斯分配：兩軸的平均數皆為 0、變異數皆為 1，並且只有一個可調參數——相關係數 ρ。給定一個點 (x, y)，計算器會回傳兩個數值：該點的聯合機率密度 $f(x, y, \rho)$，以及上尾（象限）累積機率 $Q(x, y, \rho) = P(U_1 > x \text{ 且 } U_2 > y)$。由於所有輸入都已經是標準化、無單位的分數，這個計算器具有通用性，完全不需要做單位換算。

x-y 平面上二元常態密度的三維鐘形曲面 — 聯合密度 $f(x,y)$ 在 x-y 平面上形成鐘形曲面。

使用方式

輸入分位點 x、分位點 y，以及相關係數 ρ。這裡所說的「分位點」指的是類似 z 值的標準化門檻（也就是一個座標值），而不是介於 0 到 1 之間的百分位。相關係數必須滿足 $-1 < \rho < 1$；$\pm 1$ 這兩個值會被拒絕，因為此時密度會發散（$\sqrt{1-\rho^2}$ 會出現除以零的情況）。

公式解析

密度函數即上方所列的封閉形式高斯公式：

$$\varphi(x,y;\rho) = \frac{1}{2\pi\sqrt{1-\rho^{2}}}\,\exp\!\left(-\frac{x^{2}-2\rho\,x\,y+y^{2}}{2\left(1-\rho^{2}\right)}\right)$$

象限機率則採用 Sheppard 恆等式：當 $\rho = 0$ 時，兩變數彼此獨立，此時 $Q = Q_1(x)\cdot Q_1(y)$，其中 $Q_1(t)$ 是單變量標準常態的上尾函數。當 $\rho$ 不為零時，則需加上一個從 0 到 $\rho$ 的修正積分，本計算器以 24 節點的 Gauss–Legendre 高斯求積法進行運算，以確保精度。

$$\begin{gathered} Q(x,y;\rho) = Q_1(x)\,Q_1(y) + \frac{1}{2\pi}\int_{0}^{\rho}\frac{\exp\!\left(-\dfrac{x^{2}-2r\,x\,y+y^{2}}{2(1-r^{2})}\right)}{\sqrt{1-r^{2}}}\,dr \\[1.5em] \text{where}\quad \left\{ \begin{aligned} x &= \text{Percentile point x} \\ y &= \text{Percentile point y} \\ \rho &= \text{Correlation }\rho \\ Q_1(t) &= \tfrac{1}{2}\,\operatorname{erfc}\!\left(\tfrac{t}{\sqrt{2}}\right) \end{aligned} \right. \end{gathered}$$

三幅等高線圖，展示不同相關係數下的圓形、正向傾斜與負向傾斜橢圓 — 密度的橢圓等高線隨相關係數 rho 旋轉：rho=0 時為圓形，rho 為正或負時傾斜。

實例演算

以 $x = 2$、$y = 0.7$、$\rho = 0.8$ 為例：$1 - \rho^2 = 0.36$，開根號後 $= 0.6$，前置係數 $= 1/(2\pi\cdot 0.6) = 0.265258$。指數分子 $= 4 - 2\cdot 0.8\cdot 2\cdot 0.7 + 0.49 = 2.25$，除以 $0.72$ 得 $3.125$。因此 $f = 0.265258 \cdot e^{-3.125} \approx 0.011655$。上尾機率 $Q \approx 0.0212$——比獨立情況下的 0.0055 還高，因為正相關會讓兩個變數一起往上移動。

\(\rho\)	密度 \(f(1,1;\rho)\)	象限 \(Q(1,1;\rho)\)	獨立性 \(Q_1(1)Q_1(1)\)
\(-0.8\)	0.0476	0.0049	0.0252
\(-0.4\)	0.0780	0.0145	0.0252
\(0\)	0.0585	0.0252	0.0252
\(0.4\)	0.1063	0.0438	0.0252
\(0.8\)	0.2643	0.0826	0.0252

解釋密度和象限概率

密度 $f$ 不是概率。$f(x,y;\rho)$ 的值是每單位面積在 $(x,y)$ 平面中的概率密度；只有對某一區域的積分才能返回概率。曲面在原點 $(0,0)$ 處達到最大值，其中指數項等於 1，並且

$$f(0,0;\rho)=\frac{1}{2\pi\sqrt{1-\rho^{2}}}。$$

對於 $\rho=0$，此峰值為 $1/(2\pi)\approx 0.159$，遠小於 1。當 $\rho\to\pm 1$ 時，因子 $1/\sqrt{1-\rho^2}$ 發散，因此峰值密度可以超過 1——這對密度來說是正常的，因為它將概率質量集中在直線 $y=\rho x$ 上。

象限概率 $Q$ 是真正的概率，始終位於 $[0,1]$ 內。它是密度曲面在象限 $\{U_1>x,\,U_2>y\}$ 上方的體積。有用的結構性事實：

獨立性（$\rho=0$）：$Q(x,y;0)=Q_1(x)\,Q_1(y)$，兩個單變量上尾的乘積。
參數對稱性：通過交換兩個坐標的角色，$Q(x,y;\rho)=Q(y,x;\rho)$。
反射恆等式：$Q(-x,-y;\rho)=Q(x,y;\rho)+ \Phi(-x)+\Phi(-y)-1$（也可以通過雙變量累積分布函數表示），並且反轉一個參數的符號會翻轉有效相關性：\(P(U_1>x,\,U_2
極限行為 $\rho\to 1^{-}$：變數變得完全同調，$U_2\approx U_1$，因此 $Q(x,y;\rho)\to Q_1(\max(x,y))$——兩個超越同時發生。
極限行為 $\rho\to -1^{+}$：變數變得完全反調，$U_2\approx -U_1$。聯合上超越只有在兩個臨界值都能同時突破時才可能，給出 $Q\to\max\!\big(0,\;1-\Phi(x)-\Phi(y)\big)$，當 $x+y\ge 0$ 時為 0。

由於 $Q$ 沒有一般 $\rho$ 的閉形式，它通過數值方法計算——通常通過 Owen 的 T 函數或使用高斯-勒讓德正交法的關於 $\rho$ 的一維積分，兩者都能將比較表中顯示的值重現到高精度。

定義及詞彙表

標準化分數（$x$、$y$）: 一個類似 z 的坐標，衡量一個值距其均值多少個標準差。輸入 $x$ 和 $y$ 已經標準化，因此每個邊際上都遵循標準常態分布 $N(0,1)$。
相關係數 $\rho$: 兩個標準常態隨機變數之間的線性（皮爾遜）相關，其中 $-1<\rho<1$。它是控制兩個坐標如何強烈一起移動的單一參數；$\rho=0$ 表示此處獨立，而 $\rho\to\pm1$ 表示近似確定性線性關係。觀察到的 $\rho$ 可以通過皮爾遜相關計算器從配對數據估計。
聯合密度 $f(x,y;\rho)$: 標準雙變量常態概率密度，$\varphi(x,y;\rho)=\dfrac{1}{2\pi\sqrt{1-\rho^2}}\exp\!\left(-\dfrac{x^2-2\rho xy+y^2}{2(1-\rho^2)}\right)$。它描述每單位面積的概率，而不是概率本身。
象限概率 $Q(x,y;\rho)$: 上尾聯合概率 $P(U_1>x,\,U_2>y)$——密度曲面在由兩個臨界值定義的右上象限上方的體積。始終在 0 和 1 之間。
單變量上尾 $Q_1(t)$: 標準常態生存函數 $Q_1(t)=P(U>t)=1-\Phi(t)$，超過 $t$ 的右尾面積。例如 $Q_1(1)\approx 0.1587$。在 $\rho=0$ 時，$Q=Q_1(x)Q_1(y)$。
補誤差函數（$\operatorname{erfc}$）: 與常態尾相關的特殊函數，由 $Q_1(t)=\tfrac{1}{2}\operatorname{erfc}\!\left(t/\sqrt{2}\right)$ 給出。它提供了一種在數值上穩定的方式來計算用於 $Q$ 的單變量尾概率。
高斯-勒讓德正交法: 一種數值積分方案，通過在最優選擇的節點處的被積函數的加權和來近似定積分。由於 $Q(x,y;\rho)$ 沒有基本閉形式，它通常通過對密度（或 $\rho$ 的函數）用此方法積分來計算，以獲得準確結果。