透過 MCP 連接 →

輸入計算

數學公式

數學公式: 標準二元常態分配計算器
Show calculation steps (1)
  1. Upper Orthant Probability

    Upper Orthant Probability: 標準二元常態分配計算器

    Q1(t) = 0.5 erfc(t / sqrt(2)) is the univariate upper tail; the integral term vanishes when rho = 0

廣告

結果

Probability density f(x, y, ρ)
0.011654633617
點 (x, y) 處的聯合機率密度值
Upper cumulative probability Q(x, y, ρ) 0.022035922476
意義 P(U1 > x and U2 > y)

這個計算器的用途

本工具用來計算標準二元常態分配,也就是一個二維高斯分配:兩軸的平均數皆為 0、變異數皆為 1,並且只有一個可調參數——相關係數 ρ。給定一個點 (x, y),計算器會回傳兩個數值:該點的聯合機率密度 \(f(x, y, \rho)\),以及上尾(象限)累積機率 \(Q(x, y, \rho) = P(U_1 > x \text{ 且 } U_2 > y)\)。由於所有輸入都已經是標準化、無單位的分數,這個計算器具有通用性,完全不需要做單位換算。

x-y 平面上二元常態密度的三維鐘形曲面
聯合密度 \(f(x,y)\) 在 x-y 平面上形成鐘形曲面。

使用方式

輸入分位點 x、分位點 y,以及相關係數 ρ。這裡所說的「分位點」指的是類似 z 值的標準化門檻(也就是一個座標值),而不是介於 0 到 1 之間的百分位。相關係數必須滿足 \(-1 < \rho < 1\);\(\pm 1\) 這兩個值會被拒絕,因為此時密度會發散(\(\sqrt{1-\rho^2}\) 會出現除以零的情況)。

公式解析

密度函數即上方所列的封閉形式高斯公式:

$$\varphi(x,y;\rho) = \frac{1}{2\pi\sqrt{1-\rho^{2}}}\,\exp\!\left(-\frac{x^{2}-2\rho\,x\,y+y^{2}}{2\left(1-\rho^{2}\right)}\right)$$

象限機率則採用 Sheppard 恆等式:當 \(\rho = 0\) 時,兩變數彼此獨立,此時 \(Q = Q_1(x)\cdot Q_1(y)\),其中 \(Q_1(t)\) 是單變量標準常態的上尾函數。當 \(\rho\) 不為零時,則需加上一個從 0 到 \(\rho\) 的修正積分,本計算器以 24 節點的 Gauss–Legendre 高斯求積法進行運算,以確保精度。

$$\begin{gathered} Q(x,y;\rho) = Q_1(x)\,Q_1(y) + \frac{1}{2\pi}\int_{0}^{\rho}\frac{\exp\!\left(-\dfrac{x^{2}-2r\,x\,y+y^{2}}{2(1-r^{2})}\right)}{\sqrt{1-r^{2}}}\,dr \\[1.5em] \text{where}\quad \left\{ \begin{aligned} x &= \text{Percentile point x} \\ y &= \text{Percentile point y} \\ \rho &= \text{Correlation }\rho \\ Q_1(t) &= \tfrac{1}{2}\,\operatorname{erfc}\!\left(\tfrac{t}{\sqrt{2}}\right) \end{aligned} \right. \end{gathered}$$
Advertisement
三幅等高線圖,展示不同相關係數下的圓形、正向傾斜與負向傾斜橢圓
密度的橢圓等高線隨相關係數 rho 旋轉:rho=0 時為圓形,rho 為正或負時傾斜。

實例演算

以 \(x = 2\)、\(y = 0.7\)、\(\rho = 0.8\) 為例:\(1 - \rho^2 = 0.36\),開根號後 \(= 0.6\),前置係數 \(= 1/(2\pi\cdot 0.6) = 0.265258\)。指數分子 \(= 4 - 2\cdot 0.8\cdot 2\cdot 0.7 + 0.49 = 2.25\),除以 \(0.72\) 得 \(3.125\)。因此 \(f = 0.265258 \cdot e^{-3.125} \approx 0.011655\)。上尾機率 \(Q \approx 0.0212\)——比獨立情況下的 0.0055 還高,因為正相關會讓兩個變數一起往上移動。

相關性如何改變象限概率

象限概率 \(Q(x,y;\rho)=P(U_1>x,\,U_2>y)\) 衡量兩個標準常態隨機變數同時超過其臨界值的機率。固定切點於 \(x=1\) 和 \(y=1\),掃過相關性 \(\rho\) 可以隔離依賴性的純粹效應。當 \(\rho=0\) 時,變數是獨立的,\(Q\) 分解為兩個單變量上尾的乘積,\(Q_1(x)\,Q_1(y)\)。對於標準常態,\(Q_1(1)=P(U>1)\approx 0.158655\),因此獨立基準線是 \(0.158655^2\approx 0.025172\)。

\(\rho\) 密度 \(f(1,1;\rho)\) 象限 \(Q(1,1;\rho)\) 獨立性 \(Q_1(1)Q_1(1)\)
\(-0.8\) 0.0476 0.0049 0.0252
\(-0.4\) 0.0780 0.0145 0.0252
\(0\) 0.0585 0.0252 0.0252
\(0.4\) 0.1063 0.0438 0.0252
\(0.8\) 0.2643 0.0826 0.0252

模式是單調的:正相關使聯合超越更可能發生(大值傾向於同時出現),因此 \(Q\) 上升到超過獨立值;負相關將兩個變數拉向相反方向,因此聯合超越變得更加罕見,\(Q\) 下降到 \(Q_1 Q_1\) 以下。在 \(\rho=0\) 時,象限概率恰好等於乘積 \(0.0252\),確認了獨立性分解。

解釋密度和象限概率

密度 \(f\) 不是概率。\(f(x,y;\rho)\) 的值是每單位面積在 \((x,y)\) 平面中的概率密度;只有對某一區域的積分才能返回概率。曲面在原點 \((0,0)\) 處達到最大值,其中指數項等於 1,並且

$$f(0,0;\rho)=\frac{1}{2\pi\sqrt{1-\rho^{2}}}。$$

對於 \(\rho=0\),此峰值為 \(1/(2\pi)\approx 0.159\),遠小於 1。當 \(\rho\to\pm 1\) 時,因子 \(1/\sqrt{1-\rho^2}\) 發散,因此峰值密度可以超過 1——這對密度來說是正常的,因為它將概率質量集中在直線 \(y=\rho x\) 上。

象限概率 \(Q\) 是真正的概率,始終位於 \([0,1]\) 內。它是密度曲面在象限 \(\{U_1>x,\,U_2>y\}\) 上方的體積。有用的結構性事實:

  • 獨立性(\(\rho=0\)):\(Q(x,y;0)=Q_1(x)\,Q_1(y)\),兩個單變量上尾的乘積。
  • 參數對稱性:通過交換兩個坐標的角色,\(Q(x,y;\rho)=Q(y,x;\rho)\)。
  • 反射恆等式:\(Q(-x,-y;\rho)=Q(x,y;\rho)+ \Phi(-x)+\Phi(-y)-1\)(也可以通過雙變量累積分布函數表示),並且反轉一個參數的符號會翻轉有效相關性:\(P(U_1>x,\,U_2
  • 極限行為 \(\rho\to 1^{-}\):變數變得完全同調,\(U_2\approx U_1\),因此 \(Q(x,y;\rho)\to Q_1(\max(x,y))\)——兩個超越同時發生。
  • 極限行為 \(\rho\to -1^{+}\):變數變得完全反調,\(U_2\approx -U_1\)。聯合上超越只有在兩個臨界值都能同時突破時才可能,給出 \(Q\to\max\!\big(0,\;1-\Phi(x)-\Phi(y)\big)\),當 \(x+y\ge 0\) 時為 0。

由於 \(Q\) 沒有一般 \(\rho\) 的閉形式,它通過數值方法計算——通常通過 Owen 的 T 函數或使用高斯-勒讓德正交法的關於 \(\rho\) 的一維積分,兩者都能將比較表中顯示的值重現到高精度。

Advertisement

定義及詞彙表

標準化分數(\(x\)、\(y\))
一個類似 z 的坐標,衡量一個值距其均值多少個標準差。輸入 \(x\) 和 \(y\) 已經標準化,因此每個邊際上都遵循標準常態分布 \(N(0,1)\)。
相關係數 \(\rho\)
兩個標準常態隨機變數之間的線性(皮爾遜)相關,其中 \(-1<\rho<1\)。它是控制兩個坐標如何強烈一起移動的單一參數;\(\rho=0\) 表示此處獨立,而 \(\rho\to\pm1\) 表示近似確定性線性關係。觀察到的 \(\rho\) 可以通過皮爾遜相關計算器從配對數據估計。
聯合密度 \(f(x,y;\rho)\)
標準雙變量常態概率密度,\(\varphi(x,y;\rho)=\dfrac{1}{2\pi\sqrt{1-\rho^2}}\exp\!\left(-\dfrac{x^2-2\rho xy+y^2}{2(1-\rho^2)}\right)\)。它描述每單位面積的概率,而不是概率本身。
象限概率 \(Q(x,y;\rho)\)
上尾聯合概率 \(P(U_1>x,\,U_2>y)\)——密度曲面在由兩個臨界值定義的右上象限上方的體積。始終在 0 和 1 之間。
單變量上尾 \(Q_1(t)\)
標準常態生存函數 \(Q_1(t)=P(U>t)=1-\Phi(t)\),超過 \(t\) 的右尾面積。例如 \(Q_1(1)\approx 0.1587\)。在 \(\rho=0\) 時,\(Q=Q_1(x)Q_1(y)\)。
補誤差函數(\(\operatorname{erfc}\))
與常態尾相關的特殊函數,由 \(Q_1(t)=\tfrac{1}{2}\operatorname{erfc}\!\left(t/\sqrt{2}\right)\) 給出。它提供了一種在數值上穩定的方式來計算用於 \(Q\) 的單變量尾概率。
高斯-勒讓德正交法
一種數值積分方案,通過在最優選擇的節點處的被積函數的加權和來近似定積分。由於 \(Q(x,y;\rho)\) 沒有基本閉形式,它通常通過對密度(或 \(\rho\) 的函數)用此方法積分來計算,以獲得準確結果。

常見問題

為什麼 ρ 不能剛好等於 1?當 \(\rho = \pm 1\) 時,兩個變數呈完全相依,整個分配會塌縮到一條直線上;除了該直線以外,密度都沒有有限值。

Q 代表什麼意思?它是落在右上方「象限」內、同時超過兩個門檻的機率質量:\(P(U_1 > x, U_2 > y)\)。

當 x 或 y 很大時會發生什麼?密度會逐漸趨近於 0,Q 也會趨近於 0,因為兩個標準化變數同時超過很大的正門檻,機率會越來越低。

最後更新: