この計算ツールでできること
このツールは2次元標準正規分布(平均ゼロ、両軸とも分散1の二次元ガウス分布)を計算します。自由なパラメータは相関係数 \(\rho\) ただ一つです。点 \((x, y)\) を入力すると、2つの値が得られます。1つはその点における同時確率密度 \(f(x, y, \rho)\)、もう1つは上側累積確率(オーサント確率)\(Q(x, y, \rho) = P(U_1 > x \text{ かつ } U_2 > y)\) です。入力値はすべて標準化された無次元のスコアなので、このツールは単位換算を必要とせず、どんな場面にも汎用的に使えます。
使い方
パーセント点 x、パーセント点 y、相関係数 \(\rho\) を入力します。ここでいう「パーセント点」とは、0〜1のパーセンタイルではなく、z値のように標準化されたしきい値(座標)を指します。相関係数は \(-1 < \rho < 1\) を満たす必要があります。\(\pm 1\) は受け付けられません。\(\sqrt{1-\rho^{2}}\) がゼロとなり、確率密度が発散してしまうためです。
計算式の解説
確率密度は上に示した閉じた形のガウス関数で求められます。 $$\varphi(x,y;\rho) = \frac{1}{2\pi\sqrt{1-\rho^{2}}}\,\exp\!\left(-\frac{x^{2}-2\rho\,x\,y+y^{2}}{2\left(1-\rho^{2}\right)}\right)$$ 上側確率にはシェパードの公式(Sheppardの恒等式)を用います。\(\rho = 0\) のときは2変数が独立となり、\(Q = Q_1(x)\cdot Q_1(y)\) と書けます。ここで \(Q_1(t)\) は1変数の標準正規分布の上側確率関数です。\(\rho\) が0でない場合は、0 から \(\rho\) までの補正積分を加えます。 $$\begin{gathered} Q(x,y;\rho) = Q_1(x)\,Q_1(y) + \frac{1}{2\pi}\int_{0}^{\rho}\frac{\exp\!\left(-\dfrac{x^{2}-2r\,x\,y+y^{2}}{2(1-r^{2})}\right)}{\sqrt{1-r^{2}}}\,dr \\[1.5em] \text{where}\quad \left\{ \begin{aligned} x &= \text{Percentile point x} \\ y &= \text{Percentile point y} \\ \rho &= \text{Correlation }\rho \\ Q_1(t) &= \tfrac{1}{2}\,\operatorname{erfc}\!\left(\tfrac{t}{\sqrt{2}}\right) \end{aligned} \right. \end{gathered}$$ 本ツールでは精度を高めるため、24点ガウス・ルジャンドル求積法でこの積分を評価しています。
計算例
\(x = 2\)、\(y = 0.7\)、\(\rho = 0.8\) の場合:\(1 - \rho^{2} = 0.36\)、その平方根は \(0.6\)、係数 \(= 1/(2\pi\cdot 0.6) = 0.265258\) となります。指数部の分子は \(4 - 2\cdot 0.8\cdot 2\cdot 0.7 + 0.49 = 2.25\)、これを \(0.72\) で割ると \(3.125\)。したがって \(f = 0.265258 \cdot e^{-3.125} \approx 0.011655\) です。上側確率は \(Q \approx 0.0212\) となり、独立の場合の値 \(0.0055\) より大きくなります。これは正の相関によって2つの変数が一緒に大きくなる傾向があるためです。
相関がオーランティスト確率に与える影響
オーランティスト確率 \(Q(x,y;\rho)=P(U_1>x,\,U_2>y)\) は、2つの標準正規変数が同時にそれぞれの閾値を超える確率を測定します。カットポイントを \(x=1\) と \(y=1\) に固定し、相関係数 \(\rho\) を変化させることで、依存関係の純粋な影響を分離できます。\(\rho=0\) のとき、変数は独立であり、\(Q\) は2つの一変量上側尾部の積 \(Q_1(x)\,Q_1(y)\) に分解されます。標準正規分布の場合、\(Q_1(1)=P(U>1)\approx 0.158655\) なので、独立性の基準値は \(0.158655^2 \approx 0.025172\) です。
| \(\rho\) | 密度 \(f(1,1;\rho)\) | オーランティスト \(Q(1,1;\rho)\) | 独立性 \(Q_1(1)Q_1(1)\) |
|---|---|---|---|
| \(-0.8\) | 0.0476 | 0.0049 | 0.0252 |
| \(-0.4\) | 0.0780 | 0.0145 | 0.0252 |
| \(0\) | 0.0585 | 0.0252 | 0.0252 |
| \(0.4\) | 0.1063 | 0.0438 | 0.0252 |
| \(0.8\) | 0.2643 | 0.0826 | 0.0252 |
パターンは単調です。正の相関は結合超過をより可能性が高くします(大きな値は一緒に起こりやすい)ため、\(Q\) は独立性の値より上昇します。負の相関は2つの変数を反対方向に引き、結合超過がまれになるため \(Q\) は \(Q_1 Q_1\) より下降します。\(\rho=0\) のとき、オーランティスト確率は正確に \(0.0252\) に等しく、独立性の分解を確認します。
密度とオーランティスト確率の解釈
密度 \(f\) は確率ではありません。 値 \(\varphi(x,y;\rho)\) は \((x,y)\) 平面の単位面積当たりの確率密度です。その領域にわたる積分のみが確率を返します。曲面はその最大値を原点 \((0,0)\) で達成し、ここで指数項は1に等しく、
$$f(0,0;\rho)=\frac{1}{2\pi\sqrt{1-\rho^{2}}}.$$\(\rho=0\) の場合、このピークは \(1/(2\pi)\approx 0.159\) で、快適に1より下です。\(\rho\to\pm 1\) のとき、係数 \(1/\sqrt{1-\rho^2}\) は発散し、ピーク密度は1を超えることができます。これは密度にとって正常です。密度が確率質量を直線 \(y=\rho x\) に集中させるため。
オーランティスト確率 \(Q\) は真正な確率であり、常に \([0,1]\) にあります。それは象限 \(\{U_1>x,\,U_2>y\}\) に対する密度曲面の下の体積です。有用な構造的な事実:
- 独立性(\(\rho=0\)): \(Q(x,y;0)=Q_1(x)\,Q_1(y)\)、2つの一変量上側尾部の積。
- 引数における対称性: 2つの座標の役割を入れ替えることで、\(Q(x,y;\rho)=Q(y,x;\rho)\)。
- 反射恒等式: \(Q(-x,-y;\rho)=Q(x,y;\rho)+ \Phi(-x)+\Phi(-y)-1\)(二変量分布関数を通じて同等に表現可能)、引数の1つの符号を反転することは有効相関を反転します。\(P(U_1>x,\,U_2
- 極限動作 \(\rho\to 1^{-}\): 変数は完全共単調になり、\(U_2\approx U_1\)、したがって \(Q(x,y;\rho)\to Q_1(\max(x,y))\)。両方の超過が一致します。
- 極限動作 \(\rho\to -1^{+}\): 変数は完全反単調になり、\(U_2\approx -U_1\)。結合上側超過は両方の閾値が同時にクリアされるとき可能であり、\(Q\to\max\!\big(0,\;1-\Phi(x)-\Phi(y)\big)\) を与え、\(x+y\ge 0\) のとき0です。
一般 \(\rho\) に対して \(Q\) に対する閉形式がないため、それは数値的に評価されます。通常、Owen's T関数またはGauss–Legendre求積を使用した \(\rho\) に対する一次元積分を通じて、両方とも比較表に示される値を高精度で再現します。
定義と用語集
- 標準化スコア(\(x\)、\(y\))
- 値がその平均からどれだけ標準偏差だけ離れているかを測定するz様の座標。入力 \(x\) と \(y\) は既に標準化されているため、各周辺分布は標準正規分布 \(N(0,1)\) に従います。
- 相関係数 \(\rho\)
- 2つの標準正規変数間の線形(ピアソン)相関であり、\(-1<\rho<1\) です。それは2つの座標がどの程度強く一緒に動くかを支配する単一のパラメータです。\(\rho=0\) はここでは独立性を意味し、\(\rho\to\pm1\) は準決定論的な線形関係を意味します。観測された \(\rho\) はペアデータから Pearson相関計算機で推定できます。
- 結合密度 \(f(x,y;\rho)\)
- 標準二変量正規確率密度、\(\varphi(x,y;\rho)=\dfrac{1}{2\pi\sqrt{1-\rho^2}}\exp\!\left(-\dfrac{x^2-2\rho xy+y^2}{2(1-\rho^2)}\right)\)。それは単位面積当たりの確率を記述し、確率そのものではありません。
- オーランティスト確率 \(Q(x,y;\rho)\)
- 上側尾結合確率 \(P(U_1>x,\,U_2>y)\)。2つの閾値で定義される右上象限に対する密度曲面の下の体積。常に0から1の間。
- 一変量上側尾部 \(Q_1(t)\)
- 標準正規生存関数 \(Q_1(t)=P(U>t)=1-\Phi(t)\)、\(t\) を超える右尾の面積。例えば \(Q_1(1)\approx 0.1587\)。\(\rho=0\) のとき、\(Q=Q_1(x)Q_1(y)\)。
- 相補誤差関数(\(\operatorname{erfc}\))
- 正規尾部に関連する特殊関数 \(Q_1(t)=\tfrac{1}{2}\operatorname{erfc}\!\left(t/\sqrt{2}\right)\)。それは \(Q\) で使用される一変量尾部確率を計算するための数値的に安定した方法を提供します。
- Gauss–Legendre求積
- 定積分を最適に選択されたノードで被積分関数の加重和によって近似する数値積分スキーム。\(Q(x,y;\rho)\) は基本閉形式がないため、一般的に密度(または \(\rho\) の関数)を統合してこの方法で評価され、正確な結果を得ます。
よくある質問
なぜ \(\rho\) をちょうど1にできないのですか? \(\rho = \pm 1\) では2変数が完全に従属し、分布が1本の直線上に集約してしまいます。この直線から外れた点では、確率密度に有限の値が存在しません。
Q は何を表していますか? 両方のしきい値を超える右上の「オーサント(象限)」に含まれる確率、すなわち \(P(U_1 > x, U_2 > y)\) を表します。
x や y が大きいとどうなりますか? 確率密度は0に向かって減衰し、Q も0に近づきます。標準化された2つの変数がともに大きな正のしきい値を超える可能性は、しきい値が大きくなるほど低くなるためです。