Что вычисляет этот калькулятор
Инструмент работает со стандартным двумерным нормальным распределением — это двумерное распределение Гаусса с нулевыми средними, единичными дисперсиями по обеим осям и единственным свободным параметром: коэффициентом корреляции ρ. Для заданной точки (x, y) калькулятор возвращает два числа: значение совместной плотности вероятности \(f(x, y, \rho)\) в этой точке и кумулятивную вероятность верхнего хвоста (вероятность ортанта) \(Q(x, y, \rho) = P(U_1 > x \text{ И } U_2 > y)\). Поскольку все входные данные уже представляют собой стандартизованные безразмерные величины, калькулятор универсален и не требует перевода единиц измерения.
Как пользоваться
Введите координату x, координату y и коэффициент корреляции ρ. Под «процентильной точкой» здесь понимается стандартизованный порог, аналогичный z-значению (то есть координата), а не процентиль из диапазона 0–1. Корреляция должна удовлетворять условию \(-1 < \rho < 1\); значения \(\pm 1\) не принимаются, потому что плотность становится вырожденной (деление на ноль в \(\sqrt{1-\rho^{2}}\)).
Разбор формул
Плотность задаётся гауссовой формулой в замкнутом виде, показанной выше:
$$\varphi(x,y;\rho) = \frac{1}{2\pi\sqrt{1-\rho^{2}}}\,\exp\!\left(-\frac{x^{2}-2\rho\,x\,y+y^{2}}{2\left(1-\rho^{2}\right)}\right)$$Для вероятности ортанта используется тождество Шеппарда: при \(\rho = 0\) переменные независимы, и тогда \(Q = Q_1(x)\cdot Q_1(y)\), где \(Q_1(t)\) — одномерная функция верхнего хвоста стандартного нормального распределения. При ненулевом ρ добавляется поправочный интеграл от 0 до ρ, который здесь вычисляется методом квадратур Гаусса—Лежандра с 24 узлами для высокой точности.
$$\begin{gathered} Q(x,y;\rho) = Q_1(x)\,Q_1(y) + \frac{1}{2\pi}\int_{0}^{\rho}\frac{\exp\!\left(-\dfrac{x^{2}-2r\,x\,y+y^{2}}{2(1-r^{2})}\right)}{\sqrt{1-r^{2}}}\,dr \\[1.5em] \text{where}\quad \left\{ \begin{aligned} x &= \text{Percentile point x} \\ y &= \text{Percentile point y} \\ \rho &= \text{Correlation }\rho \\ Q_1(t) &= \tfrac{1}{2}\,\operatorname{erfc}\!\left(\tfrac{t}{\sqrt{2}}\right) \end{aligned} \right. \end{gathered}$$
Разбор примера
Пусть \(x = 2\), \(y = 0{,}7\), \(\rho = 0{,}8\): \(1 - \rho^{2} = 0{,}36\), \(\sqrt{\phantom{x}} = 0{,}6\), множитель перед экспонентой \(= 1/(2\pi\cdot 0{,}6) = 0{,}265258\). Числитель показателя экспоненты \(= 4 - 2\cdot 0{,}8\cdot 2\cdot 0{,}7 + 0{,}49 = 2{,}25\), делённый на \(0{,}72\) даёт \(3{,}125\). Тогда \(f = 0{,}265258 \cdot e^{-3{,}125} \approx 0{,}011655\). Вероятность верхнего хвоста \(Q \approx 0{,}0212\) — это больше, чем значение при независимости \(0{,}0055\), поскольку положительная корреляция «тянет» обе переменные вверх одновременно.
Частые вопросы
Почему ρ не может быть равна ровно 1? При \(\rho = \pm 1\) переменные полностью зависимы, и распределение «схлопывается» на прямую линию; вне этой линии плотность не имеет конечного значения.
Что означает Q? Это вероятностная масса в правом верхнем «ортанте» за обоими порогами: \(P(U_1 > x, U_2 > y)\).
Что происходит при больших x или y? Плотность убывает к 0, а Q стремится к 0, поскольку вероятность того, что обе стандартизованные переменные превысят большие положительные пороги, становится всё меньше.
Как корреляция изменяет ортантную вероятность
Ортантная вероятность \(Q(x,y;\rho)=P(U_1>x,\,U_2>y)\) измеряет вероятность того, что две стандартные нормальные случайные величины одновременно превысят свои пороги. Фиксируя пороговые значения на уровне \(x=1\) и \(y=1\) и варьируя корреляцию \(\rho\), мы изолируем чистый эффект зависимости. При \(\rho=0\) переменные независимы и \(Q\) разлагается на произведение двух одномерных хвостов, \(Q_1(x)\,Q_1(y)\). Для стандартного нормального распределения \(Q_1(1)=P(U>1)\approx 0.158655\), поэтому ориентир независимости составляет \(0.158655^2\approx 0.025172\).
| \(\rho\) | Плотность \(f(1,1;\rho)\) | Ортанта \(Q(1,1;\rho)\) | Независимость \(Q_1(1)Q_1(1)\) |
|---|---|---|---|
| \(-0.8\) | 0.0476 | 0.0049 | 0.0252 |
| \(-0.4\) | 0.0780 | 0.0145 | 0.0252 |
| \(0\) | 0.0585 | 0.0252 | 0.0252 |
| \(0.4\) | 0.1063 | 0.0438 | 0.0252 |
| \(0.8\) | 0.2643 | 0.0826 | 0.0252 |
Паттерн монотонный: положительная корреляция делает совместное превышение более вероятным (большие значения имеют тенденцию возникать вместе), поэтому \(Q\) возрастает выше значения независимости; отрицательная корреляция тянет две переменные в противоположные направления, поэтому совместное превышение становится более редким и \(Q\) падает ниже \(Q_1 Q_1\). При \(\rho=0\) ортантная вероятность в точности равна произведению \(0.0252\), что подтверждает факторизацию независимости.
Интерпретация плотности и ортантной вероятности
Плотность \(f\) — это не вероятность. Значение \(\varphi(x,y;\rho)\) — это вероятностная плотность на единицу площади в плоскости \((x,y)\); только её интеграл по области дает вероятность. Поверхность достигает максимума в начале координат \((0,0)\), где экспоненциальный множитель равен 1 и
$$f(0,0;\rho)=\frac{1}{2\pi\sqrt{1-\rho^{2}}}.$$При \(\rho=0\) этот пик составляет \(1/(2\pi)\approx 0.159\), что удобно ниже 1. По мере того как \(\rho\to\pm 1\) множитель \(1/\sqrt{1-\rho^2}\) расходится, поэтому пиковая плотность может превысить 1 — это нормально для плотности, поскольку она концентрирует вероятностную массу на линии \(y=\rho x\).
Ортантная вероятность \(Q\) — это истинная вероятность и всегда лежит в \([0,1]\). Это объём под поверхностью плотности над квадрантом \(\{U_1>x,\,U_2>y\}\). Полезные структурные свойства:
- Независимость (\(\rho=0\)): \(Q(x,y;0)=Q_1(x)\,Q_1(y)\), произведение двух одномерных верхних хвостов.
- Симметрия по аргументам: путём перестановки ролей двух координат \(Q(x,y;\rho)=Q(y,x;\rho)\).
- Тождество отражения: \(Q(-x,-y;\rho)=Q(x,y;\rho)+ \Phi(-x)+\Phi(-y)-1\) (эквивалентно выразимо через двумерную функцию распределения), и обращение знака одного аргумента переворачивает эффективную корреляцию: \(P(U_1>x,\,U_2
- Предельное поведение \(\rho\to 1^{-}\): переменные становятся идеально комонотонными, \(U_2\approx U_1\), так что \(Q(x,y;\rho)\to Q_1(\max(x,y))\) — оба превышения совпадают.
- Предельное поведение \(\rho\to -1^{+}\): переменные становятся идеально контрмонотонными, \(U_2\approx -U_1\). Совместное верхнее превышение тогда возможно только когда оба пороговых значения могут быть одновременно превышены, давая \(Q\to\max\!\big(0,\;1-\Phi(x)-\Phi(y)\big)\), что равно 0 всякий раз, когда \(x+y\ge 0\).
Поскольку для \(Q\) с общим \(\rho\) нет замкнутой формы, она вычисляется численно — обычно через T-функцию Оуэна или одномерный интеграл по \(\rho\) с использованием квадратуры Гаусса–Лежандра, оба метода воспроизводят значения из сравнительной таблицы с высокой точностью.
Определения и глоссарий
- Стандартизированный коэффициент (\(x\), \(y\))
- z-подобная координата, измеряющая, на сколько стандартных отклонений значение отстоит от своего среднего. Входные значения \(x\) и \(y\) уже стандартизированы, поэтому каждое маргинально следует стандартному нормальному распределению \(N(0,1)\).
- Коэффициент корреляции \(\rho\)
- Линейная (пирсоновская) корреляция между двумя стандартными нормальными переменными с \(-1<\rho<1\). Это единственный параметр, управляющий тем, насколько сильно две координаты движутся вместе; \(\rho=0\) означает независимость здесь, в то время как \(\rho\to\pm1\) означает почти детерминированное линейное отношение. Наблюдаемое \(\rho\) может быть оценено из парных данных с помощью калькулятора пирсоновской корреляции.
- Совместная плотность \(f(x,y;\rho)\)
- Стандартная двумерная нормальная вероятностная плотность, \(\varphi(x,y;\rho)=\dfrac{1}{2\pi\sqrt{1-\rho^2}}\exp\!\left(-\dfrac{x^2-2\rho xy+y^2}{2(1-\rho^2)}\right)\). Она описывает вероятность на единицу площади, а не саму вероятность.
- Ортантная вероятность \(Q(x,y;\rho)\)
- Верхняя совместная хвостовая вероятность \(P(U_1>x,\,U_2>y)\) — объём под поверхностью плотности над верхним-правым квадрантом, определённым двумя пороговыми значениями. Всегда между 0 и 1.
- Одномерный верхний хвост \(Q_1(t)\)
- Функция выживания стандартного нормального распределения \(Q_1(t)=P(U>t)=1-\Phi(t)\), площадь в правом хвосте за пределами \(t\). Например \(Q_1(1)\approx 0.1587\). При \(\rho=0\), \(Q=Q_1(x)Q_1(y)\).
- Дополнительная функция ошибок (\(\operatorname{erfc}\))
- Специальная функция, связанная с нормальным хвостом соотношением \(Q_1(t)=\tfrac{1}{2}\operatorname{erfc}\!\left(t/\sqrt{2}\right)\). Она обеспечивает численно устойчивый способ вычисления одномерных хвостовых вероятностей, используемых в \(Q\).
- Квадратура Гаусса–Лежандра
- Схема численного интегрирования, которая аппроксимирует определённый интеграл взвешенной суммой подынтегральной функции в оптимально выбранных узлах. Поскольку \(Q(x,y;\rho)\) не имеет элементарной замкнутой формы, она обычно вычисляется путём интегрирования плотности (или функции от \(\rho\)) этим методом для получения точных результатов.