Công cụ này làm gì
Công cụ này tính toán cho phân phối chuẩn hai biến chuẩn hóa — một phân phối Gauss hai chiều với kỳ vọng bằng 0, phương sai bằng 1 trên cả hai trục, và chỉ có duy nhất một tham số tự do là hệ số tương quan \(\rho\). Với một điểm \((x, y)\) bất kỳ, công cụ trả về hai giá trị: mật độ xác suất đồng thời \(f(x, y, \rho)\) tại điểm đó, và xác suất tích lũy đuôi trên (orthant) \(Q(x, y, \rho) = P(U_1 > x \text{ VÀ } U_2 > y)\). Vì mọi đầu vào đều là điểm số đã được chuẩn hóa và không có thứ nguyên, máy tính này mang tính phổ quát và không cần đổi đơn vị.
Cách sử dụng
Nhập điểm phân vị x, điểm phân vị y và hệ số tương quan \(\rho\). Ở đây, "điểm phân vị" có nghĩa là một ngưỡng chuẩn hóa kiểu giá trị z (một tọa độ), chứ không phải phân vị nằm trong khoảng 0–1. Hệ số tương quan phải thỏa \(-1 < \rho < 1\); các giá trị \(\pm 1\) sẽ bị từ chối vì khi đó mật độ trở nên kỳ dị (chia cho 0 trong biểu thức \(\sqrt{1-\rho^{2}}\)).
Giải thích các công thức
Mật độ chính là công thức Gauss dạng đóng đã nêu ở trên:
$$\varphi(x,y;\rho) = \frac{1}{2\pi\sqrt{1-\rho^{2}}}\,\exp\!\left(-\frac{x^{2}-2\rho\,x\,y+y^{2}}{2\left(1-\rho^{2}\right)}\right)$$Xác suất orthant sử dụng đồng nhất thức Sheppard: khi \(\rho = 0\), hai biến độc lập và \(Q = Q_1(x)\cdot Q_1(y)\), trong đó \(Q_1(t)\) là hàm đuôi trên của phân phối chuẩn một biến. Với \(\rho\) khác 0, ta cộng thêm một tích phân hiệu chỉnh chạy từ 0 đến \(\rho\), được tính ở đây bằng phép cầu phương Gauss–Legendre 24 nút để đảm bảo độ chính xác.
$$\begin{gathered} Q(x,y;\rho) = Q_1(x)\,Q_1(y) + \frac{1}{2\pi}\int_{0}^{\rho}\frac{\exp\!\left(-\dfrac{x^{2}-2r\,x\,y+y^{2}}{2(1-r^{2})}\right)}{\sqrt{1-r^{2}}}\,dr \\[1.5em] \text{where}\quad \left\{ \begin{aligned} x &= \text{Percentile point x} \\ y &= \text{Percentile point y} \\ \rho &= \text{Correlation }\rho \\ Q_1(t) &= \tfrac{1}{2}\,\operatorname{erfc}\!\left(\tfrac{t}{\sqrt{2}}\right) \end{aligned} \right. \end{gathered}$$
Ví dụ minh họa
Với \(x = 2\), \(y = 0.7\), \(\rho = 0.8\): \(1 - \rho^{2} = 0.36\), \(\sqrt{} = 0.6\), hệ số đứng trước \(= 1/(2\pi\cdot 0.6) = 0.265258\). Tử số của số mũ \(= 4 - 2\cdot 0.8\cdot 2\cdot 0.7 + 0.49 = 2.25\), chia cho \(0.72\) được \(3.125\). Vậy \(f = 0.265258 \cdot e^{-3.125} \approx 0.011655\). Xác suất đuôi trên \(Q \approx 0.0212\) — cao hơn giá trị khi độc lập là \(0.0055\), bởi vì tương quan dương khiến cả hai biến cùng tăng lên đồng thời.
Mối tương quan thay đổi xác suất trực giao như thế nào
Xác suất trực giao \(Q(x,y;\rho)=P(U_1>x,\,U_2>y)\) đo lường khả năng hai biến chuẩn \(đồng thời\) vượt quá ngưỡng của chúng. Giữ cố định các điểm cắt tại \(x=1\) và \(y=1\) và quét mối tương quan \(\rho\) làm nổi bật tác động thuần túy của phụ thuộc. Khi \(\rho=0\) các biến là độc lập và \(Q\) được chia thành tích của hai đuôi trên đơn biến, \(Q_1(x)\,Q_1(y)\). Đối với phân bố chuẩn, \(Q_1(1)=P(U>1)\approx 0.158655\), vì vậy điểm chuẩn độc lập là \(0.158655^2\approx 0.025172\).
| \(\rho\) | Mật độ \(f(1,1;\rho)\) | Trực giao \(Q(1,1;\rho)\) | Độc lập \(Q_1(1)Q_1(1)\) |
|---|---|---|---|
| \(-0.8\) | 0.0476 | 0.0049 | 0.0252 |
| \(-0.4\) | 0.0780 | 0.0145 | 0.0252 |
| \(0\) | 0.0585 | 0.0252 | 0.0252 |
| \(0.4\) | 0.1063 | 0.0438 | 0.0252 |
| \(0.8\) | 0.2643 | 0.0826 | 0.0252 |
Mô hình này là đơn điệu: mối tương quan dương làm cho sự vượt quá chung trở nên khả dĩ hơn (các giá trị lớn có xu hướng xảy ra cùng nhau), vì vậy \(Q\) tăng lên trên giá trị độc lập; mối tương quan âm kéo hai biến theo hướng đối diện, vì vậy sự vượt quá chung trở nên hiếm hơn và \(Q\) giảm xuống dưới \(Q_1 Q_1\). Tại \(\rho=0\) xác suất trực giao chính xác bằng tích \(0.0252\), xác nhận phân tích nhân tử độc lập.
Diễn giải mật độ và xác suất trực giao
Mật độ \(f\) không phải là xác suất. Giá trị \(\varphi(x,y;\rho)\) là mật độ xác suất trên một đơn vị diện tích trong mặt phẳng \((x,y)\); chỉ tích phân của nó trên một miền mới trả về xác suất. Bề mặt đạt cực đại tại gốc \((0,0)\), nơi số hạng mũ bằng 1 và
$$f(0,0;\rho)=\frac{1}{2\pi\sqrt{1-\rho^{2}}}.$$Đối với \(\rho=0\) đỉnh này là \(1/(2\pi)\approx 0.159\), thoải mái dưới 1. Khi \(\rho\to\pm 1\) hệ số \(1/\sqrt{1-\rho^2}\) phân kỳ, vì vậy mật độ đỉnh có thể vượt quá 1 — điều đó là bình thường đối với một mật độ, vì nó tập trung khối lượng xác suất lên đường thẳng \(y=\rho x\).
Xác suất trực giao \(Q\) là xác suất thực sự và luôn nằm trong \([0,1]\). Đó là thể tích dưới bề mặt mật độ trên góc phần tư \(\{U_1>x,\,U_2>y\}\). Các sự kiện cấu trúc hữu ích:
- Độc lập (\(\rho=0\)): \(Q(x,y;0)=Q_1(x)\,Q_1(y)\), tích của hai đuôi trên đơn biến.
- Đối xứng trong các đối số: bằng cách trao đổi vai trò của hai tọa độ, \(Q(x,y;\rho)=Q(y,x;\rho)\).
- Danh tính phản xạ: \(Q(-x,-y;\rho)=Q(x,y;\rho)+ \Phi(-x)+\Phi(-y)-1\) (có thể biểu diễn tương đương thông qua CDF lưỡng biến), và đảo ngược dấu của một đối số làm lật mối tương quan hiệu dụng: \(P(U_1>x,\,U_2
- Hành vi giới hạn \(\rho\to 1^{-}\): các biến trở thành hoàn toàn đơn điệu chung, \(U_2\approx U_1\), vì vậy \(Q(x,y;\rho)\to Q_1(\max(x,y))\) — cả hai sự vượt quá trùng nhau.
- Hành vi giới hạn \(\rho\to -1^{+}\): các biến trở thành hoàn toàn đơn điệu ngược chiều, \(U_2\approx -U_1\). Sự vượt quá chung trên sau đó chỉ có thể xảy ra khi cả hai ngưỡng có thể được vượt qua đồng thời, cho \(Q\to\max\!\big(0,\;1-\Phi(x)-\Phi(y)\big)\), bằng 0 bất cứ khi nào \(x+y\ge 0\).
Vì không có dạng đóng cho \(Q\) với \(\rho\) tổng quát, nó được đánh giá bằng số — thường thông qua hàm T của Owen hoặc tích phân một chiều trên \(\rho\) sử dụng phương pháp trực giao Gauss–Legendre, cả hai đều tái tạo các giá trị được hiển thị trong bảng so sánh với độ chính xác cao.
Định nghĩa & Bảng chú giải
- Điểm số chuẩn hóa (\(x\), \(y\))
- Tọa độ giống z đo lường một giá trị nằm cách trung bình bao nhiêu độ lệch chuẩn. Các đầu vào \(x\) và \(y\) đã được chuẩn hóa, vì vậy mỗi cái theo cách biên duyên theo phân bố chuẩn \(N(0,1)\).
- Hệ số tương quan \(\rho\)
- Mối tương quan tuyến tính (Pearson) giữa hai biến chuẩn, với \(-1<\rho<1\). Đó là tham số duy nhất điều chỉnh mức độ mạnh mẽ mà hai tọa độ chuyển động cùng nhau; \(\rho=0\) có nghĩa là độc lập ở đây, trong khi \(\rho\to\pm1\) có nghĩa là mối quan hệ tuyến tính gần như xác định. Một \(\rho\) quan sát được có thể được ước tính từ dữ liệu ghép cặp bằng máy tính tương quan Pearson.
- Mật độ chung \(f(x,y;\rho)\)
- Mật độ xác suất chuẩn lưỡng biến chuẩn, \(\varphi(x,y;\rho)=\dfrac{1}{2\pi\sqrt{1-\rho^2}}\exp\!\left(-\dfrac{x^2-2\rho xy+y^2}{2(1-\rho^2)}\right)\). Nó mô tả xác suất trên một đơn vị diện tích, không phải là xác suất chính nó.
- Xác suất trực giao \(Q(x,y;\rho)\)
- Xác suất chung đuôi trên \(P(U_1>x,\,U_2>y)\) — thể tích dưới bề mặt mật độ trên góc phần tư trên bên phải được xác định bởi hai ngưỡng. Luôn nằm giữa 0 và 1.
- Đuôi trên đơn biến \(Q_1(t)\)
- Hàm sống sót chuẩn \(Q_1(t)=P(U>t)=1-\Phi(t)\), diện tích trong đuôi phải vượt quá \(t\). Ví dụ \(Q_1(1)\approx 0.1587\). Tại \(\rho=0\), \(Q=Q_1(x)Q_1(y)\).
- Hàm lỗi bổ sung (\(\operatorname{erfc}\))
- Hàm đặc biệt liên quan đến đuôi chuẩn bằng \(Q_1(t)=\tfrac{1}{2}\operatorname{erfc}\!\left(t/\sqrt{2}\right)\). Nó cung cấp một cách ổn định về mặt số học để tính xác suất đuôi đơn biến được sử dụng trong \(Q\).
- Phương pháp trực giao Gauss–Legendre
- Một sơ đồ tích phân số xấp xỉ một tích phân xác định bằng tổng có trọng số của hàm dưới dạng tích phân tại các nút được chọn tối ưu. Vì \(Q(x,y;\rho)\) không có dạng đóng cơ bản, nó thường được đánh giá bằng cách tích phân mật độ (hoặc hàm của \(\rho\)) bằng phương pháp này để có được kết quả chính xác.
Câu hỏi thường gặp
Vì sao \(\rho\) không thể bằng đúng 1? Khi \(\rho = \pm 1\), hai biến phụ thuộc hoàn toàn vào nhau và phân phối thu lại thành một đường thẳng; ngoài đường thẳng đó, mật độ không có giá trị hữu hạn.
Q biểu thị điều gì? Đó là khối lượng xác suất nằm trong "orthant" phía trên bên phải, vượt qua cả hai ngưỡng: \(P(U_1 > x, U_2 > y)\).
Điều gì xảy ra khi x hoặc y rất lớn? Mật độ giảm dần về 0 và Q tiến về 0, vì khả năng cả hai biến chuẩn hóa cùng vượt quá những ngưỡng dương lớn ngày càng nhỏ.