Máy tính phân vị phân phối Pareto là gì?
Công cụ này tính phân vị, hay còn gọi là quantile, của phân phối Pareto loại I. Khi bạn cung cấp một xác suất tích lũy mục tiêu cùng hai tham số của phân phối — tham số tỷ lệ a (giá trị nhỏ nhất \(x_m\)) và tham số hình dạng b (alpha, chỉ số đuôi) — công cụ sẽ trả về giá trị x mà tại đó phân phối đạt đến xác suất đó. Phân phối Pareto được dùng rộng rãi để mô hình hóa của cải, thu nhập, quy mô đô thị, kích thước tệp tin và nhiều hiện tượng "đuôi nặng" khác tuân theo quy luật "80/20".
Cách sử dụng
Trước tiên, hãy chọn chế độ tích lũy. Chọn "Tích lũy đuôi dưới P" nếu xác suất của bạn là giá trị CDF đuôi dưới \(P = \Pr(X \le x)\), hoặc "Tích lũy đuôi trên Q" nếu đó là giá trị sống sót đuôi trên \(Q = \Pr(X > x)\). Nhập xác suất tích lũy trong khoảng từ 0 đến 1, sau đó nhập tham số tỷ lệ a (phải lớn hơn 0) và tham số hình dạng b (phải lớn hơn 0). Máy tính sẽ chuẩn hóa giá trị nhập của bạn về xác suất đuôi dưới rồi nghịch đảo CDF.
Giải thích công thức
CDF của phân phối Pareto loại I với \(x \ge a\) là $$P(x) = 1 - \left(\frac{a}{x}\right)^{b}.$$ Giải tìm x ta được $$x = a \cdot \left(1 - P\right)^{-1/b}.$$ Khi bạn cung cấp xác suất đuôi trên Q, lưu ý rằng \(1 - P = Q\), nên công thức trở thành $$x = a \cdot Q^{-1/b}.$$ Vì \(a > 0\) và \(0 \le 1 - P \le 1\) với \(b > 0\), kết quả luôn thỏa mãn \(x \ge a\), tức nằm trong miền giá trị của phân phối.
Ví dụ minh họa
Xét trường hợp đuôi trên với \(Q = 0{,}1\), \(a = 2\) và \(b = 3\). Khi đó $$x = 2 \cdot (0{,}1)^{-1/3} = 2 \cdot 10^{1/3} = 2 \cdot 2{,}15443 = 4{,}30887.$$ Kiểm tra lại: \(Q(x) = \left(\frac{2}{4{,}30887}\right)^{3} \approx 0{,}1\), xác nhận kết quả đúng. Với phân phối Pareto chuẩn có \(a = 1\), \(b = 1\) và \(P = 0{,}5\), trung vị là \(x = \frac{1}{1 - 0{,}5} = 2\).
Câu hỏi thường gặp
Điều gì xảy ra khi P = 1 (hoặc Q = 0)? Phân vị không có giới hạn (tiến tới vô cực), vì phân phối Pareto có đuôi phải dài vô hạn. Máy tính sẽ cảnh báo trường hợp này thay vì thực hiện phép chia cho 0.
Kết quả có ý nghĩa gì khi P = 0? Phân vị bằng a, tức giá trị nhỏ nhất và điểm đầu mút bên trái của miền giá trị.
Sự khác nhau giữa tỷ lệ và hình dạng là gì? Tham số tỷ lệ a quy định giá trị nhỏ nhất có thể, trong khi tham số hình dạng b kiểm soát mức độ nặng của đuôi — b càng nhỏ thì đuôi càng nặng và các giá trị cực trị càng lớn.