Phân phối siêu bội là gì?
Phân phối siêu bội (hypergeometric) mô tả xác suất rút được đúng k phần tử "thành công" trong n lần rút không hoàn lại từ một tổng thể hữu hạn gồm N phần tử, trong đó có K phần tử thành công. Khác với phân phối nhị thức (giả định có hoàn lại và xác suất không đổi), phân phối siêu bội tính đến việc mỗi lần rút sẽ làm thay đổi thành phần của những phần tử còn lại.
Cách dùng máy tính này
Hãy nhập bốn số nguyên: kích thước tổng thể N, số phần tử thành công trong tổng thể K, cỡ mẫu n, và số lần thành công quan sát được k. Máy tính sẽ trả về xác suất chính xác \(P(X=k)\), các xác suất tích lũy \(P(X \le k)\) và \(P(X \ge k)\), cùng kỳ vọng và phương sai của phân phối.
Giải thích công thức
\(P(X=k)\) bằng số cách chọn k phần tử thành công từ K, nhân với số cách chọn n−k phần tử còn lại từ N−K phần tử thất bại, rồi chia cho tổng số cách chọn n phần tử từ N.
$$P(X = \text{k}) = \dfrac{\dbinom{\text{K}}{\text{k}}\dbinom{\text{N}-\text{K}}{\text{n}-\text{k}}}{\dbinom{\text{N}}{\text{n}}}$$Kỳ vọng là \(\mu = \text{n}\,\dfrac{\text{K}}{\text{N}}\) và phương sai là \(\sigma^{2} = \text{n}\,\dfrac{\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{n}}{\text{N}-1}\), trong đó thừa số cuối cùng chính là hệ số hiệu chỉnh cho tổng thể hữu hạn.
$$\begin{gathered} \mu = \text{n}\,\dfrac{\text{K}}{\text{N}} \\[1em] \sigma^{2} = \text{n}\,\dfrac{\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{K}}{\text{N}}\,\dfrac{\text{N}-\text{n}}{\text{N}-1} \end{gathered}$$
Ví dụ minh họa
Một bộ bài 52 lá chuẩn có K=4 lá Át. Rút n=5 lá. Xác suất rút được đúng k=2 lá Át là
$$\frac{\dbinom{4}{2}\dbinom{48}{3}}{\dbinom{52}{5}} = \frac{6 \cdot 17296}{2598960} \approx 0{,}039929.$$Số lá Át kỳ vọng là \(5 \cdot \dfrac{4}{52} \approx 0{,}3846\).
Câu hỏi thường gặp
Khi nào nên dùng phân phối siêu bội thay vì nhị thức? Hãy dùng phân phối siêu bội khi lấy mẫu không hoàn lại từ một tổng thể hữu hạn nhỏ; dùng phân phối nhị thức khi các lần rút độc lập với nhau hoặc tổng thể lớn đến mức gần như vô hạn.
\(P(X \ge k)\) có ý nghĩa gì? Đó là xác suất có được ít nhất k lần thành công — rất hữu ích cho các kiểm định ở đuôi phân phối, chẳng hạn như lấy mẫu nghiệm thu trong kiểm soát chất lượng.
k có thể lớn hơn K hoặc n không? Nếu k vượt quá giá trị nhỏ hơn giữa K và n thì xác suất bằng 0, vì kết quả đó là không thể xảy ra.