Xác suất nhị thức tích lũy là gì?
Xác suất nhị thức tích lũy \(P(X \le k)\) cho biết khả năng đạt được nhiều nhất k lần thành công trong n phép thử độc lập, khi mỗi phép thử đều có cùng một xác suất thành công p. Nó cộng dồn từng xác suất nhị thức, bắt đầu từ 0 lần thành công cho đến k lần thành công. Đây là công cụ tổng quát, áp dụng được cho mọi thí nghiệm nhị thức như tung đồng xu, lấy mẫu kiểm tra chất lượng hay các phép thử dạng đạt/không đạt.
Cách sử dụng máy tính
Bạn nhập ba giá trị: số phép thử (n), số lần thành công làm mốc giới hạn (k) và xác suất thành công của mỗi phép thử (p, là một số nằm trong khoảng từ 0 đến 1). Công cụ sẽ trả về xác suất tích lũy \(P(X \le k)\) cùng nhiều đại lượng liên quan khác: xác suất chính xác \(P(X = k)\), các xác suất đuôi phải \(P(X > k)\) và \(P(X \ge k)\), cùng giá trị kỳ vọng của phân phối là \(n \times p\).
Giải thích công thức
Mỗi số hạng sử dụng hệ số nhị thức \(C(n,i) = \frac{n!}{i!(n-i)!}\), cho biết có bao nhiêu cách để xảy ra i lần thành công, nhân với \(p^i\) (xác suất của những lần thành công đó) và \((1-p)^{n-i}\) (xác suất của những lần thất bại còn lại). Cộng các số hạng này từ \(i = 0\) đến k sẽ cho ra giá trị tích lũy:
$$P(X \le k) = \sum_{i=0}^{k} \binom{n}{i}\, p^{\,i}\,\left(1-p\right)^{n-i}$$Để giữ ổn định về mặt tính toán khi n lớn, máy tính xây dựng mỗi số hạng từ số hạng liền trước bằng tỉ số \(\frac{n-i}{i+1} \times \frac{p}{1-p}\).
Ví dụ minh họa
Giả sử bạn tung một đồng xu cân đối 10 lần (\(n = 10\), \(p = 0{,}5\)) và muốn biết xác suất xuất hiện nhiều nhất 3 mặt ngửa (\(k = 3\)). Bốn số hạng liên quan là \(C(10,0)+C(10,1)+C(10,2)+C(10,3) = 1 + 10 + 45 + 120 = 176\), mỗi số hạng nhân với \(0{,}5^{10} = \frac{1}{1024}\). Vậy $$P(X \le 3) = \frac{176}{1024} = 0{,}171875.$$
Diễn giải Kết quả Của Bạn
P(X ≤ k) là một xác suất tích lũy. Nó trả lời câu hỏi "xác suất nhận được tối đa k lần thành công là bao nhiêu?" bằng cách cộng các xác suất của 0, 1, 2, …, cho đến k lần thành công. Nó luôn nằm trong khoảng từ 0 đến 1 và không bao giờ giảm khi k tăng.
P(X = k) là một điểm đơn lẻ. Đây là xác suất có chính xác k lần thành công — một số hạng trong tổng tích lũy. Vì vậy \(P(X\le k)\) luôn ít nhất bằng \(P(X=k)\), và \(P(X\le k)-P(X\le k-1)=P(X=k)\).
Hai đuôi phân phối. Đuôi phải \(P(X>k)=1-P(X\le k)\) là xác suất có hơn k lần thành công, trong khi \(P(X\ge k)=P(X>k)+P(X=k)\) bao gồm cả k. Vì biến này là số nguyên lần thành công, việc xác định liệu giá trị ngưỡng k có nên được tính vào hay không là một điểm gây nhầm lẫn thường gặp — luôn kiểm tra xem k có nên được tính vào hay loại ra.
Giá trị trung bình. Số lần thành công dự kiến là \(\mu = n\cdot p\). Đối với n = 20 lần thử với p = 0,05 thì \(\mu = 1\) sản phẩm lỗi trung bình; đối với n = 10 với p = 0,9 thì \(\mu = 9\). So sánh k của bạn với giá trị trung bình cho bạn biết bạn đang xem xét một kết quả có khả năng xảy ra (k gần \(n\cdot p\)) hay một sự kiện ở đuôi phân phối (k xa khỏi nó).
Đọc một con số như 0,17. Một kết quả là \(P(X\le k)=0,17\) có nghĩa là có 17% cơ hội nhận được tối đa k lần thành công — và do đó có 83% cơ hội nhận được hơn k. Nhân với 100 để đọc nó dưới dạng phần trăm.
Khi đuôi phải quan trọng. Xác suất của đuôi phải là trung tâm đối với các ngưỡng quyết định và kiểm định giả thuyết. Nếu bạn quan sát được k lần thành công và muốn biết điều đó bất thường như thế nào dưới một p được giả định, giá trị đuôi trên \(P(X\ge k)\) đóng vai trò là p-value một phía: một giá trị nhỏ (thường dưới 0,05) cho thấy kết quả đó không có khả năng xảy ra chỉ do tình cờ. Đây là cách các kế hoạch chấp nhận lấy mẫu đặt số sản phẩm lỗi tối đa cho phép và cách các bài kiểm tra A/B phát hiện số lần thành công bất thường cao.
Định Nghĩa & Bảng Thuật Ngữ
- n — số lần thử. Số lượng cố định các lần lặp lại độc lập của thí nghiệm (ví dụ 20 mặt hàng được kiểm tra, 10 lần tung đồng xu).
- k — ngưỡng thành công. Số lần thành công được quan tâm. Trong \(P(X\le k)\) nó là số lần thành công lớn nhất được bao gồm trong tổng tích lũy; \(k\) là một số nguyên từ 0 đến n.
- p — xác suất thành công. Cơ hội của một "thành công" trên một lần thử duy nhất, giống nhau cho mỗi lần thử, với \(0\le p\le 1\).
- Thành công / Thất bại. Hai kết quả loại trừ lẫn nhau của mỗi lần thử. "Thành công" đơn giản là kết quả bạn đang đếm; phần bù của nó, "thất bại," có xác suất \(1-p\).
- Hệ số nhị thức C(n, i). Được viết \(\binom{n}{i}=\dfrac{n!}{i!\,(n-i)!}\), nó đếm số cách phân biệt để sắp xếp i lần thành công trong n lần thử.
- Xác suất tích lũy. \(P(X\le k)=\sum_{i=0}^{k}\binom{n}{i}p^{i}(1-p)^{n-i}\), xác suất tổng cộng của k hoặc ít hơn k lần thành công.
- Xác suất của đuôi phân phối. Xác suất ở một đầu của phân phối: đuôi phải (trên) \(P(X>k)=1-P(X\le k)\), hoặc đuôi trên bao gồm \(P(X\ge k)\). Được sử dụng cho các ngưỡng và p-value.
- Giá trị trung bình (giá trị kỳ vọng). \(\mu = n\cdot p\), số lần thành công trung bình dài hạn trên n lần thử.
Câu hỏi thường gặp
\(P(X \le k)\) và \(P(X = k)\) khác nhau như thế nào? \(P(X = k)\) là xác suất có đúng k lần thành công, còn \(P(X \le k)\) cộng dồn tất cả các trường hợp từ 0 cho đến k lần thành công.
Làm sao tính được \(P(X \ge k)\)? Bạn dùng công thức \(P(X \ge k) = 1 - P(X \le k) + P(X = k)\), và công cụ này tự động báo kết quả cho bạn.
p có thể bằng 0 hoặc 1 không? Có. Nếu \(p = 0\) thì không bao giờ thành công, nên \(P(X \le k) = 1\) với mọi \(k \ge 0\); nếu \(p = 1\) thì mọi phép thử đều thành công.