Nhập phép tính

Kết quả

Độ tin cậy thống kê

95,04%

hai phía

Z-score	-1,963
P-value	0,04964
Tỷ lệ chuyển đổi A	12%
Tỷ lệ chuyển đổi B	15%
Mức tăng tương đối	25%

Công cụ kiểm định ý nghĩa A/B test là gì?

Công cụ này cho bạn biết liệu sự chênh lệch giữa hai phiên bản trong một A/B test có thực sự mang ý nghĩa thống kê, hay chỉ là kết quả ngẫu nhiên. Nó sử dụng phép kiểm định z hai tỷ lệ (two-proportion z-test) — phương pháp tiêu chuẩn để so sánh tỷ lệ chuyển đổi giữa phiên bản gốc (A) và phiên bản thử nghiệm (B).

Hai phễu phiên bản A và B chuyển khách truy cập thành chuyển đổi, được so sánh để tìm bên thắng — Thử nghiệm A/B so sánh tỷ lệ chuyển đổi của hai phiên bản để tìm ra bên thắng có ý nghĩa thống kê.

Cách sử dụng

Nhập số lượt chuyển đổi và tổng số lượt truy cập cho từng phiên bản. Công cụ sẽ trả về z-score, p-value (kiểm định hai phía) và mức độ tin cậy. Độ tin cậy từ 95% trở lên (p-value ≤ 0,05) là ngưỡng phổ biến để khẳng định một phiên bản chiến thắng.

Giải thích công thức

Trước tiên, tỷ lệ gộp được tính bằng $\bar{p} = \dfrac{x_1 + x_2}{n_1 + n_2}$. Sai số chuẩn là $\sqrt{\bar{p}(1-\bar{p})\left(\frac{1}{n_1} + \frac{1}{n_2}\right)}$. Z-score là chênh lệch giữa hai tỷ lệ quan sát được chia cho sai số chuẩn này:

$$Z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\bar{p}\,(1-\bar{p})\left(\dfrac{1}{n_1}+\dfrac{1}{n_2}\right)}}$$

$$\text{trong đó}\quad \left\{ \begin{aligned} \hat{p}_1 &= \dfrac{\text{Conversions A}}{\text{Visitors A}} \\ \hat{p}_2 &= \dfrac{\text{Conversions B}}{\text{Visitors B}} \\ \bar{p} &= \dfrac{\text{Conv. A} + \text{Conv. B}}{\text{Visitors A} + \text{Visitors B}} \end{aligned} \right.$$

P-value được suy ra từ phân phối chuẩn (kiểm định hai phía), và độ tin cậy bằng $(1 - \text{p-value}) \times 100\%$.

Quảng cáo

Đường cong phân phối chuẩn có đánh dấu điểm z và các vùng đuôi giá trị p được tô bóng — Điểm z xác định vị trí kết quả trên đường cong chuẩn; phần đuôi tô bóng là giá trị p.

Ví dụ minh họa

Phiên bản A: 120 chuyển đổi trên 1.000 lượt (12%). Phiên bản B: 150 trên 1.000 lượt (15%). Tỷ lệ gộp $\bar{p} = 270/2000 = 0{,}135$. $\text{SE} = \sqrt{0{,}135 \times 0{,}865 \times (0{,}001 + 0{,}001)} \approx 0{,}01528$. $$Z = \frac{0{,}12 - 0{,}15}{0{,}01528} \approx -1{,}963$$ P-value hai phía $\approx 0{,}0496$, tương ứng độ tin cậy khoảng 95% — một kết quả nằm ngay ở ranh giới có ý nghĩa thống kê.

Câu hỏi thường gặp

Nên đặt mục tiêu độ tin cậy bao nhiêu? 95% là chuẩn của ngành, nghĩa là có 5% khả năng kết quả là dương tính giả.

Cỡ mẫu có quan trọng không? Có. Cỡ mẫu nhỏ tạo ra p-value lớn ngay cả khi chênh lệch là thật; hãy để test chạy cho đến khi mỗi phiên bản có đủ lượt truy cập.

Vì sao dùng kiểm định hai phía? Kiểm định hai phía phát hiện chênh lệch theo cả hai chiều (B tốt hơn hoặc kém hơn A), nên đây là lựa chọn mặc định an toàn hơn.

Máy tính liên quan

Công Cụ Tính Quy Mô Thị Trường

Tính quy mô thị trường bằng cách nhập dân số mục tiêu, tỷ lệ thâm nhập và doanh thu trung bình mỗi khách hàng để ước tính số khách hàng và tổng doanh thu.

Công Cụ Tính Số Ngày Phải Thu Khách Hàng

Tính Số Ngày Phải Thu (DSO) từ khoản phải thu, doanh thu bán chịu và số ngày trong kỳ. Công cụ miễn phí, cho kết quả tức thì.

Công Cụ Tính Lead Time (Thời Gian Giao Hàng)

Tính tổng lead time của đơn hàng bằng cách cộng thời gian mua hàng, sản xuất và vận chuyển. Xem ngay tổng thời gian giao hàng theo ngày và tuần.

Công Cụ Tính Chi Phí Cuộc Họp

Tính chi phí thực của một cuộc họp dựa trên số người tham dự, lương theo giờ và thời lượng. Xem ngay tổng chi phí và chi phí mỗi phút bằng công cụ miễn phí.

Công Cụ Tính Thời Gian Dự Trữ (Slack Time)

Tính thời gian dự trữ (float/slack) của công việc trong dự án từ thời điểm bắt đầu/kết thúc sớm và muộn. Xác định float toàn phần và nhận diện công việc trên đường găng.

Công cụ kiểm định ý nghĩa thống kê A/B Test