Kiểm định t hai mẫu là gì?
Kiểm định t hai mẫu giúp kiểm tra xem trung bình của hai nhóm độc lập có khác nhau một cách có ý nghĩa thống kê hay không. Công cụ này sử dụng kiểm định t Welch — phương pháp không giả định hai nhóm có phương sai bằng nhau, nên đây là lựa chọn an toàn cho hầu hết các tình huống thực tế. Từ trung bình, độ lệch chuẩn và cỡ mẫu của hai nhóm, máy tính sẽ trả về trị số thống kê t, sai số chuẩn của hiệu số trung bình và bậc tự do theo công thức Welch-Satterthwaite.
Cách sử dụng
Nhập trung bình, độ lệch chuẩn và số quan sát cho từng mẫu trong hai mẫu của bạn. Bấm tính để nhận trị số thống kê t. Hãy so sánh độ lớn của t với giá trị tới hạn tra từ bảng phân phối t (dựa trên bậc tự do được báo cáo), hoặc quy đổi sang giá trị p để quyết định có bác bỏ giả thuyết không (cho rằng hai trung bình bằng nhau) hay không.
Giải thích công thức
Trị số thống kê t bằng hiệu của hai trung bình chia cho sai số chuẩn của hiệu đó:
$$t = \dfrac{\text{x̄}_1 - \text{x̄}_2}{\sqrt{\dfrac{\text{s}_1^{2}}{\text{n}_1} + \dfrac{\text{s}_2^{2}}{\text{n}_2}}}$$Phần mẫu số đo lường mức dao động lấy mẫu mà ta dự kiến ở hiệu số. Giá trị \(|t|\) càng lớn nghĩa là khoảng cách quan sát được càng lớn so với nhiễu, cho thấy nhiều khả năng tồn tại một hiệu ứng thực sự.
Ví dụ minh họa
Giả sử nhóm A có trung bình 10,5, độ lệch chuẩn 2,5, n = 30; nhóm B có trung bình 9,0, độ lệch chuẩn 3,0, n = 30. Các số hạng phương sai là \(6{,}25/30 = 0{,}2083\) và \(9/30 = 0{,}3\). Tổng của chúng là 0,5083, nên sai số chuẩn là \(\sqrt{0{,}5083} \approx 0{,}7130\). Hiệu số trung bình là 1,5, suy ra
$$t = 1{,}5 / 0{,}7130 \approx 2{,}104$$với khoảng 56 bậc tự do.
Câu hỏi thường gặp
Tại sao nên dùng kiểm định Welch thay vì kiểm định Student? Kiểm định Welch vẫn cho kết quả chính xác ngay cả khi hai nhóm có phương sai khác nhau hoặc cỡ mẫu không bằng nhau, trong khi kiểm định gộp của Student có thể cho kết quả sai lệch trong những trường hợp này.
Trị số t bằng 2,1 có ý nghĩa thống kê không? Ở mức ý nghĩa 0,05 (hai phía) với khoảng 56 bậc tự do, giá trị tới hạn vào khoảng 2,00, nên \(|t| = 2{,}1\) chỉ vừa vượt ngưỡng — nằm ở ranh giới có ý nghĩa.
Nếu hai nhóm là dữ liệu ghép cặp thì sao? Khi đó hãy dùng kiểm định t ghép cặp; công cụ này giả định hai mẫu là độc lập.