Độ lệch chuẩn gộp là gì?
Độ lệch chuẩn gộp (Sp) là trung bình có trọng số của độ lệch chuẩn từ hai mẫu, được kết hợp thành một ước lượng duy nhất cho độ lệch chuẩn chung của tổng thể. Chỉ số này được dùng khi bạn giả định hai mẫu độc lập đến từ những tổng thể có cùng phương sai. Ước lượng gộp đóng vai trò then chốt trong kiểm định t hai mẫu, hệ số ảnh hưởng Cohen's d, cũng như khoảng tin cậy cho hiệu của hai trung bình.
Cách sử dụng công cụ
Nhập kích thước của từng mẫu (\(n_1\) và \(n_2\)) cùng độ lệch chuẩn tương ứng (\(s_1\) và \(s_2\)). Công cụ sẽ trả về độ lệch chuẩn gộp, phương sai gộp (\(S_p^2\)) và bậc tự do (\(n_1 + n_2 - 2\)). Mỗi mẫu cần có ít nhất hai quan sát để bậc tự do luôn là số dương.
Giải thích công thức
Phương sai gộp lấy trọng số của từng phương sai mẫu theo bậc tự do của nó (\(n - 1\)):
$$S_p^2 = \frac{(n_1 - 1)\,s_1^{2} + (n_2 - 1)\,s_2^{2}}{n_1 + n_2 - 2}$$
Lấy căn bậc hai sẽ cho ra độ lệch chuẩn gộp \(S_p\). Mẫu càng lớn thì đóng góp càng nhiều vào ước lượng gộp — đó là lý do các phương sai được tính theo trọng số thay vì lấy trung bình đơn thuần.
Ví dụ minh họa
Giả sử mẫu 1 có \(n_1 = 10\) và \(s_1 = 5\), mẫu 2 có \(n_2 = 12\) và \(s_2 = 6\). Khi đó \((10-1)\cdot 25 = 225\) và \((12-1)\cdot 36 = 396\), cộng lại được 621. Bậc tự do là \(10 + 12 - 2 = 20\), vậy $$S_p^2 = \frac{621}{20} = 31{,}05$$ và \(S_p = \sqrt{31{,}05} \approx 5{,}5722\).
Câu hỏi thường gặp
Khi nào nên gộp độ lệch chuẩn? Hãy gộp khi bạn giả định hai nhóm có phương sai tổng thể bằng nhau. Nếu phương sai chênh lệch quá lớn, hãy dùng kiểm định t của Welch thay thế.
Vì sao dùng \(n - 1\) thay vì \(n\)? Dùng \(n - 1\) (hiệu chỉnh Bessel) cho ước lượng phương sai không chệch từ một mẫu.
Thứ tự các mẫu có quan trọng không? Không. Việc hoán đổi hai mẫu vẫn cho cùng một giá trị độ lệch chuẩn gộp.