Tóm Tắt Năm Số Là Gì?
Tóm tắt năm số là cách mô tả ngắn gọn sự phân bố của một bộ dữ liệu. Nó gồm năm giá trị: giá trị nhỏ nhất, tứ phân vị thứ nhất (Q1), trung vị (Q2), tứ phân vị thứ ba (Q3) và giá trị lớn nhất. Khi kết hợp lại, năm con số này cho thấy vị trí trung tâm, độ phân tán và độ lệch của dữ liệu, đồng thời là nền tảng để vẽ biểu đồ hộp (box-and-whisker plot).
Cách Sử Dụng Máy Tính
Nhập các con số vào ô, ngăn cách bằng dấu phẩy, dấu cách hoặc xuống dòng. Máy tính sẽ tự động sắp xếp và trả về cả năm giá trị tóm tắt cùng khoảng tứ phân vị (\(\text{IQR} = Q_3 - Q_1\)) — đại lượng đo độ phân tán của 50% dữ liệu nằm ở giữa.
Công Thức
Sau khi sắp xếp dữ liệu, trung vị là giá trị nằm chính giữa (hoặc trung bình của hai giá trị giữa nếu số phần tử là chẵn). Dữ liệu được chia thành nửa dưới và nửa trên. Q1 là trung vị của nửa dưới, còn Q3 là trung vị của nửa trên. Khi số phần tử là lẻ, giá trị ở giữa được loại khỏi cả hai nửa (phương pháp loại trừ / phương pháp Tukey). IQR đơn giản là \(Q_3 - Q_1\).
$$\begin{gathered} \{\,\text{Min},\ Q_1,\ \text{Median},\ Q_3,\ \text{Max}\,\} \\[1.4em] \text{from sorted}\ \text{Data set} \\[1.2em] \text{where}\quad \left\{ \begin{aligned} \text{Min} &= x_{(1)}, \quad \text{Max} = x_{(n)} \\ \text{Median} &= \operatorname{med}(x_{(1)},\dots,x_{(n)}) \\ Q_1 &= \operatorname{med}(\text{lower half}) \\ Q_3 &= \operatorname{med}(\text{upper half}) \\ \text{IQR} &= Q_3 - Q_1 \end{aligned} \right. \end{gathered}$$
Ví Dụ Minh Họa
Xét bộ dữ liệu 2, 4, 6, 8, 10, 12, 14. Sau khi sắp xếp, giá trị nhỏ nhất là 2 và lớn nhất là 14. Trung vị là giá trị thứ tư, tức 8. Nửa dưới là {2, 4, 6} với trung vị (Q1) là 4. Nửa trên là {10, 12, 14} với trung vị (Q3) là 12. Vậy \(\text{IQR} = 12 - 4 = 8\).
Câu Hỏi Thường Gặp
Vì sao lại có nhiều phương pháp tính tứ phân vị? Các phần mềm thống kê sử dụng nhiều quy ước khác nhau. Công cụ này dùng phương pháp loại trừ phổ biến, tức bỏ qua trung vị tổng khi chia một bộ dữ liệu có số phần tử lẻ.
IQR cho tôi biết điều gì? Nó cho biết mức độ phân tán của nửa dữ liệu nằm ở trung tâm và được dùng để phát hiện giá trị ngoại lai (những giá trị nằm ngoài khoảng 1,5 × IQR tính từ các tứ phân vị).
Tôi cần bao nhiêu con số? Bạn cần ít nhất hai giá trị, nhưng càng nhiều dữ liệu thì các tứ phân vị càng có ý nghĩa.