Công cụ tính Tứ phân vị và IQR là gì?
Công cụ này sắp xếp tập dữ liệu của bạn rồi tính ba tứ phân vị — Q1 (phân vị thứ 25), Q2 (trung vị, phân vị thứ 50) và Q3 (phân vị thứ 75) — cùng với khoảng tứ phân vị (IQR), giá trị nhỏ nhất, lớn nhất và khoảng biến thiên. Các tứ phân vị chia một tập dữ liệu đã sắp xếp thành bốn phần bằng nhau, còn IQR phản ánh độ phân tán của 50% giá trị nằm ở giữa. Đây là một thước đo độ phân tán khá ổn định vì không bị ảnh hưởng bởi các giá trị ngoại lai cực đoan.
Cách sử dụng
Nhập hoặc dán các con số của bạn vào ô, ngăn cách bằng dấu phẩy hoặc khoảng trắng (ví dụ 3, 7, 8, 5, 12, 14, 21, 13, 18). Công cụ sẽ tự động sắp xếp và hiển thị ngay Q1, Q2, Q3 và IQR. Bạn có thể nhập lẫn lộn số nguyên và số thập phân; thứ tự nhập liệu không quan trọng.
Giải thích công thức
Trước tiên, các giá trị được sắp xếp theo thứ tự tăng dần. Trung vị (Q2) chia dữ liệu thành nửa dưới và nửa trên. Công cụ này dùng phương pháp loại trừ (phương pháp Tukey): khi số lượng phần tử là số lẻ, giá trị trung tâm sẽ không được tính vào cả hai nửa. Q1 là trung vị của nửa dưới và Q3 là trung vị của nửa trên. Cuối cùng, $$\text{IQR} = Q_3 - Q_1$$.
Ví dụ minh họa
Xét tập dữ liệu 3, 5, 7, 8, 12, 13, 14, 18, 21 (\(n = 9\), đã sắp xếp sẵn). Trung vị Q2 là giá trị thứ 5, tức 12. Nửa dưới gồm 3, 5, 7, 8 có trung vị là \((5 + 7) / 2 = 6\), nên \(Q_1 = 6\). Nửa trên gồm 13, 14, 18, 21 có trung vị là \((14 + 18) / 2 = 16\), nên \(Q_3 = 16\). Do đó $$\text{IQR} = 16 - 6 = 10.$$
Câu hỏi thường gặp
IQR cho tôi biết điều gì? Nó đo mức độ phân tán của 50% dữ liệu nằm ở giữa. IQR càng lớn thì các giá trị trung tâm càng biến động nhiều.
IQR được dùng để phát hiện giá trị ngoại lai như thế nào? Một quy tắc phổ biến là đánh dấu mọi giá trị nhỏ hơn \(Q_1 - 1{,}5 \times \text{IQR}\) hoặc lớn hơn \(Q_3 + 1{,}5 \times \text{IQR}\) là giá trị ngoại lai tiềm năng.
Vì sao kết quả của tôi khác với bảng tính? Các phần mềm khác nhau dùng những phương pháp tính tứ phân vị khác nhau. Công cụ này dùng phương pháp trung vị loại trừ; trong khi đó các công cụ như hàm QUARTILE.INC của Excel dùng nội suy tuyến tính, nên có thể cho ra giá trị Q1/Q3 hơi khác một chút.