Công cụ tính giá trị ngoại lai IQR là gì?
Công cụ này phân tích một dãy số và phát hiện các giá trị ngoại lai (outlier) trong thống kê dựa trên quy tắc 1.5×IQR nổi tiếng do nhà thống kê John Tukey đề xuất. Kết quả trả về gồm tứ phân vị thứ nhất (Q1), trung vị (Q2), tứ phân vị thứ ba (Q3), khoảng tứ phân vị (IQR) cùng hai "ngưỡng" dưới và trên — phạm vi bao quanh những giá trị được xem là bình thường. Bất kỳ con số nào nằm ngoài khoảng này đều bị đánh dấu là giá trị ngoại lai tiềm năng.
Cách sử dụng
Nhập các giá trị dữ liệu, ngăn cách bằng dấu phẩy hoặc khoảng trắng (ví dụ 2, 5, 7, 8, 10, 12, 14, 18, 21, 45) rồi nhấn tính. Công cụ sẽ sắp xếp các số theo thứ tự, tính các tứ phân vị bằng phương pháp nội suy tuyến tính (chính là phương pháp R-7 / hàm PERCENTILE trong Excel) và áp dụng công thức ngưỡng. Những giá trị nhỏ hơn ngưỡng dưới hoặc lớn hơn ngưỡng trên sẽ được tính là giá trị ngoại lai.
Giải thích công thức
Khoảng tứ phân vị là khoảng cách giữa phân vị thứ 25 và phân vị thứ 75: \(\text{IQR} = Q_3 - Q_1\). Hai ngưỡng được nới ra thêm 1.5 lần IQR so với các tứ phân vị:
$$\begin{aligned} \text{Ngưỡng dưới} &= Q_1 - 1.5 \times \text{IQR} \\ \text{Ngưỡng trên} &= Q_3 + 1.5 \times \text{IQR} \end{aligned}$$ Hệ số 1.5 là ngưỡng kinh điển của Tukey; một số nhà phân tích dùng 3.0 để chỉ đánh dấu những giá trị cực đoan "ở rất xa".
Ví dụ minh họa
Với bộ dữ liệu 2, 5, 7, 8, 10, 12, 14, 18, 21, 45 (\(n = 10\)): \(Q_1 = 7.25\), \(Q_3 = 17\), nên \(\text{IQR} = 9.75\). Ngưỡng dưới \(= 7.25 - 1.5 \times 9.75 = -7.375\) và ngưỡng trên \(= 17 + 1.5 \times 9.75 = 31.625\). Giá trị 45 vượt quá ngưỡng trên, vì vậy đây chính là giá trị ngoại lai duy nhất.
Câu hỏi thường gặp
Phương pháp tính tứ phân vị nào được sử dụng? Nội suy tuyến tính giữa các thống kê thứ tự (R-7), tương ứng với hàm PERCENTILE và QUARTILE trong Excel.
Vì sao lại là 1.5? Đây là hệ số quy ước của Tukey, cân bằng giữa độ nhạy và tỷ lệ báo động giả đối với dữ liệu phân phối gần chuẩn.
Ngưỡng có thể là số âm không? Có — ngưỡng dưới âm chỉ đơn giản nghĩa là không có giá trị nào ở phía thấp đủ cực đoan để được coi là ngoại lai.