Lower Fence Là Gì?
Lower fence (tạm dịch: hàng rào dưới) là một ngưỡng thống kê dùng để phát hiện các giá trị ngoại lai (outlier) ở phía thấp của tập dữ liệu. Bất kỳ giá trị nào nằm dưới lower fence đều bị đánh dấu là giá trị ngoại lai tiềm năng. Đây là một phần của quy tắc 1,5 × IQR nổi tiếng do nhà thống kê John Tukey phổ biến, và cũng chính là phép tính dùng để vẽ "râu" cũng như xác định outlier trên biểu đồ hộp (box-and-whisker plot).
Cách Sử Dụng Máy Tính Này
Bạn chỉ cần nhập tứ phân vị thứ nhất (Q1) và tứ phân vị thứ ba (Q3) của tập dữ liệu. Máy tính sẽ tính khoảng tứ phân vị (\(\text{IQR} = \text{Q3} - \text{Q1}\)), nhân với 1,5 rồi lấy Q1 trừ đi kết quả đó để cho ra lower fence. Hãy dùng kèm với upper fence (hàng rào trên) để khoanh vùng khoảng giá trị "bình thường" của dữ liệu.
Giải Thích Công Thức
Công thức là $$\text{Lower Fence} = \text{Q1} - 1.5 \times \left( \text{Q3} - \text{Q1} \right)$$ Trước tiên, hãy tính IQR bằng cách lấy Q3 trừ Q1. Hệ số 1,5 quyết định mức độ "khắt khe" khi phát hiện ngoại lai — hệ số lớn hơn (chẳng hạn 3,0) chỉ đánh dấu những outlier cực đoan, trong khi 1,5 là lựa chọn thông dụng để phát hiện các outlier "nhẹ".
Ví Dụ Minh Họa
Giả sử một tập dữ liệu có \(\text{Q1} = 25\) và \(\text{Q3} = 75\). Khi đó IQR là \(75 - 25 = 50\). Nhân với 1,5 ta được 75, rồi lấy Q1 trừ đi: $$25 - 75 = -50$$ Bất kỳ quan sát nào nhỏ hơn −50 đều là giá trị ngoại lai tiềm năng ở phía thấp.
Câu Hỏi Thường Gặp
Lower fence âm có nghĩa là gì? Điều này đơn giản cho thấy không có giá trị nhỏ thực tế nào bị xem là outlier ở phía thấp — ngưỡng này nằm dưới phạm vi dữ liệu của bạn, điều rất thường gặp khi dữ liệu đối xứng hoặc lệch phải.
Làm sao để tìm Q1 và Q3? Hãy sắp xếp dữ liệu theo thứ tự tăng dần, rồi tìm trung vị của nửa dưới (Q1) và trung vị của nửa trên (Q3). Nhiều phần mềm bảng tính như Excel hay Google Sheets có sẵn hàm QUARTILE để tính nhanh.
Vì sao lại nhân 1,5 lần IQR? Đây là quy ước được chấp nhận rộng rãi, giúp cân bằng giữa độ nhạy và tỷ lệ cảnh báo sai đối với dữ liệu gần phân phối chuẩn. Nếu bạn chỉ muốn bắt những outlier cực đoan, hãy dùng 3,0 × IQR.