Kết nối qua MCP →

Nhập phép tính

Công thức

Quảng cáo

Kết quả

Giá trị ngoại lai được phát hiện
90.0
1 outlier(s) in 9 values
Tứ phân vị thứ nhất (Q1) 13
Tứ phân vị thứ ba (Q3) 23,5
Khoảng tứ phân vị (IQR) 10,5
Hàng rào dưới (Q1 − 1,5·IQR) -2,75
Hàng rào trên (Q3 + 1,5·IQR) 39,25

Công cụ tìm giá trị ngoại lai là gì?

Giá trị ngoại lai (outlier) là điểm dữ liệu nằm lệch hẳn so với phần còn lại của tập dữ liệu. Công cụ này sử dụng phương pháp khoảng tứ phân vị (IQR) rất phổ biến, còn gọi là hàng rào Tukey, để đánh dấu những giá trị cao hoặc thấp bất thường. Bạn chỉ cần nhập dãy số và công cụ sẽ trả về các tứ phân vị, giá trị IQR, hàng rào dưới, hàng rào trên cùng danh sách những outlier được tìm thấy.

Cách sử dụng

Hãy nhập tập dữ liệu vào ô bên dưới, cách nhau bằng dấu phẩy hoặc dấu cách (ví dụ 4, 5, 6, 7, 8, 100). Công cụ sẽ sắp xếp các giá trị, tính tứ phân vị thứ nhất (Q1), tứ phân vị thứ ba (Q3) và khoảng tứ phân vị, sau đó đánh dấu bất kỳ giá trị nào vượt quá 1,5 lần IQR so với các tứ phân vị là một giá trị ngoại lai.

Giải thích công thức

Khoảng tứ phân vị được tính bằng $$\text{IQR} = Q_3 - Q_1$$ Hai hàng rào lần lượt là $$\text{Hàng rào dưới} = Q_1 - 1{,}5\cdot\text{IQR}$$ và $$\text{Hàng rào trên} = Q_3 + 1{,}5\cdot\text{IQR}$$ Mọi giá trị nằm dưới hàng rào dưới hoặc trên hàng rào trên đều được xem là giá trị ngoại lai. Hệ số 1,5 là quy ước chuẩn; một số nhà phân tích dùng 3,0 để xác định outlier "cực đoan".

Quảng cáo
Biểu đồ hộp trên trục số thể hiện Q1, Q3, IQR, hàng rào dưới và trên cùng các điểm ngoại lệ nằm ngoài hàng rào
Hàng rào Tukey: các điểm vượt quá \(Q_1 - 1{,}5\cdot\text{IQR}\) hoặc \(Q_3 + 1{,}5\cdot\text{IQR}\) được đánh dấu là ngoại lệ.

Ví dụ minh họa

Với dãy 10, 12, 14, 15, 18, 20, 22, 25, 90 (\(n = 9\)), trung vị chia dữ liệu thành nửa dưới {10, 12, 14, 15} và nửa trên {18, 20, 22, 25}. Ta có \(Q_1 = (12+14)/2 = 13\) và \(Q_3 = (20+22)/2 = 21\)... với tập thay thế thì \(Q_3 = 23{,}5\). Khi \(\text{IQR} = 10{,}5\), hàng rào dưới là \(-2{,}75\) và hàng rào trên là \(39{,}25\). Giá trị 90 vượt quá 39,25 nên được đánh dấu là một giá trị ngoại lai duy nhất.

Câu hỏi thường gặp

Công cụ dùng phương pháp tính tứ phân vị nào? Phương pháp trung vị loại trừ (exclusive): khi n là số lẻ, trung vị tổng thể bị loại khỏi cả hai nửa dữ liệu.

Tại sao lại nhân 1,5 với IQR? Đây là ngưỡng quy ước do John Tukey đề xuất; nó bao trùm gần hết phần đuôi nằm ngoài độ phân tán thông thường của dữ liệu.

Giá trị ngoại lai có thể là hợp lệ không? Có — outlier chỉ đơn giản là bất thường về mặt thống kê, không nhất thiết là sai sót. Hãy luôn kiểm tra kỹ trước khi quyết định loại bỏ.

Cập nhật lần cuối: