Mode Là Gì?
Mode (còn gọi là yếu vị hay mốt) là giá trị xuất hiện nhiều lần nhất trong một tập dữ liệu. Khác với giá trị trung bình (mean) và trung vị (median), mode có thể dùng được với mọi loại dữ liệu và là đại lượng đo xu hướng trung tâm duy nhất áp dụng được cho cả dữ liệu định tính (phân loại). Một tập dữ liệu có thể có một mode (unimodal), hai mode (bimodal), nhiều mode (đa mode) hoặc hoàn toàn không có mode khi mọi giá trị đều xuất hiện số lần như nhau.
Cách Sử Dụng Công Cụ
Bạn chỉ cần nhập các con số vào ô, ngăn cách bằng dấu phẩy hoặc khoảng trắng — ví dụ 2, 4, 4, 4, 5, 5, 7, 9. Nhấn nút tính toán, công cụ sẽ đếm số lần xuất hiện của từng giá trị rồi cho biết giá trị (hoặc các giá trị) có tần suất cao nhất. Ngoài ra, công cụ còn hiển thị tần suất cao nhất, tổng số phần tử đã nhập và số lượng giá trị khác nhau.
Giải Thích Công Thức
Về mặt toán học, mode là giá trị x làm cực đại hàm tần suất freq(x) — tức số lần mà x xuất hiện. Nếu có nhiều giá trị cùng đạt tần suất lớn nhất thì tất cả chúng đều là mode. Nếu tần suất lớn nhất chỉ bằng 1 — nghĩa là không có giá trị nào lặp lại — thì tập dữ liệu không có mode.
$$\text{Mode} = \underset{x \,\in\, \text{Numbers}}{\arg\max}\; \operatorname{freq}(x)$$
Ví Dụ Minh Họa
Xét dãy số \(2, 4, 4, 4, 5, 5, 7, 9\). Giá trị \(4\) xuất hiện ba lần, \(5\) xuất hiện hai lần, còn các giá trị khác chỉ xuất hiện một lần. Tần suất cao nhất là \(3\), chỉ riêng số \(4\) đạt được, nên mode là 4. Nếu dãy số là \(1, 1, 2, 2, 3\) thì cả \(1\) và \(2\) đều xuất hiện hai lần, tạo thành dãy hai mode (bimodal) với hai mode là \(1\) và \(2\).
Câu Hỏi Thường Gặp
Một dãy số có thể có nhiều hơn một mode không? Có. Khi hai hay nhiều giá trị cùng có tần suất cao nhất, dãy số trở thành hai mode hoặc đa mode, và tất cả các giá trị bằng nhau đó đều được liệt kê.
Nếu không có số nào lặp lại thì sao? Nếu mọi giá trị đều xuất hiện đúng một lần thì dãy số không có mode, và công cụ sẽ báo "Không có mode".
Thứ tự các con số có quan trọng không? Không. Mode chỉ phụ thuộc vào số lần xuất hiện của mỗi giá trị, không liên quan đến vị trí của chúng trong dãy.