Công cụ này làm được gì
Công cụ này tính ba đại lượng cốt lõi đo khuynh hướng tập trung của bất kỳ dãy số nào: trung bình (mean — trung bình cộng), trung vị (median — giá trị nằm giữa) và yếu vị (mode — giá trị xuất hiện nhiều nhất). Ngoài ra, công cụ còn cho biết số lượng phần tử, tổng và khoảng biến thiên, giúp bạn có ngay một bức tranh thống kê tổng quan về tập dữ liệu. Bạn có thể dùng cho điểm số, điểm thi, giá cả, số liệu đo đạc, kết quả khảo sát hay bất cứ dữ liệu dạng số nào.
Cách sử dụng
Hãy nhập các con số vào ô nhập liệu, ngăn cách bằng dấu phẩy hoặc khoảng trắng — ví dụ 4, 8, 15, 16, 23, 42. Bạn có thể dùng số thập phân và số âm. Bấm tính toán, công cụ sẽ sắp xếp các giá trị, cộng lại và trả về từng chỉ số ngay lập tức. Bạn cũng có thể dán cả một cột dữ liệu dài sao chép từ bảng tính; các khoảng trắng và dấu xuống dòng thừa sẽ được xử lý tự động.
Giải thích các công thức
Trung bình là tổng của tất cả giá trị chia cho số lượng giá trị: $$\text{Mean} = \frac{\sum_{i=1}^{n} x_i}{n}, \quad x_i \in \text{Numbers}$$ Trung vị được tìm bằng cách sắp xếp các số theo thứ tự rồi lấy số ở giữa; khi có số lượng giá trị là số chẵn, trung vị là trung bình cộng của hai giá trị nằm giữa. Yếu vị là giá trị xuất hiện thường xuyên nhất. Một tập dữ liệu có thể có một yếu vị, nhiều yếu vị (đa yếu vị) hoặc không có yếu vị nào khi mọi giá trị đều khác nhau.
Ví dụ minh họa
Lấy dãy số 2, 4, 4, 6, 9. Tổng là \(2 + 4 + 4 + 6 + 9 = 25\), có 5 giá trị, nên trung bình là \(25 \div 5 = 5\). Sau khi sắp xếp, giá trị ở giữa (thứ 3) là 4, vậy trung vị bằng 4. Giá trị 4 xuất hiện hai lần — nhiều hơn bất kỳ số nào khác — nên yếu vị là 4. Khoảng biến thiên là \(9 - 2 = 7\).
Diễn Giải Kết Quả Của Bạn
Ba thước đo xu hướng trung tâm trả lời cùng một câu hỏi rộng — "giá trị điển hình là gì?" — nhưng chúng phản ứng khác nhau với hình dạng dữ liệu của bạn, vì vậy đọc chúng cùng nhau sẽ mang lại thông tin nhiều hơn so với đọc bất kỳ cái nào một mình.
Khi giá trị trung bình và trung vị khác nhau
Trong một tập dữ liệu hoàn toàn đối xứng, giá trị trung bình và trung vị bằng nhau. Khi chúng tách biệt, khoảng cách báo hiệu độ lệch: nếu giá trị trung bình lớn hơn trung vị đáng kể, một vài giá trị bất thường cao (lệch phải, hoặc các giá trị ngoại lệ cao) đang kéo mức trung bình lên; nếu giá trị trung bình nhỏ hơn trung vị, các giá trị thấp đang kéo nó xuống (lệch trái). Vì giá trị trung bình cộng từng giá trị, một quan sát cực đoan duy nhất có thể thay đổi nó đáng kể, trong khi trung vị — giữa danh sách được sắp xếp — hầu như không di chuyển. Đối với dữ liệu lệch như thu nhập, giá nhà hoặc thời gian phản hồi, trung vị thường là giá trị "điển hình" đại diện hơn.
Khi kết quả đa mốt báo hiệu các nhóm con
Mốt là giá trị xuất hiện thường xuyên nhất. Một mốt rõ ràng duy nhất cho thấy dữ liệu tập hợp quanh một tâm. Hai hay nhiều mốt (kết quả nhị mốt hoặc đa mốt) thường có nghĩa là tập dữ liệu thực sự trộn lẫn các nhóm riêng biệt — ví dụ điểm kiểm tra từ hai lớp khác nhau, hoặc các phép đo được thực hiện dưới hai điều kiện khác nhau. Khi điều đó xảy ra, một giá trị trung bình hoặc trung vị duy nhất có thể mô tả một giá trị không thực sự điển hình của bất kỳ nhóm nào, vì vậy cần kiểm tra xem dữ liệu có nên được chia tách và phân tích riêng biệt hay không.
Cách khoảng biến thiên cho biết sự phân tán
Khoảng biến thiên là giá trị lớn nhất trừ giá trị nhỏ nhất, vì vậy nó nắm bắt toàn bộ chiều rộng của dữ liệu trong một số. Một khoảng nhỏ so với giá trị trung bình cho biết các giá trị được tập hợp chặt chẽ; một khoảng lớn cho biết sự phân tán lớn hơn hoặc sự hiện diện của các giá trị ngoại lệ. Khoảng biến thiên chỉ sử dụng hai điểm cực đoan nhất, vì vậy nó nhạy cảm với các giá trị ngoại lệ và không nói gì về cách phân bố các giá trị giữa chúng — kết hợp nó với độ lệch chuẩn hoặc phương sai khi bạn cần một bức tranh hoàn chỉnh hơn về sự phân tán.
Phần này chỉ giải thích cách diễn giải thống kê tiêu chuẩn và không phải là lời khuyên cá nhân, tài chính hoặc chuyên nghiệp.
Cách Giá Trị Trung Bình, Trung Vị và Mốt So Sánh Giữa Các Tập Dữ Liệu
Bốn tập dữ liệu dưới đây mỗi cái chứa một số giá trị tương tự nhưng có hình dạng khác nhau. Lưu ý cách giá trị trung bình theo dõi trung vị đối với dữ liệu đối xứng nhưng tách biệt khỏi nó sau khi một giá trị ngoại lệ hoặc độ lệch được giới thiệu, trong khi mốt làm nổi bật sự lặp lại và tập hợp.
| Tập dữ liệu | Giá trị | Giá trị trung bình | Trung vị | Mốt | Khoảng biến thiên |
|---|---|---|---|---|---|
| Đối xứng | 4, 5, 6, 7, 8 | 6 | 6 | không | 4 |
| Lệch phải (giá trị ngoại lệ cao) | 4, 5, 6, 7, 80 | 20.4 | 6 | không | 76 |
| Nhị mốt (hai nhóm con) | 2, 2, 2, 9, 9, 9 | 5.5 | 5.5 | 2 và 9 | 7 |
| Tất cả duy nhất | 3, 11, 14, 22, 30 | 16 | 14 | không | 27 |
Trong tập dữ liệu lệch phải, thay thế giá trị 8 bằng 80 để trung vị không thay đổi ở 6 nhưng nâng giá trị trung bình lên 20.4 — một minh chứng rõ ràng về cách một giá trị ngoại lệ làm biến dạng mức trung bình trong khi trung vị vẫn mạnh mẽ. Tập dữ liệu nhị mốt trả về hai mốt, là manh mối thống kê cho thấy hai cụm (mỗi cụm tập trung vào 2 và vào 9) đã được kết hợp. Tập dữ liệu tất cả duy nhất hoàn toàn không có mốt, vì không có giá trị nào lặp lại.
Định Nghĩa & Thuật Ngữ
- Giá trị trung bình (trung bình cộng)
- Tổng của tất cả các giá trị chia cho số lượng giá trị, \(\bar{x} = \frac{\sum x_i}{n}\). Sử dụng từng giá trị, vì vậy nó nhạy cảm với các giá trị ngoại lệ.
- Trung vị
- Giá trị ở giữa khi dữ liệu được sắp xếp theo thứ tự. Với số lượng chẵn, nó là trung bình của hai giá trị trung tâm. Phần lớn không bị ảnh hưởng bởi các giá trị cực đoan.
- Mốt
- Giá trị (hoặc các giá trị) xuất hiện thường xuyên nhất. Một tập dữ liệu có thể có một mốt, nhiều mốt, hoặc không có nếu mọi giá trị đều duy nhất.
- Xu hướng trung tâm
- Một giá trị duy nhất tóm tắt tâm hoặc mức "điển hình" của một tập dữ liệu; giá trị trung bình, trung vị và mốt là ba thước đo phổ biến.
- Đa mốt
- Có nhiều hơn một mốt. Hai mốt được gọi là nhị mốt; dữ liệu đa mốt thường cho biết sự pha trộn của các nhóm con riêng biệt.
- Khoảng biến thiên
- Sự khác biệt giữa giá trị lớn nhất và nhỏ nhất, \(\text{khoảng biến thiên} = x_{\max} - x_{\min}\); một thước đo đơn giản của sự phân tán tổng thể.
- Số lượng (n)
- Số lượng giá trị trong tập dữ liệu — ước số được sử dụng khi tính toán giá trị trung bình.
- Tổng
- Tổng số thu được bằng cách cộng tất cả các giá trị lại với nhau, \(\sum x_i\); tử số của giá trị trung bình.
- Giá trị ngoại lệ
- Một giá trị nằm xa phần còn lại của dữ liệu. Các giá trị ngoại lệ ảnh hưởng mạnh mẽ đến giá trị trung bình và khoảng biến thiên nhưng có ít ảnh hưởng đến trung vị.
- Dữ liệu được sắp xếp / dữ liệu có thứ tự
- Các giá trị được sắp xếp từ nhỏ nhất đến lớn nhất. Sắp xếp theo thứ tự là bắt buộc để xác định vị trí trung vị và để đọc giá trị tối thiểu và tối đa cho khoảng biến thiên.
Câu hỏi thường gặp
Nếu dữ liệu của tôi không có giá trị nào lặp lại thì sao? Khi đó không có yếu vị, và công cụ sẽ hiển thị "Không có yếu vị".
Có thể có nhiều hơn một yếu vị không? Có. Nếu hai hay nhiều giá trị cùng đạt tần suất xuất hiện cao nhất, tất cả các giá trị đó đều được liệt kê là yếu vị.
Nên dùng loại trung bình nào? Trung bình phù hợp nhất với dữ liệu cân đối, nhưng trung vị lại đáng tin cậy hơn khi có các giá trị ngoại lai cực đoan, bởi nó không bị kéo lệch về phía những con số quá lớn hoặc quá nhỏ.