Phân vị (percentile) là gì?
Phân vị cho bạn biết giá trị mà dưới ngưỡng đó có một tỷ lệ phần trăm quan sát nhất định trong tập dữ liệu. Chẳng hạn, phân vị thứ 75 là giá trị tách 75% dữ liệu thấp nhất khỏi 25% dữ liệu cao nhất. Phân vị được dùng rất phổ biến trong các kỳ thi chuẩn hóa, biểu đồ tăng trưởng của trẻ, so sánh mức lương (salary benchmarking) và trong thống kê nói chung.
Cách dùng công cụ này
Hãy nhập các con số của bạn, ngăn cách bằng dấu phẩy hoặc khoảng trắng, rồi nhập phân vị P mà bạn muốn tính (một số từ 0 đến 100). Công cụ sẽ tự động sắp xếp dữ liệu theo thứ tự tăng dần, tính vị trí thứ hạng và nội suy giữa hai giá trị lân cận để trả về giá trị phân vị.
Giải thích công thức
Công cụ này sử dụng phương pháp nội suy tuyến tính loại trừ (R+1) rất thông dụng. Trước tiên, nó xác định thứ hạng:
$$\text{thứ hạng} = \frac{P}{100}\,(n+1)$$trong đó \(n\) là số lượng giá trị. Nếu thứ hạng không phải số nguyên, nó nằm giữa hai điểm dữ liệu. Phần nguyên cho biết vị trí của điểm thấp hơn, còn phần thập phân \(f\) cho biết cần nội suy bao xa:
$$V = x_{\lfloor\rfloor} + f\,(x_{\lceil\rceil} - x_{\lfloor\rfloor})$$Thứ hạng nhỏ hơn hoặc bằng 1 sẽ trả về giá trị nhỏ nhất; thứ hạng lớn hơn hoặc bằng \(n\) sẽ trả về giá trị lớn nhất.
Ví dụ minh họa
Với tập dữ liệu 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 (\(n = 10\)) tại phân vị thứ 75: thứ hạng = \(0{,}75 \times 11 = 8{,}25\). Giá trị thứ 8 là 16 và giá trị thứ 9 là 18, với phần thập phân 0,25. Vậy
$$V = 16 + 0{,}25 \times (18 - 16) = 16{,}5$$Câu hỏi thường gặp
Vì sao kết quả của tôi khác với một công cụ khác? Có nhiều định nghĩa khác nhau về phân vị. Công cụ này dùng cách xếp hạng \((n+1)\) kèm nội suy; trong khi hàm PERCENTILE.INC của Excel lại dùng \((n-1)\), nên kết quả có thể chênh lệch đôi chút.
Nếu P bằng 0 hoặc 100 thì sao? P = 0 trả về giá trị nhỏ nhất, còn P = 100 trả về giá trị lớn nhất trong dữ liệu của bạn.
Tôi có cần sắp xếp dữ liệu trước không? Không cần — công cụ sẽ tự động sắp xếp các con số giúp bạn trước khi tính toán.