최빈값이란?
최빈값(mode)은 데이터에서 가장 자주 나타나는 값을 말합니다. 평균(mean)이나 중앙값(median)과 달리, 최빈값은 오로지 '빈도'에만 초점을 둡니다. 또한 숫자 데이터뿐 아니라 범주형 데이터에도 적용할 수 있는 유일한 대푯값으로, 어떤 항목이 가장 흔하거나 인기 있는지를 파악할 때 유용합니다.
계산기 사용법
입력란에 숫자를 쉼표나 공백으로 구분해 입력하세요. 예를 들어 2, 4, 4, 4, 6, 6, 9처럼요. 계산 버튼을 누르면 각 값이 몇 번 나오는지 세어, 가장 많이 등장한 값과 그 빈도, 최빈값의 개수, 그리고 입력한 전체 값의 개수를 알려줍니다.
공식 살펴보기
수학적으로 최빈값은 빈도 함수 f(x)를 최대로 만드는 값 x입니다.
$$\text{Mode} = \underset{x \,\in\, \text{Numbers}}{\arg\max}\; \operatorname{freq}(x)$$
가장 높은 빈도를 가진 값이 둘 이상이면 그 데이터는 다봉형(multimodal)이며, 해당 값들이 모두 최빈값이 됩니다. 반대로 모든 값이 똑같은 횟수(각각 한 번씩)만 나타난다면 그 데이터에는 최빈값이 없습니다.
예제로 이해하기
2, 4, 4, 4, 6, 6, 9 데이터를 살펴봅시다. 값 4는 세 번, 6은 두 번 나오고, 2와 9는 각각 한 번씩 등장합니다. 가장 높은 빈도는 \(3\)이고 이를 달성한 값은 \(4\)뿐이므로 최빈값은 4입니다. 전체 값은 7개이고 최빈값은 정확히 하나입니다.
자주 묻는 질문
최빈값이 두 개 이상일 수도 있나요? 네. 여러 값이 가장 높은 빈도를 똑같이 가지면 그 데이터는 이봉형(최빈값 2개)이거나 다봉형(그 이상)이 되며, 빈도가 같은 모든 값이 함께 표시됩니다.
반복되는 값이 하나도 없으면 어떻게 되나요? 모든 값이 한 번씩만 나타나면 최빈값은 없습니다. 어느 값도 가장 자주 나온다고 두드러지지 않기 때문입니다.
최빈값은 반드시 숫자여야 하나요? 이 계산기에서는 그렇습니다. 다만 개념상으로는 설문에서 가장 많은 눈동자 색깔처럼 범주형 데이터에도 최빈값을 적용할 수 있습니다.