최빈값이란?
최빈값(mode)은 데이터 집합에서 가장 자주 나타나는 값을 말합니다. 평균이나 중앙값과 달리 최빈값은 어떤 종류의 데이터에도 적용할 수 있으며, 범주형(카테고리) 자료에 사용할 수 있는 유일한 대표값입니다. 데이터에 따라 최빈값은 하나일 수도(단봉), 둘일 수도(이봉), 여러 개일 수도(다봉) 있으며, 모든 값이 똑같은 횟수만큼 나타나면 최빈값이 아예 없을 수도 있습니다.
계산기 사용 방법
입력란에 숫자를 쉼표나 공백으로 구분해 입력하세요. 예를 들어 2, 4, 4, 4, 5, 5, 7, 9처럼 입력하면 됩니다. 계산 버튼을 누르면 각 값이 몇 번 나타나는지 세어, 가장 높은 빈도를 차지한 값을 알려줍니다. 또한 최고 빈도수, 입력한 값의 전체 개수, 서로 다른 값의 개수도 함께 보여줍니다.
공식 풀이
수학적으로 최빈값은 빈도 함수 \(\operatorname{freq}(x)\), 즉 값 \(x\)가 나타난 횟수를 최대로 만드는 값 \(x\)입니다.
$$\text{Mode} = \underset{x \,\in\, \text{Numbers}}{\arg\max}\; \operatorname{freq}(x)$$여러 값이 최댓값을 공유하면 그 값들이 모두 최빈값이 됩니다. 만약 최대 빈도가 1이라면, 즉 반복되는 값이 하나도 없다면 그 데이터에는 최빈값이 존재하지 않습니다.
예제로 알아보기
2, 4, 4, 4, 5, 5, 7, 9 라는 목록을 살펴봅시다. 값 4는 세 번, 5는 두 번 나타나고, 나머지 값은 모두 한 번씩 나타납니다. 가장 높은 빈도는 3이며 이를 달성한 값은 4뿐이므로 최빈값은 4입니다. 만약 목록이 1, 1, 2, 2, 3 이라면 1과 2가 모두 두 번씩 나타나므로 최빈값이 1과 2인 이봉 분포가 됩니다.
자주 묻는 질문
최빈값이 두 개 이상일 수도 있나요? 그렇습니다. 두 개 이상의 값이 가장 높은 빈도를 공유하면 그 데이터는 이봉 또는 다봉 분포가 되며, 빈도가 같은 모든 값이 최빈값으로 표시됩니다.
반복되는 숫자가 하나도 없으면 어떻게 되나요? 모든 값이 정확히 한 번씩만 나타나면 최빈값은 존재하지 않으며, 계산기는 "최빈값 없음"으로 표시합니다.
숫자의 순서가 결과에 영향을 주나요? 아니요. 최빈값은 각 값이 몇 번 나타나는지에만 좌우되며, 목록 안에서의 위치와는 무관합니다.