미디언(Median)은 통계학에서 데이터를 정렬했을 때 중앙에 위치하는 값을 의미한다. 데이터셋의 특성을 잘 나타내고 극단적인 값의 영향을 덜 받기 때문에, 평균값과 함께 중요한 중심 경향 측정 지표로 사용된다. 특히, 비대칭 분포를 가진 데이터셋에서는 평균보다 더 신뢰할 수 있는 값을 제공하는 경우가 많다.
미디언을 계산하는 방법은 데이터셋의 크기에 따라 다르다. 데이터의 개수가 홀수인 경우, 중간에 위치한 값이 미디언이 된다. 예를 들어, 정렬된 데이터셋이 {3, 5, 7}인 경우, 5가 미디언이다. 반면, 데이터의 개수가 짝수일 경우, 중간의 두 값의 평균이 미디언이 된다. 예를 들어, 데이터셋이 {2, 4, 6, 8}일 때, 4와 6의 평균인 5가 미디언이다.
미디언은 특히 소득, 부동산 가격, 시험 성적 등과 같은 경제적 또는 사회적 데이터의 분석에서 유용하다. 이러한 경우, 몇몇 개인이 비정상적으로 높은 소득을 가지고 있어 평균이 skewed 될 수 있지만, 미디언은 더 현실적인 중간 소득을 나타내게 된다. 이를 통해 정책 결정이나 사회 현상을 분석하는 데 도움이 될 수 있다.
또한, 미디언은 자료의 분포를 시각적으로 나타내는 히스토그램이나 상자 그림 상자(plot)에서 중요한 역할을 한다. 상자 그림에서는 중앙선을 통해 미디언을 명확하게 표시하고, 데이터의 분포 특성을 나타내는 데 도움을 준다. 이러한 이유로 미디언은 통계학뿐만 아니라 데이터 분석, 사회과학, 심리학 등 다양한 분야에서도 널리 활용된다.