체바 정리

체바 정리(Chébychev's theorem)는 확률론과 통계학에서 중요한 결과 중 하나로, 임의의 확률 분포에 대해 그 분포의 평균과 표준 편차를 활용하여 데이터의 분포 특성을 설명하고, 특정 범위 내에 값이 존재할 확률에 대한 하한을 제공한다.

정리는 다음과 같이 서술된다: 주어진 확률 변수 X의 기대값(평균)을 μ, 표준 편차를 σ라고 할 때, 모든 양의 정수 k에 대해 확률 변수 X가 평균 μ로부터 k배의 표준 편차 σ 이내에 있을 확률 P는 다음과 같은 부등식으로 표현된다.

P(|X - μ| < kσ) ≥ 1 - (1/k²)

이 정리는 확률 분포가 무엇이든지 상관없이 성립하며, 이는 체바 정리가 확률의 특성을 일반화한 결과임을 의미한다. 예를 들어, k=2일 때, 기대값으로부터 2배의 표준 편차 이내에 위치하는 데이터의 비율은 최소 75% 이상임을 보여준다.

체바 정리는 특정한 형태의 분포에 의존하지 않는다는 점에서 다른 통계 정리들, 예를 들어 정규 분포에 대한 결과와는 차별화된다. 따라서, 데이터의 분포에 대한 구체적인 정보가 없거나 분포가 비대칭적이거나 극단적일 경우에도 유용하게 활용될 수 있다. 이 정리는 특히 공학, 경제학, 생물학 등 다양한 분야에서 데이터의 변동성을 이해하고 해석하는 데 중요한 도구로 사용된다.