오기열(誤記列)은 모집단의 특정 요소를 대표하는 데 사용되는 샘플 내에서 발생하는 오류나 잘못된 기입이 포함된 데이터의 일종이다. 일반적으로 통계학이나 데이터 과학 분야에서 다루어지는 개념으로, 샘플링 과정에서 잘못된 정보가 포함되거나 집계된 데이터가 정확하지 않은 경우 발생한다.
오기열은 원본 데이터와의 불일치로 나타나며, 이는 데이터 분석이나 연구 결과에 영향을 미칠 수 있다. 이러한 오류는 조사 설계, 데이터 수집 과정, 데이터 입력, 처리 및 분석 단계에서 생길 수 있다. 예를 들어, 설문 조사에서 응답자가 잘못된 정보를 제공하거나 설문지를 잘못 이해할 경우, 또는 데이터 입력 시 실수가 발생할 수 있다.
하기열이 존재할 경우, 결과적으로 도출되는 통계적 결론이나 예측이 신뢰할 수 없게 되며, 이는 의사 결정 과정에 부정적인 영향을 미칠 수 있다. 따라서 오기열을 식별하고 수정하는 과정은 데이터 분석에서 매우 중요한 단계다. 데이터 클렌징(data cleaning) 또는 데이터 검증(data validation) 절차를 통해 오기열을 최소화하고 데이터의 품질을 높일 수 있다.
통계적 방법론에서는 오기열을 식별하고 조정할 수 있는 다양한 기법들이 존재하며, 예를 들어, 이상치(outlier) 탐지, 신뢰 구간 설정 및 제어 차트(control chart) 등을 활용할 수 있다. 이러한 기법들은 데이터의 신뢰성을 높이고 결과의 정확성을 보장하는 데 기여한다.