회귀선(回歸線, Regression Line)은 주로 통계학과 데이터 분석에서 사용되는 개념으로, 두 변수 간의 관계를 나타내는 직선이다. 회귀선은 독립변수(설명 변수)와 종속변수(반응 변수) 간의 선형적 관계를 모델링하는 데 사용되며, 주어진 데이터 포인트들에 대해 최적의 직선으로 정의된다.
회귀선의 기초는 최소제곱법(Least Squares Method)으로, 이는 실제 데이터 포인트와 회귀선 상의 예측 값 간의 수직 거리를 제곱한 값의 합을 최소화하는 직선을 찾는 방법이다. 이러한 외부의 영향을 최소화하여 회귀선은 데이터의 경향성 및 패턴을 효과적으로 나타낸다.
회귀선의 방정식은 일반적으로 다음과 같이 표현된다:
\[ y = ax + b \]
여기서 \(y\)는 종속변수, \(x\)는 독립변수, \(a\)는 기울기(slope), \(b\)는 y-절편(intercept)이다. 기울기는 독립변수의 변화에 따른 종속변수의 변화량을 나타내며, y-절편은 독립변수가 0일 때 종속변수의 값을 나타낸다.
회귀선은 데이터 분석에서 예측, 추세 분석, 인과 관계 탐색 등 다양한 목적으로 활용된다. 또한 단순선형회귀(Simple Linear Regression) 외에도 다중회귀(Multiple Regression), 비선형 회귀(Non-linear Regression) 등 다양한 형태로 확장될 수 있다.