Kwangmin Kim - ANCOVA 개관 — 공변량으로 분산 감소·편향 보정

1 정의

정의: Analysis of Covariance (ANCOVA)

ANOVA 모형에 공변량 (covariate) 을 추가하여 공변량의 선형 효과를 통제한 후 처치 효과를 검정하는 분석법이다.

\[ Y_{ij} = \mu + \alpha_j + \beta(X_{ij} - \bar X) + \varepsilon_{ij} \]

\(\alpha_j\): 처치 효과
\(X_{ij}\): 공변량 (처치 전 측정 또는 처치와 무관한 변수)
\(\beta\): 공변량의 선형 회귀 계수 (모든 처치군에 공통 — 회귀 동질성 가정)
\(\varepsilon_{ij}\): 오차

핵심: \(X\) 가 \(Y\) 와 상관이 있을수록 ANCOVA 의 검정력이 ANOVA 보다 우수하다.

2 두 가지 동기

2.1 동기 1 — 분산 감소 (Variance Reduction)

\(X\) 와 \(Y\) 의 상관 \(\rho\) 가 클수록 공변량을 통제한 후의 잔차 분산은 작아진다.

\[ \sigma^2_{Y | X} = \sigma^2_Y (1 - \rho^2) \]

검정력은 \(\sigma^2\) 에 반비례 (Cohen’s \(f^2 \propto 1/\sigma^2\)) 이므로:

\(\rho\)	분산 감소 비율	등가 표본 절약
0.3	9%	11%
0.5	25%	33%
0.7	49%	96%
0.9	81%	426%

직관: 공변량은 잡음의 일부를 설명한다

\(Y\) 의 변동 중 일부는 처치 효과 (signal) 이고 나머지는 개인차·외부 요인 (noise) 이다. 공변량 \(X\) (예: pre-treatment baseline) 가 \(Y\) 의 noise 를 일부 설명한다면, 그 부분을 빼고 남은 잔차에서 처치 효과를 검정하면 신호 대 잡음비가 올라간다. 이는 IT 의 CUPED (Controlled-experiment Using Pre-Experiment Data) 의 정확한 통계적 표현이다.

2.2 동기 2 — Baseline Imbalance 보정

무작위 배정에도 작은 표본에서는 baseline (pre-treatment) 변수가 그룹 간 우연히 다를 수 있다. 큰 표본 RCT 에서는 거의 0 이지만, \(n=10\) 그룹에서는 baseline 평균이 5 점 차이 나는 일이 발생할 수 있다. ANCOVA 는 이 우연 차이를 통계적으로 보정한다.

비무작위 (관찰) 연구에서는 baseline imbalance 가 systematic (확률적이 아닌 구조적 편향). 이 경우 ANCOVA 는 일부 보정에 도움이 되지만 선택 편향 (selection bias) 을 완전히 해결하지 못한다 — 매칭, IPTW, RDD 등 인과추론 도구가 필요.

3 Ch.9 의 4 단계 흐름

3.1 1 단계 — Linear Model + Homogeneity of Regression (G-MAX9-1)

ANCOVA 의 모형, 회귀 동질성 (homogeneity of regression slopes) 가정, 모형 비교. 가정 위반 시 결과 해석.

3.2 2 단계 — Adjusted Means + Lord’s Paradox (G-MAX9-2)

처치별 보정 평균 (adjusted means) 의 정의, Lord’s paradox (ANCOVA 결론과 change score 결론이 다를 때) 의 의미.

3.3 3 단계 — Change Score / Residual ANOVA + Blocking (G-MAX9-3)

ANCOVA 의 대안: change score, residual ANOVA, blocking. 각각의 적용 조건과 함정.

3.4 4 단계 — Overview (이 글)

4 모형 비교

모형	식	자유도
Null	\(Y_{ij} = \mu + \varepsilon_{ij}\)	\(N-1\)
ANOVA	\(Y_{ij} = \mu + \alpha_j + \varepsilon_{ij}\)	\(N-a\)
Regression on \(X\)	\(Y_{ij} = \mu + \beta X_{ij} + \varepsilon_{ij}\)	\(N-2\)
ANCOVA	\(Y_{ij} = \mu + \alpha_j + \beta(X_{ij} - \bar X) + \varepsilon_{ij}\)	\(N - a - 1\)
ANCOVA + interaction	\(Y_{ij} = \mu + \alpha_j + \beta_j (X_{ij} - \bar X) + \varepsilon_{ij}\)	\(N - 2a\)

ANCOVA 의 처치 효과 검정 = ANCOVA vs Regression on \(X\) 의 모형 비교. - \(SS_{\text{treatment} | X} = E_{\text{Reg}} - E_{\text{ANCOVA}}\), 자유도 \(a-1\). - \(F = (SS_{\text{treatment} | X} / (a-1)) / MS_W^{\text{ANCOVA}}\).

회귀 동질성 검정 = ANCOVA + interaction vs ANCOVA 의 비교.

5 가상 데이터 — Maxwell SBP 사례 확장

3 그룹 (treatment A, B, control), 각 \(n=10\), baseline SBP \(X\) 를 공변량으로.

	A	B	Control
baseline \(\bar X_j\)	165	158	162
post \(\bar Y_j\)	145	152	160

ANOVA 만 하면 그룹 평균 차이로 처치 효과 추정. baseline 의 우연 차이가 결과 평균에 섞여 들어간다.

ANCOVA: baseline 을 공통 grand mean (\(\bar X = 161.7\)) 으로 보정한 평균 (adjusted means) 을 비교.

\[ \bar Y_j^{\text{adj}} = \bar Y_j - \hat\beta (\bar X_j - \bar X) \]

가설: \(\hat\beta = 0.5\) (baseline 1 점 ↑ → post 0.5 점 ↑).

	\(\bar Y_j\)	\(\bar X_j - \bar X\)	adj
A	145	3.3	\(145 - 0.5(3.3) = 143.4\)
B	152	-3.7	\(152 - 0.5(-3.7) = 153.9\)
Control	160	0.3	\(160 - 0.5(0.3) = 159.9\)

보정 후에는 baseline 의 우연 차이가 제거되어 처치 효과의 정확한 추정 가능.

6 회귀 동질성 가정

ANCOVA 는 모든 처치군이 같은 기울기 \(\beta\) 를 가진다고 가정. 위반 시: - 그룹 × 공변량 상호작용이 존재 — 즉 baseline 이 높은 환자에서 처치 효과가 더 (작게/크게) - 처치 효과가 baseline 에 따라 달라짐 (HTE) - 단일 보정 평균으로 효과를 요약할 수 없음 — Johnson-Neyman 절차 또는 baseline 별 separate analysis 필요

함정: 회귀 동질성 검정의 검정력 한계

회귀 동질성 검정은 자유도가 \(a-1\) 의 단일 자유도들이라 검정력이 약하다. 비유의가 “동질성 만족” 을 보장하지 않는다. 시각적 점검 (그룹별 \(X\) 대 \(Y\) scatterplot 위에 회귀선 fit) 을 항상 함께 한다. 기울기가 명백히 다르게 보이면 ANCOVA 의 결과를 신뢰 하지 말고 alternative analysis (G-MAX9-3) 로 진행.

7 IT 매핑 — CUPED

Deng et al. (2013) 의 CUPED (Controlled-experiment Using Pre-Experiment Data) 는 ANCOVA 의 IT 적용이다. 차이는:

	ANCOVA (Maxwell)	CUPED (Kohavi)
공변량	baseline 측정 (처치 직전)	pre-experiment data (실험 시작 전 동일 사용자의 동일 메트릭)
보정	\(Y - \beta X\) 의 회귀 잔차	\(Y_{\text{adjusted}} = Y - \theta (X - \bar X)\), \(\theta\) 는 사전 추정
분산 감소	\(\rho^2\) 비율	동일
가정	회귀 동질성	동질성 + 시간 안정성 (pre/post 의 \(\beta\) 가 같다)

CUPED 는 디지털 실험에서 50%+ 분산 감소를 흔히 달성. 표본 절약·실험 기간 단축에 큰 영향. 자세한 내용은 Phase F (Trustworthy Online Controlled Experiments — Kohavi) 또는 Variance Reduction 시리즈 참조.

8 적용 영역

분야	응답 \(Y\)	공변량 \(X\)
임상	post-treatment 점수	baseline 점수
교육	사후 시험 점수	사전 시험 점수, IQ
농학	수확량	토양 비옥도, 종자 무게
IT	conversion rate	사전 7 일 평균 conversion
마케팅	구매액	과거 구매 이력 평균
ML	val accuracy (특정 시점)	동일 모델의 이전 epoch accuracy

9 가정과 한계

회귀 동질성: 위반 시 ANCOVA 부적절.
공변량의 처치 전 측정: 처치 후 측정 변수를 공변량으로 사용하면 처치 효과 일부가 공변량에 흡수되어 처치 효과가 과소 추정 (post-treatment confounder).
공변량과 처치의 독립: 무작위 배정 RCT 에서는 자동 만족. 관찰 연구에서는 selection bias 의 위험.
선형성: 공변량 효과가 비선형이면 다항식 항 추가 또는 변환.

10 MAX Ch.9 시리즈 흐름

G-MAX9-0  ANCOVA 개관 (현재 글)
    ↓
G-MAX9-1  Linear Model + Homogeneity of Regression
    ↓
G-MAX9-2  Adjusted Means + Lord's Paradox
    ↓
G-MAX9-3  Change Score / Residual ANOVA + Blocking
    ↓
G-MAX10 (Random/Nested), G-MON8 (ANCOVA·Transformation)

11 관련 주제

선행 지식

후속 주제

G-MAX9-1: ANCOVA 모형과 회귀 동질성
G-MON8 — ANCOVA·Transformation (작성 예정)

다른 카테고리 연결

Causal Inference — 교란
Variance Reduction — CUPED (placeholder)
Statistics — SLR BLUE