1 정의
ANOVA 모형에 공변량 (covariate) 을 추가하여 공변량의 선형 효과를 통제한 후 처치 효과를 검정하는 분석법이다.
\[ Y_{ij} = \mu + \alpha_j + \beta(X_{ij} - \bar X) + \varepsilon_{ij} \]
- \(\alpha_j\): 처치 효과
- \(X_{ij}\): 공변량 (처치 전 측정 또는 처치와 무관한 변수)
- \(\beta\): 공변량의 선형 회귀 계수 (모든 처치군에 공통 — 회귀 동질성 가정)
- \(\varepsilon_{ij}\): 오차
핵심: \(X\) 가 \(Y\) 와 상관이 있을수록 ANCOVA 의 검정력이 ANOVA 보다 우수하다.
2 두 가지 동기
2.1 동기 1 — 분산 감소 (Variance Reduction)
\(X\) 와 \(Y\) 의 상관 \(\rho\) 가 클수록 공변량을 통제한 후의 잔차 분산은 작아진다.
\[ \sigma^2_{Y | X} = \sigma^2_Y (1 - \rho^2) \]
검정력은 \(\sigma^2\) 에 반비례 (Cohen’s \(f^2 \propto 1/\sigma^2\)) 이므로:
| \(\rho\) | 분산 감소 비율 | 등가 표본 절약 |
|---|---|---|
| 0.3 | 9% | 11% |
| 0.5 | 25% | 33% |
| 0.7 | 49% | 96% |
| 0.9 | 81% | 426% |
\(Y\) 의 변동 중 일부는 처치 효과 (signal) 이고 나머지는 개인차·외부 요인 (noise) 이다. 공변량 \(X\) (예: pre-treatment baseline) 가 \(Y\) 의 noise 를 일부 설명한다면, 그 부분을 빼고 남은 잔차에서 처치 효과를 검정하면 신호 대 잡음비가 올라간다. 이는 IT 의 CUPED (Controlled-experiment Using Pre-Experiment Data) 의 정확한 통계적 표현이다.
2.2 동기 2 — Baseline Imbalance 보정
무작위 배정에도 작은 표본에서는 baseline (pre-treatment) 변수가 그룹 간 우연히 다를 수 있다. 큰 표본 RCT 에서는 거의 0 이지만, \(n=10\) 그룹에서는 baseline 평균이 5 점 차이 나는 일이 발생할 수 있다. ANCOVA 는 이 우연 차이를 통계적으로 보정한다.
비무작위 (관찰) 연구에서는 baseline imbalance 가 systematic (확률적이 아닌 구조적 편향). 이 경우 ANCOVA 는 일부 보정에 도움이 되지만 선택 편향 (selection bias) 을 완전히 해결하지 못한다 — 매칭, IPTW, RDD 등 인과추론 도구가 필요.
3 Ch.9 의 4 단계 흐름
3.1 1 단계 — Linear Model + Homogeneity of Regression (G-MAX9-1)
ANCOVA 의 모형, 회귀 동질성 (homogeneity of regression slopes) 가정, 모형 비교. 가정 위반 시 결과 해석.
3.2 2 단계 — Adjusted Means + Lord’s Paradox (G-MAX9-2)
처치별 보정 평균 (adjusted means) 의 정의, Lord’s paradox (ANCOVA 결론과 change score 결론이 다를 때) 의 의미.
3.3 3 단계 — Change Score / Residual ANOVA + Blocking (G-MAX9-3)
ANCOVA 의 대안: change score, residual ANOVA, blocking. 각각의 적용 조건과 함정.
3.4 4 단계 — Overview (이 글)
4 모형 비교
| 모형 | 식 | 자유도 |
|---|---|---|
| Null | \(Y_{ij} = \mu + \varepsilon_{ij}\) | \(N-1\) |
| ANOVA | \(Y_{ij} = \mu + \alpha_j + \varepsilon_{ij}\) | \(N-a\) |
| Regression on \(X\) | \(Y_{ij} = \mu + \beta X_{ij} + \varepsilon_{ij}\) | \(N-2\) |
| ANCOVA | \(Y_{ij} = \mu + \alpha_j + \beta(X_{ij} - \bar X) + \varepsilon_{ij}\) | \(N - a - 1\) |
| ANCOVA + interaction | \(Y_{ij} = \mu + \alpha_j + \beta_j (X_{ij} - \bar X) + \varepsilon_{ij}\) | \(N - 2a\) |
ANCOVA 의 처치 효과 검정 = ANCOVA vs Regression on \(X\) 의 모형 비교. - \(SS_{\text{treatment} | X} = E_{\text{Reg}} - E_{\text{ANCOVA}}\), 자유도 \(a-1\). - \(F = (SS_{\text{treatment} | X} / (a-1)) / MS_W^{\text{ANCOVA}}\).
회귀 동질성 검정 = ANCOVA + interaction vs ANCOVA 의 비교.
5 가상 데이터 — Maxwell SBP 사례 확장
3 그룹 (treatment A, B, control), 각 \(n=10\), baseline SBP \(X\) 를 공변량으로.
| A | B | Control | |
|---|---|---|---|
| baseline \(\bar X_j\) | 165 | 158 | 162 |
| post \(\bar Y_j\) | 145 | 152 | 160 |
ANOVA 만 하면 그룹 평균 차이로 처치 효과 추정. baseline 의 우연 차이가 결과 평균에 섞여 들어간다.
ANCOVA: baseline 을 공통 grand mean (\(\bar X = 161.7\)) 으로 보정한 평균 (adjusted means) 을 비교.
\[ \bar Y_j^{\text{adj}} = \bar Y_j - \hat\beta (\bar X_j - \bar X) \]
가설: \(\hat\beta = 0.5\) (baseline 1 점 ↑ → post 0.5 점 ↑).
| \(\bar Y_j\) | \(\bar X_j - \bar X\) | adj | |
|---|---|---|---|
| A | 145 | 3.3 | \(145 - 0.5(3.3) = 143.4\) |
| B | 152 | -3.7 | \(152 - 0.5(-3.7) = 153.9\) |
| Control | 160 | 0.3 | \(160 - 0.5(0.3) = 159.9\) |
보정 후에는 baseline 의 우연 차이가 제거되어 처치 효과의 정확한 추정 가능.
6 회귀 동질성 가정
ANCOVA 는 모든 처치군이 같은 기울기 \(\beta\) 를 가진다고 가정. 위반 시: - 그룹 × 공변량 상호작용이 존재 — 즉 baseline 이 높은 환자에서 처치 효과가 더 (작게/크게) - 처치 효과가 baseline 에 따라 달라짐 (HTE) - 단일 보정 평균으로 효과를 요약할 수 없음 — Johnson-Neyman 절차 또는 baseline 별 separate analysis 필요
회귀 동질성 검정은 자유도가 \(a-1\) 의 단일 자유도들이라 검정력이 약하다. 비유의가 “동질성 만족” 을 보장하지 않는다. 시각적 점검 (그룹별 \(X\) 대 \(Y\) scatterplot 위에 회귀선 fit) 을 항상 함께 한다. 기울기가 명백히 다르게 보이면 ANCOVA 의 결과를 신뢰 하지 말고 alternative analysis (G-MAX9-3) 로 진행.
7 IT 매핑 — CUPED
Deng et al. (2013) 의 CUPED (Controlled-experiment Using Pre-Experiment Data) 는 ANCOVA 의 IT 적용이다. 차이는:
| ANCOVA (Maxwell) | CUPED (Kohavi) | |
|---|---|---|
| 공변량 | baseline 측정 (처치 직전) | pre-experiment data (실험 시작 전 동일 사용자의 동일 메트릭) |
| 보정 | \(Y - \beta X\) 의 회귀 잔차 | \(Y_{\text{adjusted}} = Y - \theta (X - \bar X)\), \(\theta\) 는 사전 추정 |
| 분산 감소 | \(\rho^2\) 비율 | 동일 |
| 가정 | 회귀 동질성 | 동질성 + 시간 안정성 (pre/post 의 \(\beta\) 가 같다) |
CUPED 는 디지털 실험에서 50%+ 분산 감소를 흔히 달성. 표본 절약·실험 기간 단축에 큰 영향. 자세한 내용은 Phase F (Trustworthy Online Controlled Experiments — Kohavi) 또는 Variance Reduction 시리즈 참조.
8 적용 영역
| 분야 | 응답 \(Y\) | 공변량 \(X\) |
|---|---|---|
| 임상 | post-treatment 점수 | baseline 점수 |
| 교육 | 사후 시험 점수 | 사전 시험 점수, IQ |
| 농학 | 수확량 | 토양 비옥도, 종자 무게 |
| IT | conversion rate | 사전 7 일 평균 conversion |
| 마케팅 | 구매액 | 과거 구매 이력 평균 |
| ML | val accuracy (특정 시점) | 동일 모델의 이전 epoch accuracy |
9 가정과 한계
- 회귀 동질성: 위반 시 ANCOVA 부적절.
- 공변량의 처치 전 측정: 처치 후 측정 변수를 공변량으로 사용하면 처치 효과 일부가 공변량에 흡수되어 처치 효과가 과소 추정 (post-treatment confounder).
- 공변량과 처치의 독립: 무작위 배정 RCT 에서는 자동 만족. 관찰 연구에서는 selection bias 의 위험.
- 선형성: 공변량 효과가 비선형이면 다항식 항 추가 또는 변환.
10 MAX Ch.9 시리즈 흐름
G-MAX9-0 ANCOVA 개관 (현재 글)
↓
G-MAX9-1 Linear Model + Homogeneity of Regression
↓
G-MAX9-2 Adjusted Means + Lord's Paradox
↓
G-MAX9-3 Change Score / Residual ANOVA + Blocking
↓
G-MAX10 (Random/Nested), G-MON8 (ANCOVA·Transformation)
11 관련 주제
선행 지식
후속 주제
- G-MAX9-1: ANCOVA 모형과 회귀 동질성
- G-MON8 — ANCOVA·Transformation (작성 예정)
다른 카테고리 연결