1 정의
두 요인 \(A\) (수준 \(a\)), \(B\) (수준 \(b\)) 의 levels 조합으로 \(a \times b\) 개 셀(group) 을 구성하고, 각 셀에 무작위 배정된 피험자의 응답을 비교하는 between-subjects 설계이다.
자유도 분해 (등표본 가정): \[ df_{\text{between}} = ab - 1 = (a-1) + (b-1) + (a-1)(b-1) \] \[ \quad\,\,\quad= df_A + df_B + df_{A \times B} \]
Maxwell Ch.7 의 사례는 \(2 \times 2\) 의 가장 단순한 형태이다. 두 요인은 각각 biofeedback (있음/없음) 과 drug therapy (있음/없음) 이며, 응답 변수는 수축기 혈압 (SBP).
| BF Present | BF Absent | Row Avg | |
|---|---|---|---|
| Drug Present | 168 | 186 | 177 |
| Drug Absent | 188 | 190 | 189 |
| Col Avg | 178 | 188 | 183 |
여기서 마진(marginal) 평균은 다른 요인의 평균을 적분(평균)한 값이며, 마진 평균의 차이가 곧 주효과(main effect) 이다.
2 왜 factorial 인가
단일 요인 설계의 한계 두 가지를 동시에 해결한다.
2.1 효율 (검정력 이득)
요인 \(A\) (4 levels) 와 \(B\) (3 levels) 를 따로 실험하면 단일 요인 설계 두 개가 필요해 표본 수가 두 배 든다. Factorial 은 같은 피험자 풀로 두 효과를 동시에 검정하므로 비용이 절반 이다. 추가로 한 요인의 검정에 다른 요인이 oddly distributed 되어 있어도 무작위 배정 덕에 평균적으로 영향이 상쇄된다.
2.2 상호작용 발견
단일 요인 설계는 “한 요인이 다른 요인의 levels 에 따라 효과가 달라지는가” 를 묻지 못한다. Factorial 은 이 질문에 답한다 — 이것이 interaction effect 이다. Maxwell 사례에서 BF 의 SBP 강하 효과는 Drug 와 함께 쓰면 18, 단독이면 2 — 즉 두 치료법이 시너지 를 낸다는 사실은 factorial 설계 없이는 알 수 없다.
평균 효과 (main effect) 는 “average user” 에 대한 추정이다. 그러나 실제 의사결정은 “어떤 조건에서 더 효과적인가” 를 묻는다. 의료에서 약 A 가 평균적으로 효과 5 이지만 환자 유형 X 에서는 효과 15, Y 에서는 효과 -5 라면, “약 A 를 쓸까?” 는 환자 유형에 따라 답이 달라진다 (효과 수정, effect modification — 인과추론 용어). 이는 IT 의 이질적 처치효과 (HTE) 와 같은 개념이다.
3 Ch.7 의 6 단계 흐름
본 시리즈는 다음 순서로 전개된다.
3.1 1 단계 — 2×2 설계와 주효과·상호작용 (L:23251~25000)
가장 단순한 2×2 의 평균 표, 마진 평균, 주효과·상호작용의 정의. 직교 대비 \((1,1,-1,-1), (1,-1,1,-1), (1,-1,-1,1)\) 로 SS 가 가산 분해되는 구조.
3.2 2 단계 — 단순 효과와 상호작용 대비 (L:25000~26500)
상호작용이 유의할 때 follow-up 으로 simple effect (한 요인의 다른 요인 levels 별 효과) 와 interaction contrast (특정 cell 패턴) 를 검정한다.
3.3 3 단계 — Type I/II/III SS, 비직교 설계 (L:26500~28500)
표본이 셀마다 다르면 직교성이 깨져 주효과·상호작용 SS 가 가산되지 않는다. Type I (sequential), Type II (hierarchical), Type III (marginal) SS 의 정의·차이·언제 어느 것을 쓰는지.
3.4 4 단계 — Effect Size, 검정력, 표본 크기 (L:28500~30026)
\(\eta^2\), partial \(\eta^2\), Cohen’s \(f\) 의 정의와 factorial 에서의 검정력 분석. G*Power 와 statsmodels 로 표본 크기 산출.
4 핵심 수식 미리보기
4.1 셀 모형 (cell-means model)
\[ Y_{ijk} = \mu_{jk} + \varepsilon_{ijk},\quad \varepsilon_{ijk} \sim N(0, \sigma^2) \]
여기서 \(\mu_{jk}\) 는 행 \(j\), 열 \(k\) 셀의 모평균, \(i = 1, \ldots, n\) 은 셀 내 피험자.
4.2 효과 분해 (effects model)
\[ \mu_{jk} = \mu + \alpha_j + \beta_k + (\alpha\beta)_{jk} \]
제약: \(\sum_j \alpha_j = 0\), \(\sum_k \beta_k = 0\), \(\sum_j (\alpha\beta)_{jk} = \sum_k (\alpha\beta)_{jk} = 0\).
4.3 SS 분해 (등표본 직교 분해)
\[ SS_{\text{between}} = SS_A + SS_B + SS_{A \times B} \]
각 항은 자유도 \((a-1), (b-1), (a-1)(b-1)\) 의 \(F\) 검정에 사용된다.
| 효과 | \(df\) | 의미 |
|---|---|---|
| \(A\) 주효과 | \(a-1\) | 다른 요인의 평균을 적분한 \(A\) 의 효과 |
| \(B\) 주효과 | \(b-1\) | 다른 요인의 평균을 적분한 \(B\) 의 효과 |
| \(A \times B\) 상호작용 | \((a-1)(b-1)\) | \(A\) 의 효과가 \(B\) levels 에 따라 달라지는 정도 |
| within (오차) | \(ab(n-1)\) | 셀 내 변동 |
5 Maxwell 의 2×2 데이터 적용
Table 7.1, 각 셀 \(n=5\), MS_W = 62.50.
대비별 SS:
| 대비 | 계수 | \(\hat\psi\) | \(SS_\psi\) |
|---|---|---|---|
| BF 주효과 | \((+1, +1, -1, -1)\) | \((168+188) - (186+190) = -20\) | \(5 \times 400/4 = 500\) |
| Drug 주효과 | \((+1, -1, +1, -1)\) | \((168+186) - (188+190) = -24\) | \(5 \times 576/4 = 720\) |
| 상호작용 | \((+1, -1, -1, +1)\) | \((168 + 190) - (188 + 186) = -16\) | \(5 \times 256/4 = 320\) |
검증: \(SS_A + SS_B + SS_{A\times B} = 500 + 720 + 320 = 1540 = SS_{\text{between}}\). ✓
\(F\) 검정 (\(df = 1, 16\)):
| 효과 | \(F\) | \(p\) |
|---|---|---|
| BF 주효과 | \(500/62.5 = 8.00\) | \(0.012\) |
| Drug 주효과 | \(720/62.5 = 11.52\) | \(0.004\) |
| 상호작용 | \(320/62.5 = 5.12\) | \(0.038\) |
세 효과가 모두 유의. 즉 두 치료법 각각 SBP 를 낮추며, 동시에 사용하면 단순 합산 이상의 효과 (양의 시너지) 가 있다.
6 응용 분야
| 분야 | 요인 \(A\) | 요인 \(B\) | 응답 |
|---|---|---|---|
| 의약 | 약물 종류 (3) | 용량 (4) | 증상 점수 |
| 농학 | 비료 종류 (4) | 관개 빈도 (3) | 수확량 |
| 심리 | 학습 시간 | 환경 잡음 | 회상률 |
| IT (multivariate) | 버튼 색 (3) | 버튼 위치 (2) | CTR |
| ML | optimizer (4) | scheduler (3) | val accuracy |
| 마케팅 | 이메일 제목 (3) | 발송 시간 (4) | 오픈율 |
A/B Test 가 한 요인의 두 변종을 비교한다면, multivariate test (MVT) 는 두 개 이상의 요인을 동시에 시험한다. Google 의 41 가지 파란색 실험 같은 단일 요인 다수준도 factorial 의 변형이다. MVT 의 강점은 (1) 비용 절감, (2) 상호작용 발견. 예: “큰 글꼴” + “빨간 CTA” 가 각자는 미미하지만 함께 쓰면 CTR 이 크게 오를 수 있다.
다만 MVT 는 셀 수가 빠르게 증가 (3×4×2 = 24 cells) 해 셀당 표본 부족 문제가 발생한다. 이를 완화하는 fractional factorial (G-MON3-6, G-MON4) 와 response surface (G-MON7) 가 후속 시리즈에서 다뤄진다.
7 가정과 한계
- 셀 내 정규성·등분산성·독립성: 표준 ANOVA 가정.
- 셀 표본 크기 균등: 등표본일 때만 SS 가 직교 분해된다. 불균등이면 Type I/II/III SS 구분 (G-MAX7-3) 이 필요하다.
- 고정 효과 가정 (이번 챕터): 두 요인의 levels 가 모두 연구자가 선택한 고정값. 무작위 levels (예: 무작위 표본의 학교) 는 random effects 로 다뤄야 한다 (G-MAX10).
- 두 요인의 직교 배정: 모든 \(a \times b\) 조합에 피험자가 있어야 한다. 일부 셀이 비면 incomplete factorial 또는 nested design 으로 분류된다.
8 본 시리즈의 학습 흐름
Phase A (ANOVA 모형 비교)
│
▼
G-MAX7-0 ── overview (현재 글)
│
▼
G-MAX7-1 ── 2×2 설계, 주효과 vs 상호작용
│
▼
G-MAX7-2 ── 단순 효과, 상호작용 대비 (post-hoc)
│
▼
G-MAX7-3 ── Type I/II/III SS, 비직교 설계
│
▼
G-MAX7-4 ── effect size, 검정력, 표본 크기
│
▼
G-MAX8 (Higher-Order Factorial: 2×2×2)
G-MON3 (Factorial 정통, 3 수준, 부분실시법)
9 관련 주제
선행 지식
- Phase A — Fisher 전통과 ANOVA 모형 비교
- A-MAX3 — One-Way ANOVA Model Comparison (작성 예정)
- G-MAX6 — Trend Analysis
후속 주제
- G-MAX7-1: 2×2 설계와 주효과·상호작용
- G-MAX8 — Higher-Order Factorial (작성 예정)
- G-MON3 — Factorial Experiments (작성 예정)
다른 카테고리 연결
- Causal Inference — 효과 수정과 상호작용 — 인과 lens 에서의 interaction
- AB Test — 다중 비교 실험 — IT 의 multivariate testing 사례