Kwangmin Kim - 이원 요인 설계 개관 — 주효과·상호작용·검정력의 이득

1 정의

정의: 이원 요인 설계 (Two-Way Factorial Design)

두 요인 \(A\) (수준 \(a\)), \(B\) (수준 \(b\)) 의 levels 조합으로 \(a \times b\) 개 셀(group) 을 구성하고, 각 셀에 무작위 배정된 피험자의 응답을 비교하는 between-subjects 설계이다.

자유도 분해 (등표본 가정): \[ df_{\text{between}} = ab - 1 = (a-1) + (b-1) + (a-1)(b-1) \] \[ \quad\,\,\quad= df_A + df_B + df_{A \times B} \]

Maxwell Ch.7 의 사례는 \(2 \times 2\) 의 가장 단순한 형태이다. 두 요인은 각각 biofeedback (있음/없음) 과 drug therapy (있음/없음) 이며, 응답 변수는 수축기 혈압 (SBP).

	BF Present	BF Absent	Row Avg
Drug Present	168	186	177
Drug Absent	188	190	189
Col Avg	178	188	183

여기서 마진(marginal) 평균은 다른 요인의 평균을 적분(평균)한 값이며, 마진 평균의 차이가 곧 주효과(main effect) 이다.

2 왜 factorial 인가

단일 요인 설계의 한계 두 가지를 동시에 해결한다.

2.1 효율 (검정력 이득)

요인 \(A\) (4 levels) 와 \(B\) (3 levels) 를 따로 실험하면 단일 요인 설계 두 개가 필요해 표본 수가 두 배 든다. Factorial 은 같은 피험자 풀로 두 효과를 동시에 검정하므로 비용이 절반 이다. 추가로 한 요인의 검정에 다른 요인이 oddly distributed 되어 있어도 무작위 배정 덕에 평균적으로 영향이 상쇄된다.

2.2 상호작용 발견

단일 요인 설계는 “한 요인이 다른 요인의 levels 에 따라 효과가 달라지는가” 를 묻지 못한다. Factorial 은 이 질문에 답한다 — 이것이 interaction effect 이다. Maxwell 사례에서 BF 의 SBP 강하 효과는 Drug 와 함께 쓰면 18, 단독이면 2 — 즉 두 치료법이 시너지 를 낸다는 사실은 factorial 설계 없이는 알 수 없다.

직관: 왜 상호작용이 평균보다 중요할 수 있는가

평균 효과 (main effect) 는 “average user” 에 대한 추정이다. 그러나 실제 의사결정은 “어떤 조건에서 더 효과적인가” 를 묻는다. 의료에서 약 A 가 평균적으로 효과 5 이지만 환자 유형 X 에서는 효과 15, Y 에서는 효과 -5 라면, “약 A 를 쓸까?” 는 환자 유형에 따라 답이 달라진다 (효과 수정, effect modification — 인과추론 용어). 이는 IT 의 이질적 처치효과 (HTE) 와 같은 개념이다.

3 Ch.7 의 6 단계 흐름

본 시리즈는 다음 순서로 전개된다.

3.1 1 단계 — 2×2 설계와 주효과·상호작용 (L:23251~25000)

가장 단순한 2×2 의 평균 표, 마진 평균, 주효과·상호작용의 정의. 직교 대비 \((1,1,-1,-1), (1,-1,1,-1), (1,-1,-1,1)\) 로 SS 가 가산 분해되는 구조.

→ G-MAX7-1: 2×2 설계와 주효과·상호작용

3.2 2 단계 — 단순 효과와 상호작용 대비 (L:25000~26500)

상호작용이 유의할 때 follow-up 으로 simple effect (한 요인의 다른 요인 levels 별 효과) 와 interaction contrast (특정 cell 패턴) 를 검정한다.

→ G-MAX7-2: 단순 효과와 상호작용 대비

3.3 3 단계 — Type I/II/III SS, 비직교 설계 (L:26500~28500)

표본이 셀마다 다르면 직교성이 깨져 주효과·상호작용 SS 가 가산되지 않는다. Type I (sequential), Type II (hierarchical), Type III (marginal) SS 의 정의·차이·언제 어느 것을 쓰는지.

→ G-MAX7-3: 비직교 설계의 SS 유형

3.4 4 단계 — Effect Size, 검정력, 표본 크기 (L:28500~30026)

\(\eta^2\), partial \(\eta^2\), Cohen’s \(f\) 의 정의와 factorial 에서의 검정력 분석. G*Power 와 statsmodels 로 표본 크기 산출.

→ G-MAX7-4: 요인 설계의 효과 크기·검정력

4 핵심 수식 미리보기

4.1 셀 모형 (cell-means model)

\[ Y_{ijk} = \mu_{jk} + \varepsilon_{ijk},\quad \varepsilon_{ijk} \sim N(0, \sigma^2) \]

여기서 \(\mu_{jk}\) 는 행 \(j\), 열 \(k\) 셀의 모평균, \(i = 1, \ldots, n\) 은 셀 내 피험자.

4.2 효과 분해 (effects model)

\[ \mu_{jk} = \mu + \alpha_j + \beta_k + (\alpha\beta)_{jk} \]

제약: \(\sum_j \alpha_j = 0\), \(\sum_k \beta_k = 0\), \(\sum_j (\alpha\beta)_{jk} = \sum_k (\alpha\beta)_{jk} = 0\).

4.3 SS 분해 (등표본 직교 분해)

\[ SS_{\text{between}} = SS_A + SS_B + SS_{A \times B} \]

각 항은 자유도 \((a-1), (b-1), (a-1)(b-1)\) 의 \(F\) 검정에 사용된다.

효과	\(df\)	의미
\(A\) 주효과	\(a-1\)	다른 요인의 평균을 적분한 \(A\) 의 효과
\(B\) 주효과	\(b-1\)	다른 요인의 평균을 적분한 \(B\) 의 효과
\(A \times B\) 상호작용	\((a-1)(b-1)\)	\(A\) 의 효과가 \(B\) levels 에 따라 달라지는 정도
within (오차)	\(ab(n-1)\)	셀 내 변동

5 Maxwell 의 2×2 데이터 적용

Table 7.1, 각 셀 \(n=5\), MS_W = 62.50.

대비별 SS:

대비	계수	\(\hat\psi\)	\(SS_\psi\)
BF 주효과	\((+1, +1, -1, -1)\)	\((168+188) - (186+190) = -20\)	\(5 \times 400/4 = 500\)
Drug 주효과	\((+1, -1, +1, -1)\)	\((168+186) - (188+190) = -24\)	\(5 \times 576/4 = 720\)
상호작용	\((+1, -1, -1, +1)\)	\((168 + 190) - (188 + 186) = -16\)	\(5 \times 256/4 = 320\)

검증: \(SS_A + SS_B + SS_{A\times B} = 500 + 720 + 320 = 1540 = SS_{\text{between}}\). ✓

\(F\) 검정 (\(df = 1, 16\)):

효과	\(F\)	\(p\)
BF 주효과	\(500/62.5 = 8.00\)	\(0.012\)
Drug 주효과	\(720/62.5 = 11.52\)	\(0.004\)
상호작용	\(320/62.5 = 5.12\)	\(0.038\)

세 효과가 모두 유의. 즉 두 치료법 각각 SBP 를 낮추며, 동시에 사용하면 단순 합산 이상의 효과 (양의 시너지) 가 있다.

6 응용 분야

분야	요인 \(A\)	요인 \(B\)	응답
의약	약물 종류 (3)	용량 (4)	증상 점수
농학	비료 종류 (4)	관개 빈도 (3)	수확량
심리	학습 시간	환경 잡음	회상률
IT (multivariate)	버튼 색 (3)	버튼 위치 (2)	CTR
ML	optimizer (4)	scheduler (3)	val accuracy
마케팅	이메일 제목 (3)	발송 시간 (4)	오픈율

IT 매핑: A/B Test → Multivariate Test

A/B Test 가 한 요인의 두 변종을 비교한다면, multivariate test (MVT) 는 두 개 이상의 요인을 동시에 시험한다. Google 의 41 가지 파란색 실험 같은 단일 요인 다수준도 factorial 의 변형이다. MVT 의 강점은 (1) 비용 절감, (2) 상호작용 발견. 예: “큰 글꼴” + “빨간 CTA” 가 각자는 미미하지만 함께 쓰면 CTR 이 크게 오를 수 있다.

다만 MVT 는 셀 수가 빠르게 증가 (3×4×2 = 24 cells) 해 셀당 표본 부족 문제가 발생한다. 이를 완화하는 fractional factorial (G-MON3-6, G-MON4) 와 response surface (G-MON7) 가 후속 시리즈에서 다뤄진다.

7 가정과 한계

셀 내 정규성·등분산성·독립성: 표준 ANOVA 가정.
셀 표본 크기 균등: 등표본일 때만 SS 가 직교 분해된다. 불균등이면 Type I/II/III SS 구분 (G-MAX7-3) 이 필요하다.
고정 효과 가정 (이번 챕터): 두 요인의 levels 가 모두 연구자가 선택한 고정값. 무작위 levels (예: 무작위 표본의 학교) 는 random effects 로 다뤄야 한다 (G-MAX10).
두 요인의 직교 배정: 모든 \(a \times b\) 조합에 피험자가 있어야 한다. 일부 셀이 비면 incomplete factorial 또는 nested design 으로 분류된다.

8 본 시리즈의 학습 흐름

Phase A (ANOVA 모형 비교)
    │
    ▼
G-MAX7-0  ── overview (현재 글)
    │
    ▼
G-MAX7-1  ── 2×2 설계, 주효과 vs 상호작용
    │
    ▼
G-MAX7-2  ── 단순 효과, 상호작용 대비 (post-hoc)
    │
    ▼
G-MAX7-3  ── Type I/II/III SS, 비직교 설계
    │
    ▼
G-MAX7-4  ── effect size, 검정력, 표본 크기
    │
    ▼
G-MAX8 (Higher-Order Factorial: 2×2×2)
G-MON3 (Factorial 정통, 3 수준, 부분실시법)

9 관련 주제

선행 지식

Phase A — Fisher 전통과 ANOVA 모형 비교
A-MAX3 — One-Way ANOVA Model Comparison (작성 예정)
G-MAX6 — Trend Analysis

후속 주제

G-MAX7-1: 2×2 설계와 주효과·상호작용
G-MAX8 — Higher-Order Factorial (작성 예정)
G-MON3 — Factorial Experiments (작성 예정)

다른 카테고리 연결

Causal Inference — 효과 수정과 상호작용 — 인과 lens 에서의 interaction
AB Test — 다중 비교 실험 — IT 의 multivariate testing 사례