1 정의
세 요인 \(A\) (수준 \(a\)), \(B\) (\(b\)), \(C\) (\(c\)) 의 levels 조합으로 \(a \times b \times c\) 개 셀을 구성하는 between-subjects 설계이다. 효과 분해:
\[ \mu_{jkl} = \mu + \alpha_j + \beta_k + \gamma_l + (\alpha\beta)_{jk} + (\alpha\gamma)_{jl} + (\beta\gamma)_{kl} + (\alpha\beta\gamma)_{jkl} \]
- 주효과: \(A, B, C\) (3 개)
- 이원 상호작용: \(A \times B, A \times C, B \times C\) (3 개)
- 삼원 상호작용: \(A \times B \times C\) (1 개)
- 총 7 효과 + grand mean
\(2 \times 2 \times 2\) 설계는 가장 단순한 형태로 셀이 8 개, 자유도가 7 개 (= 셀 수 - 1). 각 효과가 자유도 1 이라 직교 분해가 깔끔하다.
2 자유도 분해 — 등표본 가정
| 효과 | 자유도 |
|---|---|
| \(A\) | \(a-1\) |
| \(B\) | \(b-1\) |
| \(C\) | \(c-1\) |
| \(A \times B\) | \((a-1)(b-1)\) |
| \(A \times C\) | \((a-1)(c-1)\) |
| \(B \times C\) | \((b-1)(c-1)\) |
| \(A \times B \times C\) | \((a-1)(b-1)(c-1)\) |
| Within | \(abc(n-1)\) |
검증: 모든 효과 + within = \(abc \cdot n - 1 = N - 1\) (총 자유도). ✓
3 왜 고차 factorial 인가
3.1 검정력 이득 (efficiency)
세 요인을 따로 실험하면 표본이 3 배 든다. Factorial 은 같은 피험자로 모든 효과를 동시에 검정한다.
3.2 상호작용의 풍부한 구조
이원 상호작용만으로는 잡을 수 없는 패턴 — “\(A \times B\) 의 패턴이 \(C\) 의 levels 에 따라 달라짐” — 이 삼원 상호작용이다. 예: 약 A × 식이요법 B 의 시너지가 환자 연령 C 에 따라 달라진다.
이원 상호작용을 “한 요인의 효과가 다른 요인 levels 에 따라 달라짐” 이라 했다면, 삼원 상호작용은 “그 달라짐의 정도 가 제3 요인 levels 에 따라 또 달라짐” 이다. 인과추론 용어로는 effect-modification-of-effect-modification.
이는 의료의 personalized treatment (“이 환자 유형에서 이 약·식이 시너지가 더 강함”), 디지털의 segment × creative × time slot (“주말 저녁 사용자에서 빨간 버튼 + 큰 글꼴 시너지가 다르다”), 농학의 품종 × 비료 × 토양 같은 패턴을 표현한다.
4 Ch.8 의 4 단계 흐름
본 시리즈는 다음 순서로 전개한다.
4.1 1 단계 — 2×2×2 의 7 효과 (L:30027~31500)
가장 단순한 8 셀 설계의 직교 대비, SS 분해, 등표본 분석. 7 개 효과 모두 자유도 1.
4.2 2 단계 — 삼원 상호작용과 하향식 분석 (L:31500~32800)
삼원 상호작용의 의미, 시각화 (이원 상호작용 plot 의 panel 형태), top-down strategy: 가장 고차부터 검정 → 유의하면 그 단계에서 멈추거나 분해 진행.
4.3 3 단계 — Simple Interaction Effects + Non-orthogonal (L:32800~34695)
삼원 상호작용 유의 시 follow-up: 한 요인의 levels 별로 나머지 두 요인의 이원 factorial 분석 (simple interaction effect). 비직교 설계 (셀 표본 불균등) 의 SS 처리.
4.4 4 단계 — overview (이 글)
분량·복잡도 균형을 위해 이 시리즈는 4 편 (overview + 3 편 본문).
5 Maxwell 의 사례 — 학습 시간 × 형식 × 동기
가설 데이터 (구체 수치는 본문 시리즈에서): - 요인 \(A\): 학습 시간 (1 시간 / 2 시간) - 요인 \(B\): 학습 형식 (반복 학습 / 검색 학습) - 요인 \(C\): 동기 부여 (보상 / 비보상) - 응답 \(Y\): 회상 점수
각 셀당 \(n = 8\), 총 \(N = 64\).
| 효과 | \(df\) | 가상 \(F\) | \(p\) | 해석 |
|---|---|---|---|---|
| \(A\) | 1 | 25.0 | \(< 0.001\) | 학습 시간 길수록 회상 ↑ |
| \(B\) | 1 | 18.0 | \(< 0.001\) | 검색 학습이 반복 학습보다 효과 ↑ |
| \(C\) | 1 | 9.0 | \(0.004\) | 보상이 비보상보다 효과 ↑ |
| \(A \times B\) | 1 | 4.5 | \(0.038\) | 시간 × 형식 시너지 |
| \(A \times C\) | 1 | 1.2 | \(0.28\) | 시간 × 동기 비유의 |
| \(B \times C\) | 1 | 6.0 | \(0.018\) | 형식 × 동기 시너지 |
| \(A \times B \times C\) | 1 | 4.8 | \(0.033\) | 3 원 시너지 — top-down 진입 |
3 원 상호작용 유의 → simple interaction effect 분석으로 이행 (G-MAX8-3).
6 7 개 직교 대비
\(2^3 = 8\) 셀의 8 자유도 중 1 개는 grand mean, 나머지 7 개가 7 효과에 1 자유도씩 배분. 직교 대비 계수 (셀 순서 \(abc \in \{000, 001, 010, 011, 100, 101, 110, 111\}\)):
| 효과 | 000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 |
|---|---|---|---|---|---|---|---|---|
| \(A\) | \(-\) | \(-\) | \(-\) | \(-\) | \(+\) | \(+\) | \(+\) | \(+\) |
| \(B\) | \(-\) | \(-\) | \(+\) | \(+\) | \(-\) | \(-\) | \(+\) | \(+\) |
| \(C\) | \(-\) | \(+\) | \(-\) | \(+\) | \(-\) | \(+\) | \(-\) | \(+\) |
| \(A \times B\) | \(+\) | \(+\) | \(-\) | \(-\) | \(-\) | \(-\) | \(+\) | \(+\) |
| \(A \times C\) | \(+\) | \(-\) | \(+\) | \(-\) | \(-\) | \(+\) | \(-\) | \(+\) |
| \(B \times C\) | \(+\) | \(-\) | \(-\) | \(+\) | \(+\) | \(-\) | \(-\) | \(+\) |
| \(A \times B \times C\) | \(-\) | \(+\) | \(+\) | \(-\) | \(+\) | \(-\) | \(-\) | \(+\) |
(±1 부호로 단순화. 임의의 두 행은 직교: 부호 곱의 합 = 0.)
각 대비의 SS: \[ SS_{\text{effect}} = \frac{n \, \hat\psi^2}{\sum c_j^2} = \frac{n \, \hat\psi^2}{8} \]
7 응용 — IT, 농학, 의약
| 분야 | 요인 \(A\) | 요인 \(B\) | 요인 \(C\) |
|---|---|---|---|
| 광고 | 시각 (이미지/영상) | CTA 색 | 발송 시간 |
| ML | optimizer | learning rate | regularization |
| 농학 | 품종 | 비료 농도 | 관개 빈도 |
| 의약 | 약 종류 | 용량 | 환자 연령군 |
| 게임 | 보상 빈도 | 보상 크기 | 난이도 |
| UX | 폰트 크기 | 컬러 테마 | 사용자 세그먼트 |
Booking, Microsoft 등의 MVT 시스템은 이 lens 의 직접 적용이다. 동시 다요인 변경 (button color × icon × text length) 의 7 개 효과를 모두 검정한다. 차이는 (1) 표본 크기가 매우 큼 (수십만), (2) 셀 표본이 불균등한 경우가 흔함 (트래픽 변동), (3) 효과 크기가 작음 (\(f \approx 0.05\)). 따라서 검정력은 충분하지만 다중 비교 보정 과 순차 분석 (peeking problem) 이 큰 이슈가 된다 (Phase F).
8 Top-Down 분석 전략
ANOVA omnibus F (모든 효과 동시 검정)
↓
삼원 상호작용 (A × B × C) F 검정
├── 유의 → simple interaction effect 분석 (G-MAX8-3)
│ → 한 요인 고정 후 나머지 2원 factorial
└── 비유의 → 이원 상호작용 (A×B, A×C, B×C) 검정
├── 유의 → simple effect (G-MAX7-2 절차)
└── 비유의 → 주효과 검정
├── 유의 → marginal mean 비교 (post-hoc)
└── 비유의 → 효과 없음
핵심 원칙: 고차 효과가 유의하면 저차 효과의 marginal 해석이 오도될 수 있으므로, 가장 고차부터 점검하고 적절한 단계에서 멈춘다.
자유도 1 의 삼원 상호작용은 효과 크기가 작은 경우가 많고, 검정력이 주효과·이원 상호작용에 비해 약하다. 표본이 작으면 “유의하지 않음” 이 “효과 없음” 이 아닐 수 있다. 신뢰구간 또는 효과 크기 (partial \(\eta^2\)) 도 함께 보고하는 것이 중요.
실무에서 삼원 상호작용이 일관되게 유의하려면 사전 검정력 분석에서 큰 표본 을 산출해야 한다. Cohen’s \(f = 0.10\) (작은 효과), 자유도 1, \(\alpha=0.05\), 검정력 0.80 에 약 \(N = 800\) 이 필요.
9 가정과 한계
- 셀 등분산·정규성·독립성: ANOVA 표준 가정.
- 셀 표본 균등이 직교 분해의 전제: 불균등이면 Type I/II/III 구분 (G-MAX8-3).
- 고정 효과: 세 요인 모두 연구자가 선택한 levels. 무작위 levels 는 G-MAX10 (Random/Nested) 또는 G-MAX15 (Multilevel) 에서 다룸.
- 셀당 표본 충분: \(n \ge 5\) 권장. 작으면 within SS 자유도가 부족.
- 삼원 이상의 해석 한계: 4 원 이상은 효과 수가 폭증 (\(2^4 = 16\) 효과) 하여 실무 해석이 어렵다. fractional factorial (G-MON3-6) 로 일부만 추정하는 경우가 많다.
10 본 시리즈 흐름
G-MAX7 (2-Way Factorial)
↓
G-MAX8-0 ── 고차 요인 설계 개관 (현재 글)
↓
G-MAX8-1 ── 2×2×2 와 7 효과
↓
G-MAX8-2 ── 3 원 상호작용과 하향식 분석
↓
G-MAX8-3 ── 단순 상호작용과 비직교 설계
↓
G-MAX9 (ANCOVA), G-MON3 (Factorial 정통)
11 관련 주제
선행 지식
후속 주제
- G-MAX8-1: 2×2×2 와 7 효과
- G-MON3 — Factorial Experiments (작성 예정)
다른 카테고리 연결