Kwangmin Kim - 고차 요인 설계 개관 — 2×2×2 의 7 효과와 하향식 분석 전략

1 정의

정의: 삼원 요인 설계 (Three-Way Factorial)

세 요인 \(A\) (수준 \(a\)), \(B\) (\(b\)), \(C\) (\(c\)) 의 levels 조합으로 \(a \times b \times c\) 개 셀을 구성하는 between-subjects 설계이다. 효과 분해:

\[ \mu_{jkl} = \mu + \alpha_j + \beta_k + \gamma_l + (\alpha\beta)_{jk} + (\alpha\gamma)_{jl} + (\beta\gamma)_{kl} + (\alpha\beta\gamma)_{jkl} \]

주효과: \(A, B, C\) (3 개)
이원 상호작용: \(A \times B, A \times C, B \times C\) (3 개)
삼원 상호작용: \(A \times B \times C\) (1 개)
총 7 효과 + grand mean

\(2 \times 2 \times 2\) 설계는 가장 단순한 형태로 셀이 8 개, 자유도가 7 개 (= 셀 수 - 1). 각 효과가 자유도 1 이라 직교 분해가 깔끔하다.

2 자유도 분해 — 등표본 가정

효과	자유도
\(A\)	\(a-1\)
\(B\)	\(b-1\)
\(C\)	\(c-1\)
\(A \times B\)	\((a-1)(b-1)\)
\(A \times C\)	\((a-1)(c-1)\)
\(B \times C\)	\((b-1)(c-1)\)
\(A \times B \times C\)	\((a-1)(b-1)(c-1)\)
Within	\(abc(n-1)\)

검증: 모든 효과 + within = \(abc \cdot n - 1 = N - 1\) (총 자유도). ✓

3 왜 고차 factorial 인가

3.1 검정력 이득 (efficiency)

세 요인을 따로 실험하면 표본이 3 배 든다. Factorial 은 같은 피험자로 모든 효과를 동시에 검정한다.

3.2 상호작용의 풍부한 구조

이원 상호작용만으로는 잡을 수 없는 패턴 — “\(A \times B\) 의 패턴이 \(C\) 의 levels 에 따라 달라짐” — 이 삼원 상호작용이다. 예: 약 A × 식이요법 B 의 시너지가 환자 연령 C 에 따라 달라진다.

직관: 삼원 상호작용 = 이원 상호작용의 효과 수정

이원 상호작용을 “한 요인의 효과가 다른 요인 levels 에 따라 달라짐” 이라 했다면, 삼원 상호작용은 “그 달라짐의 정도 가 제3 요인 levels 에 따라 또 달라짐” 이다. 인과추론 용어로는 effect-modification-of-effect-modification.

이는 의료의 personalized treatment (“이 환자 유형에서 이 약·식이 시너지가 더 강함”), 디지털의 segment × creative × time slot (“주말 저녁 사용자에서 빨간 버튼 + 큰 글꼴 시너지가 다르다”), 농학의 품종 × 비료 × 토양 같은 패턴을 표현한다.

4 Ch.8 의 4 단계 흐름

본 시리즈는 다음 순서로 전개한다.

4.1 1 단계 — 2×2×2 의 7 효과 (L:30027~31500)

가장 단순한 8 셀 설계의 직교 대비, SS 분해, 등표본 분석. 7 개 효과 모두 자유도 1.

→ G-MAX8-1: 2×2×2 와 7 효과

4.2 2 단계 — 삼원 상호작용과 하향식 분석 (L:31500~32800)

삼원 상호작용의 의미, 시각화 (이원 상호작용 plot 의 panel 형태), top-down strategy: 가장 고차부터 검정 → 유의하면 그 단계에서 멈추거나 분해 진행.

→ G-MAX8-2: 3원 상호작용과 하향식 분석

4.3 3 단계 — Simple Interaction Effects + Non-orthogonal (L:32800~34695)

삼원 상호작용 유의 시 follow-up: 한 요인의 levels 별로 나머지 두 요인의 이원 factorial 분석 (simple interaction effect). 비직교 설계 (셀 표본 불균등) 의 SS 처리.

→ G-MAX8-3: 단순 상호작용과 비직교 설계

4.4 4 단계 — overview (이 글)

분량·복잡도 균형을 위해 이 시리즈는 4 편 (overview + 3 편 본문).

5 Maxwell 의 사례 — 학습 시간 × 형식 × 동기

가설 데이터 (구체 수치는 본문 시리즈에서): - 요인 \(A\): 학습 시간 (1 시간 / 2 시간) - 요인 \(B\): 학습 형식 (반복 학습 / 검색 학습) - 요인 \(C\): 동기 부여 (보상 / 비보상) - 응답 \(Y\): 회상 점수

각 셀당 \(n = 8\), 총 \(N = 64\).

효과	\(df\)	가상 \(F\)	\(p\)	해석
\(A\)	1	25.0	\(< 0.001\)	학습 시간 길수록 회상 ↑
\(B\)	1	18.0	\(< 0.001\)	검색 학습이 반복 학습보다 효과 ↑
\(C\)	1	9.0	\(0.004\)	보상이 비보상보다 효과 ↑
\(A \times B\)	1	4.5	\(0.038\)	시간 × 형식 시너지
\(A \times C\)	1	1.2	\(0.28\)	시간 × 동기 비유의
\(B \times C\)	1	6.0	\(0.018\)	형식 × 동기 시너지
\(A \times B \times C\)	1	4.8	\(0.033\)	3 원 시너지 — top-down 진입

3 원 상호작용 유의 → simple interaction effect 분석으로 이행 (G-MAX8-3).

6 7 개 직교 대비

\(2^3 = 8\) 셀의 8 자유도 중 1 개는 grand mean, 나머지 7 개가 7 효과에 1 자유도씩 배분. 직교 대비 계수 (셀 순서 \(abc \in \{000, 001, 010, 011, 100, 101, 110, 111\}\)):

효과	000	001	010	011	100	101	110	111
\(A\)	\(-\)	\(-\)	\(-\)	\(-\)	\(+\)	\(+\)	\(+\)	\(+\)
\(B\)	\(-\)	\(-\)	\(+\)	\(+\)	\(-\)	\(-\)	\(+\)	\(+\)
\(C\)	\(-\)	\(+\)	\(-\)	\(+\)	\(-\)	\(+\)	\(-\)	\(+\)
\(A \times B\)	\(+\)	\(+\)	\(-\)	\(-\)	\(-\)	\(-\)	\(+\)	\(+\)
\(A \times C\)	\(+\)	\(-\)	\(+\)	\(-\)	\(-\)	\(+\)	\(-\)	\(+\)
\(B \times C\)	\(+\)	\(-\)	\(-\)	\(+\)	\(+\)	\(-\)	\(-\)	\(+\)
\(A \times B \times C\)	\(-\)	\(+\)	\(+\)	\(-\)	\(+\)	\(-\)	\(-\)	\(+\)

(±1 부호로 단순화. 임의의 두 행은 직교: 부호 곱의 합 = 0.)

각 대비의 SS: \[ SS_{\text{effect}} = \frac{n \, \hat\psi^2}{\sum c_j^2} = \frac{n \, \hat\psi^2}{8} \]

7 응용 — IT, 농학, 의약

분야	요인 \(A\)	요인 \(B\)	요인 \(C\)
광고	시각 (이미지/영상)	CTA 색	발송 시간
ML	optimizer	learning rate	regularization
농학	품종	비료 농도	관개 빈도
의약	약 종류	용량	환자 연령군
게임	보상 빈도	보상 크기	난이도
UX	폰트 크기	컬러 테마	사용자 세그먼트

IT 매핑: Multivariate Test (MVT) 의 정수형

Booking, Microsoft 등의 MVT 시스템은 이 lens 의 직접 적용이다. 동시 다요인 변경 (button color × icon × text length) 의 7 개 효과를 모두 검정한다. 차이는 (1) 표본 크기가 매우 큼 (수십만), (2) 셀 표본이 불균등한 경우가 흔함 (트래픽 변동), (3) 효과 크기가 작음 (\(f \approx 0.05\)). 따라서 검정력은 충분하지만 다중 비교 보정 과 순차 분석 (peeking problem) 이 큰 이슈가 된다 (Phase F).

8 Top-Down 분석 전략

ANOVA omnibus F (모든 효과 동시 검정)
    ↓
삼원 상호작용 (A × B × C) F 검정
    ├── 유의 → simple interaction effect 분석 (G-MAX8-3)
    │           → 한 요인 고정 후 나머지 2원 factorial
    └── 비유의 → 이원 상호작용 (A×B, A×C, B×C) 검정
              ├── 유의 → simple effect (G-MAX7-2 절차)
              └── 비유의 → 주효과 검정
                        ├── 유의 → marginal mean 비교 (post-hoc)
                        └── 비유의 → 효과 없음

핵심 원칙: 고차 효과가 유의하면 저차 효과의 marginal 해석이 오도될 수 있으므로, 가장 고차부터 점검하고 적절한 단계에서 멈춘다.

함정: 삼원 상호작용의 검정력은 매우 낮다

자유도 1 의 삼원 상호작용은 효과 크기가 작은 경우가 많고, 검정력이 주효과·이원 상호작용에 비해 약하다. 표본이 작으면 “유의하지 않음” 이 “효과 없음” 이 아닐 수 있다. 신뢰구간 또는 효과 크기 (partial \(\eta^2\)) 도 함께 보고하는 것이 중요.

실무에서 삼원 상호작용이 일관되게 유의하려면 사전 검정력 분석에서 큰 표본 을 산출해야 한다. Cohen’s \(f = 0.10\) (작은 효과), 자유도 1, \(\alpha=0.05\), 검정력 0.80 에 약 \(N = 800\) 이 필요.

9 가정과 한계

셀 등분산·정규성·독립성: ANOVA 표준 가정.
셀 표본 균등이 직교 분해의 전제: 불균등이면 Type I/II/III 구분 (G-MAX8-3).
고정 효과: 세 요인 모두 연구자가 선택한 levels. 무작위 levels 는 G-MAX10 (Random/Nested) 또는 G-MAX15 (Multilevel) 에서 다룸.
셀당 표본 충분: \(n \ge 5\) 권장. 작으면 within SS 자유도가 부족.
삼원 이상의 해석 한계: 4 원 이상은 효과 수가 폭증 (\(2^4 = 16\) 효과) 하여 실무 해석이 어렵다. fractional factorial (G-MON3-6) 로 일부만 추정하는 경우가 많다.

10 본 시리즈 흐름

G-MAX7 (2-Way Factorial)
    ↓
G-MAX8-0  ── 고차 요인 설계 개관 (현재 글)
    ↓
G-MAX8-1  ── 2×2×2 와 7 효과
    ↓
G-MAX8-2  ── 3 원 상호작용과 하향식 분석
    ↓
G-MAX8-3  ── 단순 상호작용과 비직교 설계
    ↓
G-MAX9 (ANCOVA), G-MON3 (Factorial 정통)

11 관련 주제

선행 지식

후속 주제

G-MAX8-1: 2×2×2 와 7 효과
G-MON3 — Factorial Experiments (작성 예정)

다른 카테고리 연결