1 정의
여러 요인의 levels 조합으로 구성된 실험의 통합 분석 framework.
- Symmetric: 모든 요인이 같은 수의 levels.
- \(2^k\): \(k\) 요인 × 2 수준. \(2^k\) 셀.
- \(3^k\): \(k\) 요인 × 3 수준. \(3^k\) 셀.
- \(s^k\): 일반 prime \(s\) 수준.
- Asymmetric: 요인마다 다른 수의 levels (G-MON4).
- Mixed: \(2^a \times 3^b\) 등.
핵심 도구: - Confounding: 일부 효과를 block 과 동일시. - Fractional factorial: 일부 effect 만 추정. - Finite field 기반 구성: 직교성 보장의 대수 도구.
2 왜 정통 DOE 인가
Maxwell 의 심리학적 lens (G-MAX7~8) 와 차이:
| 측면 | Maxwell (G-MAX) | Das & Giri (G-MON) |
|---|---|---|
| 응용 분야 | 심리학·임상 | 농학·산업 |
| 강조점 | 효과 크기, simple effect, model comparison | 대수적 구성, alias, finite field |
| 실험 단위 | 사람 | plot, batch, machine |
| 표본 | 작음 (수십) | 큼 (수백~수천) |
| 도구 | ANOVA + multiple comparison | confounding + fractional |
산업·농학에서 표준. ML 의 hyperparameter 탐색·multivariate testing 의 정수형.
3 Ch.3 의 7 단계
G-MON3-0 개관 (현재 글)
│
▼
G-MON3-1 Characterization + Factorial + Two-level Factorials (2^k)
│
▼
G-MON3-2 Finite Fields + Grouping for Interaction Contrasts
│
▼
G-MON3-3 Confounding + More Blocks
│
▼
G-MON3-4 Three-level Factorials (3^k)
│
▼
G-MON3-5 General Construction + Maximum Number
│
▼
G-MON3-6 Analysis + Fractional Factorials
│
▼
G-MON4 (Asymmetrical / Split-Plot)
G-MON5 (Incomplete Block — BIB)
4 응용
| 분야 | 요인 | 수준 |
|---|---|---|
| 산업 (반도체) | 온도, 압력, 시간 | 2~3 수준 |
| 농학 | 비료 종류, 농도, 시기 | 2~5 수준 |
| 생화학 | pH, 온도, 효소량 | 3+ 수준 |
| 약리학 | 용량, 시간 | 3+ 수준 |
| ML | optimizer, lr, regularization | 2~5 수준 |
| IT MVT | UI 변종 | 2~3 수준 |
| 식품 | 레시피, 보관 조건 | 2~4 수준 |
5 핵심 trade-off
| 측면 | 완전 factorial (\(2^k\)) | Fractional (\(2^{k-p}\)) |
|---|---|---|
| 셀 수 | \(2^k\) (큼) | \(2^{k-p}\) (감소) |
| 효과 수 | \(2^k - 1\) | 일부 (\(k\) 줄) |
| Resolution | 모든 효과 추정 | III/IV/V 에 따라 |
| 가정 | 없음 | 고차 상호작용 ≈ 0 |
큰 \(k\) (\(\ge 5\)) 에서 fractional 이 필수.
| \(k\) | 셀 (\(2^k\)) | 효과 수 | 주효과 | 이원 | 삼원 | 사원 |
|---|---|---|---|---|---|---|
| 2 | 4 | 3 | 2 | 1 | — | — |
| 3 | 8 | 7 | 3 | 3 | 1 | — |
| 4 | 16 | 15 | 4 | 6 | 4 | 1 |
| 5 | 32 | 31 | 5 | 10 | 10 | 5+1 |
| 6 | 64 | 63 | 6 | 15 | 20 | 15+6+1 |
\(k = 6\) 부터 효과 수가 너무 많아 모두 검정 어려움. fractional 또는 PB 활용.
6 2-level Factorial 의 직관
각 요인이 low/high 2 수준 → ±1 코딩.
각 효과는 \(\pm 1\) 의 weighted sum: - 주효과: \(A = \frac{1}{2^{k-1}} \sum (\text{A high의 평균} - \text{A low의 평균})\). - 이원: $AB = $ 비슷하게 (A × B 의 부호 곱).
직교성: 임의의 두 effect 가 직교 → SS 가산 분해.
7 응용 — 산업 사례
7.1 반도체 etching
요인: - \(A\) = 온도 (low 100°C / high 150°C). - \(B\) = 압력 (low 1 atm / high 2 atm). - \(C\) = 시간 (low 30 sec / high 60 sec).
응답: etching rate (nm/min).
\(2^3 = 8\) runs. 각 run 의 결과로 7 효과 추정 + 잔차.
가설 결과: - \(A\) (온도): 큰 효과. - \(B\) (압력): 중간 효과. - \(C\) (시간): 작은 효과. - \(AB\), \(AC\): 작은 상호작용. - \(BC\), \(ABC\): 무시 가능.
→ 온도와 압력이 핵심. 다음 단계 RSM 으로 최적화 (G-MON7).
8 응용 — ML hyperparameter
8.1 사례
요인: - \(A\) = optimizer (Adam / SGD): 2 수준. - \(B\) = learning rate (1e-4 / 1e-3): 2 수준. - \(C\) = batch size (32 / 128): 2 수준. - \(D\) = dropout (0.0 / 0.5): 2 수준.
\(2^4 = 16\) runs. 각 run 의 validation accuracy.
분석: - 각 효과의 contribution 분리. - 어느 hyperparameter 가 가장 영향력 큰지 식별. - 다음 단계: fractional factorial 또는 RSM 으로 좁힘.
이는 ML 의 hyperparameter screening 의 정수.
9 핵심 도구 미리보기
9.1 Confounding (G-MON3-3)
일부 효과 (보통 고차 상호작용) 를 block 과 의도적으로 동일시. block 내 셀 수 ↓ 가능.
예: \(2^4 = 16\) 을 \(4 \times 4\) 의 block 으로 분할 — \(ABCD\) 4 원 상호작용을 block 효과와 confound.
9.2 Fractional Factorial (G-MON3-6)
\(2^k\) 의 1/2, 1/4 만 실행. Resolution III, IV, V 에 따라 alias 구조.
큰 \(k\) 에 필수. PB design 의 정수형.
10 가정과 한계
- 요인 수 폭증: 큰 \(k\) 에 fractional 필수.
- 고차 상호작용 = 0 가정: fractional 의 전제.
- 셀 등표본: 비균등은 Type II/III SS.
- 잡음 등분산: ANOVA 표준 가정.
11 ML 매핑
A/B Test 가 한 요인의 두 변종을 비교한다면, multivariate test (MVT) 는 여러 요인을 동시에 시험한다. Google 의 41 가지 파란색 실험 같은 단일 요인 다수준도 factorial 의 변형.
MVT 의 강점: - 비용 절감 (한 실험에 여러 요인). - 상호작용 발견.
단점: - 셀 수 폭증 (\(2^4 = 16\), \(3^4 = 81\)). - 셀당 표본 부족.
해결: fractional factorial 또는 RSM (G-MON7).
12 본 시리즈
G-MON3-0 Factorial 개관 (현재 글)
G-MON3-1 $2^k$ Factorial
G-MON3-2 Finite Fields + Grouping
G-MON3-3 Confounding
G-MON3-4 $3^k$ Factorial
G-MON3-5 General Construction + Maximum Number
G-MON3-6 Analysis + Fractional Factorial
↓
G-MON4 (Asymmetrical / Split-Plot)
13 관련 주제
선행 지식
후속 주제
- G-MON3-1: 2^k Factorial
- G-MON3-3: Confounding
- G-MON3-6: Fractional Factorial
- G-MON7 — Response Surface (RSM)
다른 카테고리 연결
14 더 읽을 거리
- Box, G. E. P., Hunter, W. G., Hunter, J. S. (2005). “Statistics for Experimenters.” Wiley.
- Montgomery, D. C. (2017). “Design and Analysis of Experiments” (9th ed). Wiley.
- Das, M. N., Giri, N. C. (1986). “Design and Analysis of Experiments” (2nd ed). Wiley Eastern.
- Wu, C. F. J., Hamada, M. S. (2009). “Experiments: Planning, Analysis, and Optimization” (2nd ed). Wiley.