1 \(s^k\) 일반 구성
\(s\) prime power, \(k\) 요인 각 \(s\) 수준. 셀 수 \(s^k\).
각 셀을 \(k\) 차원 vector \((x_1, x_2, \ldots, x_k)\) 로 표현, \(x_i \in GF(s)\).
효과는 다음 형태의 contrast: \[ \sum_{i=1}^{k} a_i x_i \pmod{s},\quad a_i \in GF(s),\ \text{first nonzero } a_i = 1 \]
이 effect 의 자유도 \(s - 1\).
2 효과 수와 그룹
\(s^k\) 의 총 효과: \(s^k - 1\). 그룹 수: \((s^k - 1)/(s - 1)\).
| \(s\) | \(k\) | 셀 | 효과 | 그룹 수 |
|---|---|---|---|---|
| 2 | 4 | 16 | 15 | 15 |
| 2 | 5 | 32 | 31 | 31 |
| 3 | 3 | 27 | 26 | 13 |
| 3 | 4 | 81 | 80 | 40 |
| 5 | 2 | 25 | 24 | 6 |
각 그룹이 자유도 \(s - 1\) 의 1 contrast 묶음 (G-MON3-2).
3 최대 요인 수 — Saturated Design
\(N\) 개 셀에 다룰 수 있는 최대 요인 수 (각 요인 자유도 1, 모든 \(df\) 가 main effect 에):
\[ k_{\max} = N - 1 \]
이를 saturated design 이라 한다. 모든 \(df\) 가 주효과에 배분 → 잔차 \(df\) 0 → 효과 추정만 가능, 검정 불가능.
예: \(N = 8\) runs → \(k_{\max} = 7\) 요인. 각 요인 1 자유도 = 모든 cell.
4 Plackett-Burman Design
\(N\) 이 4 의 배수면 \(N - 1\) 요인의 saturated factorial 가능 (Plackett-Burman, 1946).
| \(N\) | 최대 요인 수 |
|---|---|
| 8 | 7 |
| 12 | 11 |
| 16 | 15 |
| 20 | 19 |
| 24 | 23 |
| 28 | 27 |
PB design 은 산업 screening 에서 표준 — 많은 요인 중 영향 큰 것을 빠르게 식별.
Saturated design 은 효과 추정만 가능 (분산 추정 불가능). 검정을 위해서는:
- 반복: 일부 셀 반복 → 잔차 추정.
- 사전 가정: 일부 효과 = 0 가정 (보통 작은 효과).
- 확장 (foldover): 모든 부호를 뒤집은 설계 추가 → resolution ↑.
PB design 은 “가장 큰 효과” 를 빠르게 찾는 screening 단계. 주요 요인 식별 후 fractional factorial 또는 response surface 로 확장.
5 일반 \(s^k\) 의 구성 절차
- Defining contrasts 선택 (confounding 또는 fractioning 위한).
- 각 cell 에 GF(s) 좌표 부여.
- Block 또는 fraction 분할 (defining contrast 의 값에 따라).
- 각 block 또는 fraction 내에서 무작위 배정.
자세한 알고리즘: Box-Hunter-Hunter 의 “Statistics for Experimenters” 참고.
6 \(2^7\) Saturated Design (PB-8)
8 runs 에 7 요인 (\(A, B, C, D, E, F, G\)):
Run | A B C D E F G
1 | + + + - + - -
2 | - + + + - + -
3 | - - + + + - +
4 | + - - + + + -
5 | - + - - + + +
6 | + - + - - + +
7 | + + - + - - +
8 | - - - - - - -
각 column 은 4 + 와 4 - 의 균형 + 임의의 두 column 직교.
이는 \(H_8\) Hadamard matrix 의 정수형. saturated factorial 의 정수형.
7 Resolution 의 미리보기
Resolution 은 fractional factorial 의 alias 구조 (G-MON3-6).
| Resolution | 의미 |
|---|---|
| III | 주효과가 이원 상호작용과 alias |
| IV | 주효과가 삼원 이상과 alias, 이원이 이원과 alias |
| V | 주효과가 사원과, 이원이 삼원과 alias |
PB design 은 보통 Resolution III. 주효과만 추정 가능 (이원 alias).
8 Foldover
Resolution III design 에 모든 부호를 뒤집은 fraction 추가 → Resolution IV.
원래 design + foldover = 2 배 cells. alias 구조 개선.
Original: A B C D E F G (PB-8)
Foldover: -A -B -C -D -E -F -G
Combined: 16 cells.
각 주효과가 자기 자신과 alias (직선이 아니므로 사라짐). 즉 주효과는 alias 없음. 이원 상호작용은 여전히 일부 alias.
9 Python 코드
import numpy as np
from pyDOE2 import pbdesign, fracfact
# Plackett-Burman 8-run, 7 factors
pb = pbdesign(7)
print("=== Plackett-Burman 8-run × 7 factors ===")
print(pb)
print(f"Shape: {pb.shape}")
# 직교성 검증
print(f"\nColumn orthogonality check:")
for i in range(7):
for j in range(i+1, 7):
dp = np.dot(pb[:, i], pb[:, j])
if abs(dp) > 0.01:
print(f" Columns {i}, {j} not orthogonal: dot = {dp}")
print("All pairs orthogonal.")
# 2^(7-4) fractional factorial via defining relations
# I = ABD = ACE = BCF = ABCG (gives III resolution)
ff = fracfact("a b c ab ac bc abc") # 2^(7-4)
print(f"\n=== 2^(7-4) Resolution III ===")
print(ff)
# Foldover
foldover = -pb
combined = np.vstack([pb, foldover])
print(f"\n=== PB + Foldover (16 runs) ===")
print(combined)
print(f"Shape: {combined.shape}")10 응용 — 산업 Screening
10.1 사례 — 화학 공정
15 개 잠재 영향 요인 중 가장 중요한 것 식별:
Factors: 온도, 압력, pH, 농도, 시간, 교반 속도, 첨가제 종류 (×2),
촉매 종류, 질소 흐름, 펌프 속도, 진공도, 용매 종류,
반응기 종류, 측정 방법.
PB-16 (16 runs, 15 factors) saturated design.
분석: - 각 요인의 main effect 추정. - Pareto chart 로 큰 효과 식별 (보통 3 ~ 5 개). - 다음 단계: 큰 요인의 fractional factorial 또는 RSM.
이는 산업 실험의 표준 첫 단계.
11 가정과 한계
- Saturated 의 검정 불가: 반복 또는 사전 가정.
- Resolution III 의 alias: 주효과와 이원 상호작용 alias — 이원 상호작용 = 0 가정.
- PB 의 비주효과 alias 복잡: 분석 시 주의.
- Foldover 의 비용: cells 2 배.
12 \(s^k\) 의 일반 design
| \(s\) | 표준 design |
|---|---|
| 2 | \(2^k\) factorial, PB, \(2^{k-p}\) fractional |
| 3 | \(3^k\) factorial, \(3^{k-p}\) fractional, Box-Behnken |
| 5 | \(5^k\) (드물게) |
| Mixed | \(2^a \times 3^b\), etc. |
13 ML 매핑
ML 의 saturated design:
N = 12 runs.
11 hyperparameters: optimizer, lr, batch, dropout, weight decay, scheduler,
warmup, momentum, initializer, normalization, activation.
PB-12 design 으로 11 hyperparameter 의 main effect 추정.
검정 불가능 (saturated). 그러나 큰 효과의 hyperparameter 식별: - 각 effect 의 절댓값 계산. - Pareto chart 로 큰 효과 식별. - 큰 hyperparameter 만 다음 grid 에서 fine-tune.
이는 ML 의 hyperparameter 차원 축소의 통계적 방법. random search 보다 systematic.
14 본 시리즈
G-MON3-0 Factorial 개관
G-MON3-1 2^k Factorial
G-MON3-2 Finite Fields + Grouping
G-MON3-3 Confounding
G-MON3-4 3^k Factorial
G-MON3-5 General Construction + Maximum Number ← 현재 글
G-MON3-6 Fractional Factorial
15 관련 주제
선행 지식
후속 주제
다른 카테고리 연결
- Math — Linear Algebra (placeholder) — Hadamard, eigenvalue.
16 더 읽을 거리
- Plackett, R. L., Burman, J. P. (1946). “The design of optimum multifactorial experiments.” Biometrika 33(4): 305-325 — PB 원조.
- Box, G. E. P., Hunter, J. S., Hunter, W. G. (2005). “Statistics for Experimenters.”
- Wu, C. F. J., Hamada, M. S. (2009). “Experiments.” Wiley.
- Hedayat, A., Sloane, N. J. A., Stufken, J. (1999). “Orthogonal Arrays.” Springer.
- Mukerjee, R., Wu, C. F. J. (2006). “A Modern Theory of Factorial Designs.” Springer.