일반 \(s^k\) Factorial 의 구성과 최대 요인 수

Montgomery Ch.3.9-3.10 General Construction · Maximum Number of Factors

\(s^k\) factorial design 의 일반 구성 절차 (GF(s) 기반) 와 주어진 셀 수에서 다룰 수 있는 최대 요인 수의 결정 (Plackett-Burman, saturated design), Resolution 의 정의를 정리한다. 산업 screening 의 표준 도구와 확장 (foldover) 까지 다룬다.

Experimentation
DOE
저자

Kwangmin Kim

공개

2026년 05월 08일

1 \(s^k\) 일반 구성

정의: General \(s^k\) Factorial

\(s\) prime power, \(k\) 요인 각 \(s\) 수준. 셀 수 \(s^k\).

각 셀을 \(k\) 차원 vector \((x_1, x_2, \ldots, x_k)\) 로 표현, \(x_i \in GF(s)\).

효과는 다음 형태의 contrast: \[ \sum_{i=1}^{k} a_i x_i \pmod{s},\quad a_i \in GF(s),\ \text{first nonzero } a_i = 1 \]

이 effect 의 자유도 \(s - 1\).

2 효과 수와 그룹

\(s^k\) 의 총 효과: \(s^k - 1\). 그룹 수: \((s^k - 1)/(s - 1)\).

\(s\) \(k\) 효과 그룹 수
2 4 16 15 15
2 5 32 31 31
3 3 27 26 13
3 4 81 80 40
5 2 25 24 6

각 그룹이 자유도 \(s - 1\) 의 1 contrast 묶음 (G-MON3-2).

3 최대 요인 수 — Saturated Design

정의: Saturated Design

\(N\) 개 셀에 다룰 수 있는 최대 요인 수 (각 요인 자유도 1, 모든 \(df\) 가 main effect 에):

\[ k_{\max} = N - 1 \]

이를 saturated design 이라 한다. 모든 \(df\) 가 주효과에 배분 → 잔차 \(df\) 0 → 효과 추정만 가능, 검정 불가능.

예: \(N = 8\) runs → \(k_{\max} = 7\) 요인. 각 요인 1 자유도 = 모든 cell.

4 Plackett-Burman Design

\(N\) 이 4 의 배수면 \(N - 1\) 요인의 saturated factorial 가능 (Plackett-Burman, 1946).

\(N\) 최대 요인 수
8 7
12 11
16 15
20 19
24 23
28 27

PB design 은 산업 screening 에서 표준 — 많은 요인 중 영향 큰 것을 빠르게 식별.

직관: Saturated 의 trade-off

Saturated design 은 효과 추정만 가능 (분산 추정 불가능). 검정을 위해서는:

  1. 반복: 일부 셀 반복 → 잔차 추정.
  2. 사전 가정: 일부 효과 = 0 가정 (보통 작은 효과).
  3. 확장 (foldover): 모든 부호를 뒤집은 설계 추가 → resolution ↑.

PB design 은 “가장 큰 효과” 를 빠르게 찾는 screening 단계. 주요 요인 식별 후 fractional factorial 또는 response surface 로 확장.

5 일반 \(s^k\) 의 구성 절차

  1. Defining contrasts 선택 (confounding 또는 fractioning 위한).
  2. 각 cell 에 GF(s) 좌표 부여.
  3. Block 또는 fraction 분할 (defining contrast 의 값에 따라).
  4. 각 block 또는 fraction 내에서 무작위 배정.

자세한 알고리즘: Box-Hunter-Hunter 의 “Statistics for Experimenters” 참고.

6 \(2^7\) Saturated Design (PB-8)

8 runs 에 7 요인 (\(A, B, C, D, E, F, G\)):

Run | A B C D E F G
 1  | + + + - + - -
 2  | - + + + - + -
 3  | - - + + + - +
 4  | + - - + + + -
 5  | - + - - + + +
 6  | + - + - - + +
 7  | + + - + - - +
 8  | - - - - - - -

각 column 은 4 + 와 4 - 의 균형 + 임의의 두 column 직교.

이는 \(H_8\) Hadamard matrix 의 정수형. saturated factorial 의 정수형.

7 Resolution 의 미리보기

Resolution 은 fractional factorial 의 alias 구조 (G-MON3-6).

Resolution 의미
III 주효과가 이원 상호작용과 alias
IV 주효과가 삼원 이상과 alias, 이원이 이원과 alias
V 주효과가 사원과, 이원이 삼원과 alias

PB design 은 보통 Resolution III. 주효과만 추정 가능 (이원 alias).

8 Foldover

정의: Foldover

Resolution III design 에 모든 부호를 뒤집은 fraction 추가 → Resolution IV.

원래 design + foldover = 2 배 cells. alias 구조 개선.

Original: A B C D E F G  (PB-8)
Foldover: -A -B -C -D -E -F -G

Combined: 16 cells.

각 주효과가 자기 자신과 alias (직선이 아니므로 사라짐). 즉 주효과는 alias 없음. 이원 상호작용은 여전히 일부 alias.

9 Python 코드

import numpy as np
from pyDOE2 import pbdesign, fracfact

# Plackett-Burman 8-run, 7 factors
pb = pbdesign(7)
print("=== Plackett-Burman 8-run × 7 factors ===")
print(pb)
print(f"Shape: {pb.shape}")

# 직교성 검증
print(f"\nColumn orthogonality check:")
for i in range(7):
    for j in range(i+1, 7):
        dp = np.dot(pb[:, i], pb[:, j])
        if abs(dp) > 0.01:
            print(f"  Columns {i}, {j} not orthogonal: dot = {dp}")
print("All pairs orthogonal.")

# 2^(7-4) fractional factorial via defining relations
# I = ABD = ACE = BCF = ABCG (gives III resolution)
ff = fracfact("a b c ab ac bc abc")  # 2^(7-4)
print(f"\n=== 2^(7-4) Resolution III ===")
print(ff)

# Foldover
foldover = -pb
combined = np.vstack([pb, foldover])
print(f"\n=== PB + Foldover (16 runs) ===")
print(combined)
print(f"Shape: {combined.shape}")

10 응용 — 산업 Screening

10.1 사례 — 화학 공정

15 개 잠재 영향 요인 중 가장 중요한 것 식별:

Factors: 온도, 압력, pH, 농도, 시간, 교반 속도, 첨가제 종류 (×2),
         촉매 종류, 질소 흐름, 펌프 속도, 진공도, 용매 종류,
         반응기 종류, 측정 방법.

PB-16 (16 runs, 15 factors) saturated design.

분석: - 각 요인의 main effect 추정. - Pareto chart 로 큰 효과 식별 (보통 3 ~ 5 개). - 다음 단계: 큰 요인의 fractional factorial 또는 RSM.

이는 산업 실험의 표준 첫 단계.

11 가정과 한계

  • Saturated 의 검정 불가: 반복 또는 사전 가정.
  • Resolution III 의 alias: 주효과와 이원 상호작용 alias — 이원 상호작용 = 0 가정.
  • PB 의 비주효과 alias 복잡: 분석 시 주의.
  • Foldover 의 비용: cells 2 배.

12 \(s^k\) 의 일반 design

\(s\) 표준 design
2 \(2^k\) factorial, PB, \(2^{k-p}\) fractional
3 \(3^k\) factorial, \(3^{k-p}\) fractional, Box-Behnken
5 \(5^k\) (드물게)
Mixed \(2^a \times 3^b\), etc.

13 ML 매핑

매핑: ML hyperparameter screening

ML 의 saturated design:

N = 12 runs.
11 hyperparameters: optimizer, lr, batch, dropout, weight decay, scheduler,
warmup, momentum, initializer, normalization, activation.

PB-12 design 으로 11 hyperparameter 의 main effect 추정.

검정 불가능 (saturated). 그러나 큰 효과의 hyperparameter 식별: - 각 effect 의 절댓값 계산. - Pareto chart 로 큰 효과 식별. - 큰 hyperparameter 만 다음 grid 에서 fine-tune.

이는 ML 의 hyperparameter 차원 축소의 통계적 방법. random search 보다 systematic.

14 본 시리즈

G-MON3-0  Factorial 개관
G-MON3-1  2^k Factorial
G-MON3-2  Finite Fields + Grouping
G-MON3-3  Confounding
G-MON3-4  3^k Factorial
G-MON3-5  General Construction + Maximum Number  ← 현재 글
G-MON3-6  Fractional Factorial

15 관련 주제

선행 지식

후속 주제

다른 카테고리 연결

16 더 읽을 거리

  • Plackett, R. L., Burman, J. P. (1946). “The design of optimum multifactorial experiments.” Biometrika 33(4): 305-325 — PB 원조.
  • Box, G. E. P., Hunter, J. S., Hunter, W. G. (2005). “Statistics for Experimenters.”
  • Wu, C. F. J., Hamada, M. S. (2009). “Experiments.” Wiley.
  • Hedayat, A., Sloane, N. J. A., Stufken, J. (1999). “Orthogonal Arrays.” Springer.
  • Mukerjee, R., Wu, C. F. J. (2006). “A Modern Theory of Factorial Designs.” Springer.

Subscribe

Enjoy this blog? Get notified of new posts by email: