1 Two-Associate PBIB
처치 쌍이 association scheme 에 따라 분류되어, 같은 association class 의 쌍은 같은 \(\lambda_i\) 로 같은 블록에 등장. 2 class 만 사용하는 PBIB.
\((v, b, r, k, \lambda_1, \lambda_2)\) 의 6 모수.
BIB 의 일반화: BIB 는 \(\lambda_1 = \lambda_2 = \lambda\) 인 1-class.
2 왜 PBIB 가 weighing 에 필요한가
BIB 가 존재하지 않는 모수 (예: \(v = 6, k = 3\)) 에서 PBIB 활용. 더 유연한 design.
또는 BIB 가 존재하지만 너무 많은 측정이 필요할 때 PBIB 가 부분적 균형으로 효율 절약.
3 PBIB 의 weighing 적용
PBIB 의 incidence matrix 가 weighing design 의 design matrix.
각 무게의 분산은 association class 별 다른 가중치:
\[ \text{Var}(\hat w_j) = \sigma^2 \cdot c_{jj} \]
\(c_{jj}\) 는 \((\mathbf{X}^T \mathbf{X})^{-1}\) 의 대각 원소. PBIB 의 비균등 구조로 약간 다름.
4 2-Class PBIB 사례
\(v = 6\) 처치, \(b = 6\) 블록, \(k = 3\), \(r = 3\).
처치 쌍의 association: - Class 1 (인접): \(\lambda_1 = 1\) - Class 2 (반대): \(\lambda_2 = 2\)
Block 1: {1, 2, 3}
Block 2: {4, 5, 6}
Block 3: {1, 4, 5}
Block 4: {2, 5, 6}
Block 5: {1, 2, 6}
Block 6: {3, 4, 5}
처치 쌍 등장 빈도가 \(\lambda_1 = 1\) 또는 \(\lambda_2 = 2\) 의 두 값만.
이 design 을 weighing 에 적용: - 각 측정에 3 물건. - 각 물건 3 회 등장. - 어떤 두 물건은 1 번 같이 (class 1), 다른 두 물건은 2 번 같이 (class 2).
추정 정밀도가 두 association class 마다 다름 — 일부 물건 쌍 비교가 정밀, 다른 쌍은 덜 정밀.
5 Truncated Incomplete Block
BIB 의 일부 블록 또는 일부 처치를 제거한 design. 비균등 구조.
\(N\) 측정 capacity 가 BIB 의 \(b\) 측정보다 작을 때 사용.
5.1 사례
\((v, b, r, k, \lambda) = (7, 7, 3, 3, 1)\) BIB. 그러나 자원이 5 측정만 허용.
Truncated 방법: BIB 의 7 블록 중 5 만 선택. 나머지 2 는 폐기.
영향: - 일부 처치의 등장 횟수 ↓ (예: 처치 1 이 3 → 2 회). - 일부 쌍의 등장 횟수 ↓ (예: 쌍 (1,2) 가 1 → 0 회). - 추정 정밀도 ↓.
6 효율의 정량화
| 측도 | 정의 | 의미 |
|---|---|---|
| A-efficiency | \(\frac{p}{N \cdot \text{tr}((\mathbf{X}^T\mathbf{X})^{-1})}\) | 평균 분산 비교 |
| D-efficiency | \(\frac{|\mathbf{X}^T\mathbf{X}|^{1/p}}{N}\) | 결정자 (volume) |
| E-efficiency | \(\frac{\lambda_{\min}(\mathbf{X}^T\mathbf{X})}{N}\) | 최소 eigenvalue |
각 측도가 0 ~ 1 사이. 1 = 최적 (Hadamard 같은 직교).
6.1 Hadamard 의 효율
\(\mathbf{X}^T\mathbf{X} = N \mathbf{I}\) → 모든 효율 측도 = 1.
6.2 BIB 의 효율 (spring)
A-eff: \[ e_A^{\text{BIB}} \approx \frac{r \lambda v}{N \cdot k \cdot (r - \lambda)} \]
(근사 — 정확한 식은 BIB 모수에 의존.)
일반적으로 0.4~0.6.
6.3 PBIB 의 효율
PBIB 가 BIB 보다 약간 낮음. 비균등 구조로.
일반적으로 0.3~0.5.
6.4 Truncated 의 효율
BIB 의 60% 이하 (제거된 블록 수에 비례).
7 효율 비교 표
8 물건 측정, 다양한 design:
| Design | 측정 수 | A-efficiency | 분산 (per weight) |
|---|---|---|---|
| 개별 | 8 | \(1/8\) | \(\sigma^2\) |
| Hadamard \(H_8\) | 8 | 1 | \(\sigma^2 / 8\) |
| BIB \((8, 14, 7, 4, 3)\) spring | 14 | 0.5 | \(\sigma^2 / 7\) |
| PBIB \((8, b, r, k, \lambda_1, \lambda_2)\) | 변동 | 0.4 | \(\sigma^2 / 5.6\) |
| Truncated BIB | 10 | 0.4 | \(\sigma^2 / 5\) |
(가상 수치 — 정확한 모수에 의존.)
Hadamard 가 절대적 최적. 다른 design 은 자원 또는 형식 제약 있을 때.
8 컴퓨터 보조 design
큰 \(v, N\) 에서 최적 design 검색:
- Coordinate exchange: D-optimal.
- Simulated annealing: 모든 기준.
- Genetic algorithm: 비표준 design.
R 패키지: AlgDesign, optFederov, dsigndoe.
Python: pyDOE2, dexpy, custom code.
9 가정과 한계
- 분산 의 등분산: 같은 잡음.
- 선형 모형: 무게 가산성.
- Design 존재: 모든 모수에 BIB/PBIB 존재 안 함.
- 컴퓨터 검색의 local optima.
10 Phase G 정통 DOE 시리즈의 마무리
Phase G — 89 편
Maxwell (G-MAX6~16, 47 편) — 심리학·임상 lens
Ch.6: Trend Analysis (양적 요인의 추세)
Ch.7~8: Factorial (이원, 삼원)
Ch.9: ANCOVA (공변량 통제)
Ch.10: Random/Nested
Ch.11~12: Within-Subjects (univariate)
Ch.13~14: Within-Subjects (multivariate)
Ch.15~16: Multilevel
Montgomery (G-MON2~9, 42 편) — 농학·산업 lens
Ch.2: Complete Block (CRD, RBD, Latin Square)
Ch.3: Factorial (2^k, 3^k, fractional)
Ch.4: Asymmetrical, Split-Plot
Ch.5: Incomplete Block (BIB, PBIB)
Ch.6: Orthogonal Latin Squares (Euler's conjecture)
Ch.7: Bio-assays, Response Surface
Ch.8: ANCOVA, Transformation
Ch.9: Weighing Designs ← 현재 (Phase G 마지막)
→ 후속 Phase H (통계 모델링), Phase F (Kohavi A/B), Phase I (활용 응용)
이 89 편이 정통 DOE 의 통합 reference 를 제공한다. 각 챕터의 lens 는 다르지만 (심리학 vs 농학·산업) 통계적 도구 (직교성, BLUE, EMS, multilevel, multivariate) 는 공통.
산업·임상 실험 설계의 거의 모든 표준 도구가 이 시리즈에 포함되어 있다. 후속 시리즈에서 이 도구를 IT (Phase F: Kohavi), 인과추론 (Phase D), 의료기기 (Phase I) 의 specific 영역 으로 확장한다.
11 Phase G 의 핵심 통찰 5 가지
11.1 1. 직교성 = 정보 효율
ANOVA, factorial, BIB, Latin Square, weighing 모두 직교 design 이 정보 효율 최대 (G-MON9 의 weighing 으로 정점).
11.2 2. Random vs Fixed = 일반화 범위
고정 효과 → 그 levels 한정. 임의 효과 → 모집단 일반화. 결정은 도메인 + 연구 목적.
11.3 3. Multilevel = ANOVA 의 일반화
모든 ANOVA 가 mixed model 의 특수 사례. 결측 자동 처리, 비균등 데이터에 강.
11.4 4. Trend / Curve / Surface = 양적 처치의 정수
단일 양적 요인 → trend (G-MAX6). 여러 양적 요인 → response surface (G-MON7). 모두 직교 다항식 + 회귀의 정수.
11.5 5. Incomplete Block = 자원 제약 하의 균형
BIB, PBIB, weighing 모두 제한 자원으로 균형 정보를 유지하는 도구.
12 후속 Phase 와의 연결
12.1 Phase F (Kohavi A/B Test)
이 시리즈의 통계 도구가 IT A/B test 의 정수형. CUPED (variance reduction) → ANCOVA. multivariate testing → factorial. Sequential testing → 정통 SPRT (Wald).
12.2 Phase D (Causal Inference)
ANOVA + ANCOVA → potential outcomes framework. RCT → factorial × randomization. ITT → intention-to-treat 분석 (G-MON2).
12.3 Phase H (통계 모델링)
GLM, mixed model 의 일반화. Phase G 의 ANOVA, ANCOVA, multilevel 가 통합.
12.4 Phase I (Advanced Applications)
의료기기 규제 (FDA), 임상시험 장기 추적, 다센터 시험. 모두 정통 DOE 의 lens.
13 응용 — 마지막 사례
13.1 NIST 표준 무게의 weighing
미국 표준기술연구소 (NIST) 가 표준 무게 (1 kg, 1 g, …) 의 정확한 calibration 을 한 저울 weighing design 으로 수행.
수십 표준 무게의 동시 측정 + Hadamard 회귀 → 절대 정밀도 극한.
이는 정통 DOE 의 가장 정밀한 응용.
13.2 천문학 — 별 광도
여러 별의 광도를 한 photometer 로 측정. 대기 변화 영향 통제.
13.3 의약 — 효능 비교
여러 약물의 동시 비교. PBIB 활용 (BIB 가 안 될 때).
13.4 IT — 다중 모델 평가
여러 ML 모델의 ensemble 평가. weighing 의 ML 형식.
14 Python 코드 — 효율 비교
import numpy as np
from scipy.linalg import hadamard
# 효율 비교 — 8 물건
N = 8
# Hadamard
H8 = hadamard(8)
XtX_H = H8.T @ H8
A_eff_H = N / np.trace(np.linalg.inv(XtX_H)) / N
D_eff_H = np.linalg.det(XtX_H)**(1/8) / N
E_eff_H = np.linalg.eigvalsh(XtX_H).min() / N
# BIB (7, 7, 3, 3, 1) 의 weighing 적용 (7 물건, 7 측정)
bib_X = np.array([
[1, 1, 0, 1, 0, 0, 0],
[0, 1, 1, 0, 1, 0, 0],
[0, 0, 1, 1, 0, 1, 0],
[0, 0, 0, 1, 1, 0, 1],
[1, 0, 0, 0, 1, 1, 0],
[0, 1, 0, 0, 0, 1, 1],
[1, 0, 1, 0, 0, 0, 1],
])
N_bib = 7
XtX_bib = bib_X.T @ bib_X
A_eff_bib = 7 / np.trace(np.linalg.inv(XtX_bib)) / N_bib
D_eff_bib = np.linalg.det(XtX_bib)**(1/7) / N_bib
E_eff_bib = np.linalg.eigvalsh(XtX_bib).min() / N_bib
print("=== Efficiency comparison ===")
print(f"Hadamard H_8 (chemical):")
print(f" A-eff = {A_eff_H:.3f}")
print(f" D-eff = {D_eff_H:.3f}")
print(f" E-eff = {E_eff_H:.3f}")
print(f"\nBIB (7,7,3,3,1) (spring):")
print(f" A-eff = {A_eff_bib:.3f}")
print(f" D-eff = {D_eff_bib:.3f}")
print(f" E-eff = {E_eff_bib:.3f}")
print(f"\nHadamard 가 모든 측면에서 최적 (= 1).")
print(f"BIB 효율 ≈ 0.5 (chemical 의 절반).")15 Phase G 후의 학습 경로
이 시리즈를 완료한 독자에게 권장:
- Phase H (통계 모델링): GLM, mixed model 의 종합. ANOVA·회귀의 일반화.
- Phase F (Kohavi A/B): IT 의 정통 DOE 적용.
- Phase D (Causal Inference): ANOVA·ANCOVA 의 인과 lens.
- Phase B (Epidemiology): RCT, cohort, case-control 의 정통.
- Phase I (Advanced): regulatory, FDA, multicenter trial.
Phase G 의 도구를 가장 널리 활용하는 영역: - 임상시험 통계 (FDA submission). - 산업 SPC (Statistical Process Control). - 농학 실험 (USDA, BARC). - 약리학 (pharmacology, ADMET). - ML hyperparameter tuning (RSM, Bayesian optimization).
16 본 시리즈
G-MON9-0 Weighing Designs 개관
G-MON9-1 Definition + Estimation
G-MON9-2 One Pan from BIB
G-MON9-3 Two Pan Weighing (Hadamard)
G-MON9-4 PBIB + Truncated + Efficiency ← 현재 글 (Phase G 마지막)
17 가정과 한계 — 종합
- 선형 모형: 무게 가산성.
- 잡음 등분산·독립: 표준 가정.
- Design 존재: BIB/PBIB 가 모든 모수에 존재 안 함.
- 효율의 한계: spring < chemical, truncated < complete.
- 저울 calibration: 정밀 측정에 핵심.
18 관련 주제
선행 지식
후속 주제 — Phase G 외부
- Phase H — 통계 모델링 (GLM, mixed model)
- Phase F — Kohavi A/B Test
- Phase D — Causal Inference
- Phase I — Advanced Applications
다른 카테고리 연결
19 더 읽을 거리
- Banerjee, K. S. (1975). “Weighing Designs.” Marcel Dekker.
- Raghavarao, D. (1971). “Constructions and Combinatorial Problems in Design of Experiments.” Wiley.
- Hedayat, A., Sloane, N. J. A., Stufken, J. (1999). “Orthogonal Arrays: Theory and Applications.” Springer.
- Cheng, C.-S. (2014). “Theory of Factorial Design: Single- and Multi-Stratum Experiments.” CRC Press.
20 Phase G 마무리
이 글이 Phase G 정통 DOE 시리즈 89 편의 마지막. 89 편이 ANOVA · factorial · 회귀 · 다층 모형 · 비대칭 설계 · BIB · 직교 Latin Squares · response surface · weighing 의 모든 정통 도구를 포괄.
후속 Phase 가 이 도구의 specific 영역 (IT, 인과, 의료) 으로 확장. 정통 DOE 는 통계 실험 설계의 universal language — 어느 영역이든 이 도구를 익히면 새 분야의 통계 도구 를 자연스럽게 이해할 수 있다.