Kwangmin Kim - PBIB · Truncated · 효율

1 Two-Associate PBIB

정의: Two-Associate PBIB Design

처치 쌍이 association scheme 에 따라 분류되어, 같은 association class 의 쌍은 같은 \(\lambda_i\) 로 같은 블록에 등장. 2 class 만 사용하는 PBIB.

\((v, b, r, k, \lambda_1, \lambda_2)\) 의 6 모수.

BIB 의 일반화: BIB 는 \(\lambda_1 = \lambda_2 = \lambda\) 인 1-class.

2 왜 PBIB 가 weighing 에 필요한가

BIB 가 존재하지 않는 모수 (예: \(v = 6, k = 3\)) 에서 PBIB 활용. 더 유연한 design.

또는 BIB 가 존재하지만 너무 많은 측정이 필요할 때 PBIB 가 부분적 균형으로 효율 절약.

3 PBIB 의 weighing 적용

PBIB 의 incidence matrix 가 weighing design 의 design matrix.

각 무게의 분산은 association class 별 다른 가중치:

\[ \text{Var}(\hat w_j) = \sigma^2 \cdot c_{jj} \]

\(c_{jj}\) 는 \((\mathbf{X}^T \mathbf{X})^{-1}\) 의 대각 원소. PBIB 의 비균등 구조로 약간 다름.

4 2-Class PBIB 사례

\(v = 6\) 처치, \(b = 6\) 블록, \(k = 3\), \(r = 3\).

처치 쌍의 association: - Class 1 (인접): \(\lambda_1 = 1\) - Class 2 (반대): \(\lambda_2 = 2\)

Block 1: {1, 2, 3}
Block 2: {4, 5, 6}
Block 3: {1, 4, 5}
Block 4: {2, 5, 6}
Block 5: {1, 2, 6}
Block 6: {3, 4, 5}

처치 쌍 등장 빈도가 \(\lambda_1 = 1\) 또는 \(\lambda_2 = 2\) 의 두 값만.

이 design 을 weighing 에 적용: - 각 측정에 3 물건. - 각 물건 3 회 등장. - 어떤 두 물건은 1 번 같이 (class 1), 다른 두 물건은 2 번 같이 (class 2).

추정 정밀도가 두 association class 마다 다름 — 일부 물건 쌍 비교가 정밀, 다른 쌍은 덜 정밀.

5 Truncated Incomplete Block

정의: Truncated Incomplete Block Design

BIB 의 일부 블록 또는 일부 처치를 제거한 design. 비균등 구조.

\(N\) 측정 capacity 가 BIB 의 \(b\) 측정보다 작을 때 사용.

5.1 사례

\((v, b, r, k, \lambda) = (7, 7, 3, 3, 1)\) BIB. 그러나 자원이 5 측정만 허용.

Truncated 방법: BIB 의 7 블록 중 5 만 선택. 나머지 2 는 폐기.

영향: - 일부 처치의 등장 횟수 ↓ (예: 처치 1 이 3 → 2 회). - 일부 쌍의 등장 횟수 ↓ (예: 쌍 (1,2) 가 1 → 0 회). - 추정 정밀도 ↓.

6 효율의 정량화

정의: Design Efficiency 측도

측도	정의	의미
A-efficiency	\(\frac{p}{N \cdot \text{tr}((\mathbf{X}^T\mathbf{X})^{-1})}\)	평균 분산 비교
D-efficiency	\(\frac{\|\mathbf{X}^T\mathbf{X}\|^{1/p}}{N}\)	결정자 (volume)
E-efficiency	\(\frac{\lambda_{\min}(\mathbf{X}^T\mathbf{X})}{N}\)	최소 eigenvalue

각 측도가 0 ~ 1 사이. 1 = 최적 (Hadamard 같은 직교).

6.1 Hadamard 의 효율

\(\mathbf{X}^T\mathbf{X} = N \mathbf{I}\) → 모든 효율 측도 = 1.

6.2 BIB 의 효율 (spring)

A-eff: \[ e_A^{\text{BIB}} \approx \frac{r \lambda v}{N \cdot k \cdot (r - \lambda)} \]

(근사 — 정확한 식은 BIB 모수에 의존.)

일반적으로 0.4~0.6.

6.3 PBIB 의 효율

PBIB 가 BIB 보다 약간 낮음. 비균등 구조로.

일반적으로 0.3~0.5.

6.4 Truncated 의 효율

BIB 의 60% 이하 (제거된 블록 수에 비례).

7 효율 비교 표

8 물건 측정, 다양한 design:

Design	측정 수	A-efficiency	분산 (per weight)
개별	8	\(1/8\)	\(\sigma^2\)
Hadamard \(H_8\)	8	1	\(\sigma^2 / 8\)
BIB \((8, 14, 7, 4, 3)\) spring	14	0.5	\(\sigma^2 / 7\)
PBIB \((8, b, r, k, \lambda_1, \lambda_2)\)	변동	0.4	\(\sigma^2 / 5.6\)
Truncated BIB	10	0.4	\(\sigma^2 / 5\)

(가상 수치 — 정확한 모수에 의존.)

Hadamard 가 절대적 최적. 다른 design 은 자원 또는 형식 제약 있을 때.

8 컴퓨터 보조 design

큰 \(v, N\) 에서 최적 design 검색:

Coordinate exchange: D-optimal.
Simulated annealing: 모든 기준.
Genetic algorithm: 비표준 design.

R 패키지: AlgDesign, optFederov, dsigndoe.

Python: pyDOE2, dexpy, custom code.

9 가정과 한계

분산 의 등분산: 같은 잡음.
선형 모형: 무게 가산성.
Design 존재: 모든 모수에 BIB/PBIB 존재 안 함.
컴퓨터 검색의 local optima.

10 Phase G 정통 DOE 시리즈의 마무리

회고: 89 편의 정통 DOE 흐름

Phase G — 89 편

Maxwell (G-MAX6~16, 47 편) — 심리학·임상 lens
    Ch.6: Trend Analysis (양적 요인의 추세)
    Ch.7~8: Factorial (이원, 삼원)
    Ch.9: ANCOVA (공변량 통제)
    Ch.10: Random/Nested
    Ch.11~12: Within-Subjects (univariate)
    Ch.13~14: Within-Subjects (multivariate)
    Ch.15~16: Multilevel

Montgomery (G-MON2~9, 42 편) — 농학·산업 lens
    Ch.2: Complete Block (CRD, RBD, Latin Square)
    Ch.3: Factorial (2^k, 3^k, fractional)
    Ch.4: Asymmetrical, Split-Plot
    Ch.5: Incomplete Block (BIB, PBIB)
    Ch.6: Orthogonal Latin Squares (Euler's conjecture)
    Ch.7: Bio-assays, Response Surface
    Ch.8: ANCOVA, Transformation
    Ch.9: Weighing Designs  ← 현재 (Phase G 마지막)

→ 후속 Phase H (통계 모델링), Phase F (Kohavi A/B), Phase I (활용 응용)

이 89 편이 정통 DOE 의 통합 reference 를 제공한다. 각 챕터의 lens 는 다르지만 (심리학 vs 농학·산업) 통계적 도구 (직교성, BLUE, EMS, multilevel, multivariate) 는 공통.

산업·임상 실험 설계의 거의 모든 표준 도구가 이 시리즈에 포함되어 있다. 후속 시리즈에서 이 도구를 IT (Phase F: Kohavi), 인과추론 (Phase D), 의료기기 (Phase I) 의 specific 영역 으로 확장한다.

11 Phase G 의 핵심 통찰 5 가지

11.1 1. 직교성 = 정보 효율

ANOVA, factorial, BIB, Latin Square, weighing 모두 직교 design 이 정보 효율 최대 (G-MON9 의 weighing 으로 정점).

11.2 2. Random vs Fixed = 일반화 범위

고정 효과 → 그 levels 한정. 임의 효과 → 모집단 일반화. 결정은 도메인 + 연구 목적.

11.3 3. Multilevel = ANOVA 의 일반화

모든 ANOVA 가 mixed model 의 특수 사례. 결측 자동 처리, 비균등 데이터에 강.

11.4 4. Trend / Curve / Surface = 양적 처치의 정수

단일 양적 요인 → trend (G-MAX6). 여러 양적 요인 → response surface (G-MON7). 모두 직교 다항식 + 회귀의 정수.

11.5 5. Incomplete Block = 자원 제약 하의 균형

BIB, PBIB, weighing 모두 제한 자원으로 균형 정보를 유지하는 도구.

12 후속 Phase 와의 연결

12.1 Phase F (Kohavi A/B Test)

이 시리즈의 통계 도구가 IT A/B test 의 정수형. CUPED (variance reduction) → ANCOVA. multivariate testing → factorial. Sequential testing → 정통 SPRT (Wald).

12.2 Phase D (Causal Inference)

ANOVA + ANCOVA → potential outcomes framework. RCT → factorial × randomization. ITT → intention-to-treat 분석 (G-MON2).

12.3 Phase H (통계 모델링)

GLM, mixed model 의 일반화. Phase G 의 ANOVA, ANCOVA, multilevel 가 통합.

12.4 Phase I (Advanced Applications)

의료기기 규제 (FDA), 임상시험 장기 추적, 다센터 시험. 모두 정통 DOE 의 lens.

13 응용 — 마지막 사례

13.1 NIST 표준 무게의 weighing

미국 표준기술연구소 (NIST) 가 표준 무게 (1 kg, 1 g, …) 의 정확한 calibration 을 한 저울 weighing design 으로 수행.

수십 표준 무게의 동시 측정 + Hadamard 회귀 → 절대 정밀도 극한.

이는 정통 DOE 의 가장 정밀한 응용.

13.2 천문학 — 별 광도

여러 별의 광도를 한 photometer 로 측정. 대기 변화 영향 통제.

13.3 의약 — 효능 비교

여러 약물의 동시 비교. PBIB 활용 (BIB 가 안 될 때).

13.4 IT — 다중 모델 평가

여러 ML 모델의 ensemble 평가. weighing 의 ML 형식.

14 Python 코드 — 효율 비교

import numpy as np
from scipy.linalg import hadamard

# 효율 비교 — 8 물건
N = 8

# Hadamard
H8 = hadamard(8)
XtX_H = H8.T @ H8
A_eff_H = N / np.trace(np.linalg.inv(XtX_H)) / N
D_eff_H = np.linalg.det(XtX_H)**(1/8) / N
E_eff_H = np.linalg.eigvalsh(XtX_H).min() / N

# BIB (7, 7, 3, 3, 1) 의 weighing 적용 (7 물건, 7 측정)
bib_X = np.array([
    [1, 1, 0, 1, 0, 0, 0],
    [0, 1, 1, 0, 1, 0, 0],
    [0, 0, 1, 1, 0, 1, 0],
    [0, 0, 0, 1, 1, 0, 1],
    [1, 0, 0, 0, 1, 1, 0],
    [0, 1, 0, 0, 0, 1, 1],
    [1, 0, 1, 0, 0, 0, 1],
])
N_bib = 7
XtX_bib = bib_X.T @ bib_X
A_eff_bib = 7 / np.trace(np.linalg.inv(XtX_bib)) / N_bib
D_eff_bib = np.linalg.det(XtX_bib)**(1/7) / N_bib
E_eff_bib = np.linalg.eigvalsh(XtX_bib).min() / N_bib

print("=== Efficiency comparison ===")
print(f"Hadamard H_8 (chemical):")
print(f"  A-eff = {A_eff_H:.3f}")
print(f"  D-eff = {D_eff_H:.3f}")
print(f"  E-eff = {E_eff_H:.3f}")

print(f"\nBIB (7,7,3,3,1) (spring):")
print(f"  A-eff = {A_eff_bib:.3f}")
print(f"  D-eff = {D_eff_bib:.3f}")
print(f"  E-eff = {E_eff_bib:.3f}")

print(f"\nHadamard 가 모든 측면에서 최적 (= 1).")
print(f"BIB 효율 ≈ 0.5 (chemical 의 절반).")

15 Phase G 후의 학습 경로

이 시리즈를 완료한 독자에게 권장:

Phase H (통계 모델링): GLM, mixed model 의 종합. ANOVA·회귀의 일반화.
Phase F (Kohavi A/B): IT 의 정통 DOE 적용.
Phase D (Causal Inference): ANOVA·ANCOVA 의 인과 lens.
Phase B (Epidemiology): RCT, cohort, case-control 의 정통.
Phase I (Advanced): regulatory, FDA, multicenter trial.

Phase G 의 도구를 가장 널리 활용하는 영역: - 임상시험 통계 (FDA submission). - 산업 SPC (Statistical Process Control). - 농학 실험 (USDA, BARC). - 약리학 (pharmacology, ADMET). - ML hyperparameter tuning (RSM, Bayesian optimization).

16 본 시리즈

G-MON9-0  Weighing Designs 개관
G-MON9-1  Definition + Estimation
G-MON9-2  One Pan from BIB
G-MON9-3  Two Pan Weighing (Hadamard)
G-MON9-4  PBIB + Truncated + Efficiency  ← 현재 글 (Phase G 마지막)

17 가정과 한계 — 종합

선형 모형: 무게 가산성.
잡음 등분산·독립: 표준 가정.
Design 존재: BIB/PBIB 가 모든 모수에 존재 안 함.
효율의 한계: spring < chemical, truncated < complete.
저울 calibration: 정밀 측정에 핵심.

18 관련 주제

선행 지식

후속 주제 — Phase G 외부

Phase H — 통계 모델링 (GLM, mixed model)
Phase F — Kohavi A/B Test
Phase D — Causal Inference
Phase I — Advanced Applications

다른 카테고리 연결

19 더 읽을 거리

Banerjee, K. S. (1975). “Weighing Designs.” Marcel Dekker.
Raghavarao, D. (1971). “Constructions and Combinatorial Problems in Design of Experiments.” Wiley.
Hedayat, A., Sloane, N. J. A., Stufken, J. (1999). “Orthogonal Arrays: Theory and Applications.” Springer.
Cheng, C.-S. (2014). “Theory of Factorial Design: Single- and Multi-Stratum Experiments.” CRC Press.

20 Phase G 마무리

이 글이 Phase G 정통 DOE 시리즈 89 편의 마지막. 89 편이 ANOVA · factorial · 회귀 · 다층 모형 · 비대칭 설계 · BIB · 직교 Latin Squares · response surface · weighing 의 모든 정통 도구를 포괄.

후속 Phase 가 이 도구의 specific 영역 (IT, 인과, 의료) 으로 확장. 정통 DOE 는 통계 실험 설계의 universal language — 어느 영역이든 이 도구를 익히면 새 분야의 통계 도구 를 자연스럽게 이해할 수 있다.