1 Two-Pan Balance Design
각 측정에서 물건들을 두 접시에 분배. design entry \(\in \{-1, 0, +1\}\):
- \(+1\): 왼쪽 접시.
- \(-1\): 오른쪽 접시.
- \(0\): 측정에서 제외.
저울 측정값: \[ y_i = \sum_{j: x_{ij} = +1} w_j - \sum_{j: x_{ij} = -1} w_j + \varepsilon_i \] \[ = \sum_j x_{ij} w_j + \varepsilon_i \]
reinforced 는 0 사용 (= 일부 측정에 일부 물건 제외 가능). non-reinforced 는 0 없음 (모든 측정에 모든 물건 사용).
2 Reinforced vs Non-Reinforced
2.1 Non-Reinforced (\(\pm 1\) 만)
각 측정에 모든 \(p\) 물건 참여. design matrix 가 Hadamard matrix.
장점: 정보 효율 최대. 단점: 모든 측정에 모든 물건 사용 — 일부 응용에서는 일부 물건만 가능.
2.2 Reinforced (\(\pm 1, 0\))
일부 측정에 일부 물건만. 나머지는 0.
장점: 유연한 design. 단점: 효율 약간 ↓ (Hadamard 보다).
3 Hadamard Matrix 의 정수형
Hadamard matrix \(\mathbf{H}\) 의 \(\pm 1\) entry 가 정확히 chemical balance design 의 entry.
\[ \mathbf{H} \mathbf{H}^T = N \mathbf{I} \]
→ 임의의 두 행 직교, 임의의 두 열 직교.
각 무게의 분산: \[ \text{Var}(\hat w_j) = \sigma^2 \cdot [\mathbf{H}^T \mathbf{H}^{-1}]_{jj} = \sigma^2 / N \]
이는 Cramér-Rao lower bound 를 달성하는 최적 design.
4 Sylvester Hadamard Construction
\(N = 2^k\) 의 경우:
\[ \mathbf{H}_2 = \begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix} \]
재귀: \[ \mathbf{H}_{2N} = \begin{pmatrix} \mathbf{H}_N & \mathbf{H}_N \\ \mathbf{H}_N & -\mathbf{H}_N \end{pmatrix} \]
\(\mathbf{H}_4, \mathbf{H}_8, \mathbf{H}_{16}, \ldots\) 자동 생성.
5 Paley Construction
\(N = q + 1\), \(q\) prime power, \(q \equiv 3 \pmod 4\):
\(N = 4, 8, 12, 20, 24, 28, 36, ...\)
quadratic residue 활용.
6 Williamson Construction
\(N = 4 m\), \(m\) odd. 4 개의 circulant matrix 로 구성.
\(N = 12, 20, 28, 36, ...\)
7 \(H_4\) 의 4 물건 측정
\(H_4 = \begin{pmatrix} +1 & +1 & +1 & +1 \\ +1 & -1 & +1 & -1 \\ +1 & +1 & -1 & -1 \\ +1 & -1 & -1 & +1 \end{pmatrix}\)
각 행이 한 측정. 4 물건 (\(w_1, w_2, w_3, w_4\)).
측정 1: \(y_1 = w_1 + w_2 + w_3 + w_4\). 측정 2: \(y_2 = w_1 - w_2 + w_3 - w_4\). 측정 3: \(y_3 = w_1 + w_2 - w_3 - w_4\). 측정 4: \(y_4 = w_1 - w_2 - w_3 + w_4\).
추정: \[ \hat w_1 = (y_1 + y_2 + y_3 + y_4) / 4 \] \[ \hat w_2 = (y_1 - y_2 + y_3 - y_4) / 4 \] \[ \hat w_3 = (y_1 + y_2 - y_3 - y_4) / 4 \] \[ \hat w_4 = (y_1 - y_2 - y_3 + y_4) / 4 \]
각 분산 = \(\sigma^2 / 4\) (4 개 잡음의 평균).
개별 측정 (1 회/물건) 의 분산 \(\sigma^2\) 에 비해 1/4 — 4 배 정밀.
8 효율 검증
각 추정량의 분산:
Var(ŵ₁) = (Var(y₁) + Var(y₂) + Var(y₃) + Var(y₄)) / 16 = 4σ²/16 = σ²/4
마찬가지로 \(\hat w_2, \hat w_3, \hat w_4\) 도 분산 \(\sigma^2/4\).
표준오차 \(\sigma / 2\). 측정 횟수 4 회 (= 물건 수) 인데 정밀도 4 배.
9 \(H_8\) 와 8 물건
Sylvester 재귀로 \(H_8\):
H_8 = [H_4 H_4] = [+1 +1 +1 +1 +1 +1 +1 +1]
[H_4 -H_4] [+1 -1 +1 -1 +1 -1 +1 -1]
[+1 +1 -1 -1 +1 +1 -1 -1]
[+1 -1 -1 +1 +1 -1 -1 +1]
[+1 +1 +1 +1 -1 -1 -1 -1]
[+1 -1 +1 -1 -1 +1 -1 +1]
[+1 +1 -1 -1 -1 -1 +1 +1]
[+1 -1 -1 +1 -1 +1 +1 -1]
8 측정으로 8 물건 측정. 각 분산 \(\sigma^2 / 8\). 정밀도 8 배.
10 Plackett-Burman Design 의 weighing
PB design = Hadamard matrix 의 \(\pm 1\) 표현. \(N\) runs 에 \(N - 1\) factors 의 saturated factorial.
| \(N\) | Hadamard? | PB factors |
|---|---|---|
| 4 | ✓ | 3 |
| 8 | ✓ | 7 |
| 12 | ✓ (Paley) | 11 |
| 16 | ✓ | 15 |
| 20 | ✓ | 19 |
| 24 | ✓ | 23 |
산업 screening 의 표준 도구. weighing 의 정수형으로 응용.
11 측정 절차의 신뢰성
Hadamard 의 정보 효율은 저울이 정확하다는 가정. 실제로는:
- Calibration drift: 시간이 지나며 저울 zero point 변화.
- Operator effect: 측정자마다 약간 다름.
- Environmental: 온도, 진동, 습도 영향.
이는 측정 잡음 \(\varepsilon\) 의 추가 source. Hadamard 가 잡음에 robust 하지만 systematic 오차에는 약함.
해결: - Reference weight 포함: 한 측정에 known reference 무게도 같이. - Replicate: 같은 측정 반복 (시간 분산). - Randomized order: 측정 순서 무작위화.
12 Reinforced Design
Reinforced 는 일부 측정에 일부 물건 제외 가능. 0 entry 사용.
이는 Hadamard 의 일반화 — 모든 측정에 모든 물건이 들어가지 않아도 됨.
12.1 사례 — 8 물건 중 4 만 사용
\(H_8\) 의 일부 column 만 사용 → 4 물건의 8 측정. 나머지 column 은 0.
추가 측정: 다른 4 물건의 4 측정 (\(H_4\) 사용).
총 12 측정으로 8 물건 측정. 효율 약간 ↓ 이지만 유연.
13 D-Optimal Weighing
design 의 정보 행렬 \(\mathbf{X}^T \mathbf{X}\) 의 결정자 (determinant) 를 최대화.
\[ D = |\mathbf{X}^T \mathbf{X}|^{1/p} \]
Hadamard matrix 가 \(\pm 1\) entry 의 D-optimal: \(|\mathbf{X}^T \mathbf{X}| = N^p\).
D-optimal weighing 은 Hadamard 가 자명한 답. non-Hadamard 모수 (\(N \ne 4k\)) 에서는 D-optimal 검색 (computer algorithm 으로).
14 응용 — 산업 측정 표준화
14.1 사례 — 표준 무게 calibration
NIST (미국 표준기술연구소) 가 표준 무게 (1 kg, 100 g, 10 g, …) 를 calibration. 수십 표준 무게를 동시에 측정하기 위해 weighing design.
전통적 방법: 각 표준 따로 측정. Hadamard 방법: 동시 측정 + 회귀로 분리. 정밀도 ↑.
이는 NIST 의 전통적 도구.
14.2 사례 — 분동 비교
기준 분동 (1 kg 표준) 과 작은 분동 (1 g, 10 g) 의 비교 측정. 누적적 측정으로 작은 분동의 무게 정밀도 ↑.
이는 chemical balance 의 자연스러운 응용.
15 Python 코드 — H_8 Weighing
import numpy as np
from scipy.linalg import hadamard
# H_8 (Sylvester)
H8 = hadamard(8)
# 직교성 검증
print(f"H_8 ⋅ H_8.T = {H8 @ H8.T}")
print(f"= 8I? {np.allclose(H8 @ H8.T, 8 * np.eye(8))}")
# 8 물건 무게 측정
np.random.seed(2026)
true_w = np.array([0.5, 0.7, 0.3, 0.9, 0.4, 0.6, 0.8, 0.2])
sigma = 0.05 # 측정 잡음 표준편차
# 측정
y = H8 @ true_w + np.random.normal(0, sigma, 8)
print(f"\n측정값 y: {y.round(3)}")
# 추정
w_hat = (1/8) * H8.T @ y
print(f"\n추정 무게: {w_hat.round(4)}")
print(f"진짜 무게: {true_w.round(4)}")
print(f"오차: {(w_hat - true_w).round(4)}")
print(f"RMSE: {np.sqrt(np.mean((w_hat - true_w)**2)):.4f}")
# 이론적 표준오차
se_theory = sigma / np.sqrt(8)
print(f"\n이론적 SE: {se_theory:.4f}")
# 1000 회 시뮬레이션 — 분산 검증
n_sim = 1000
errs = []
for _ in range(n_sim):
y_sim = H8 @ true_w + np.random.normal(0, sigma, 8)
w_sim = (1/8) * H8.T @ y_sim
errs.append(w_sim - true_w)
errs = np.array(errs)
print(f"\nMonte Carlo (N={n_sim}):")
print(f" Empirical SE per weight: {errs.std(axis=0).mean():.4f}")
print(f" Theoretical SE: {se_theory:.4f}")
# Reinforced — 일부 측정 제외
# H_8 의 첫 4 측정만 사용 → 효율 손실
H_partial = H8[:4]
print(f"\n=== Reinforced (4/8 measurements) ===")
y_partial = H_partial @ true_w + np.random.normal(0, sigma, 4)
# pseudo-inverse 로 추정 (underdetermined 가능)
w_partial = np.linalg.lstsq(H_partial, y_partial, rcond=None)[0]
print(f"부분 추정: {w_partial.round(4)} (4 측정으로 8 물건 — underdetermined)")16 다중 측정의 결합
각 weighing design 의 각 무게 추정량은 BLUE (Best Linear Unbiased Estimator). 분산 최소.
여러 different design 의 결과 결합:
\[ \hat w_j^{\text{combined}} = \frac{\sum_i w_i \hat w_j^{(i)}}{\sum_i w_i} \]
\(w_i = 1/\hat\sigma_i^2\). inverse-variance weighting.
이는 메타분석의 동일 도구.
17 가정과 한계
17.1 Chemical Balance 의 가정
- 잡음 등분산: 모든 측정 같은 \(\sigma^2\).
- 잡음 독립성: 측정 간 독립.
- 저울 linearity: 무게 가산성.
- 저울 calibration: 무편향.
17.2 실용 한계
- 2-pan 저울 필요: 1-pan 저울로는 spring balance 만.
- Hadamard 의 존재: \(N = 4k\) 만 표준. 다른 \(N\) 은 truncated 또는 PBD.
- 측정 시간: 동시 측정의 시간이 길수록 calibration drift.
- 물건 수의 제약: \(p \le N\).
18 디지털 응용
ML 모델의 다중 평가:
Designs: $H_8$ — 8 모델 평가, 8 dataset combination
각 평가는 일부 모델의 ensemble accuracy.
이는 spring balance 와 비슷 — non-negative weights.
만약 모델의 개별 contribution 을 분리하려면 회귀로 추정.
이는 모델 selection 의 통계적 형식. 단일 모델 평가가 아니라 동시 평가로 효율 ↑.
19 본 시리즈
G-MON9-0 개관
G-MON9-1 Definition + Estimation
G-MON9-2 One Pan from BIB
G-MON9-3 Two Pan Weighing ← 현재 글
G-MON9-4 PBIB + Truncated + Efficiency
20 관련 주제
선행 지식
후속 주제
다른 카테고리 연결
- Math — Linear Algebra (placeholder) — Hadamard, eigenvalue
- Statistics — SLR BLUE
21 더 읽을 거리
- Hotelling, H. (1944). “Some improvements in weighing and other experimental techniques.” Annals of Mathematical Statistics 15: 297-306.
- Plackett, R. L., Burman, J. P. (1946). “The design of optimum multifactorial experiments.” Biometrika 33(4): 305-325.
- Banerjee, K. S. (1975). “Weighing Designs.” Marcel Dekker.
- Sloane, N. J. A. “A Library of Hadamard Matrices.” http://neilsloane.com/hadamard/
- Hedayat, A., Wallis, W. D. (1978). “Hadamard matrices and their applications.” Annals of Statistics 6(6): 1184-1238.