Kwangmin Kim - 2 접시 계량 (Reinforced) — Hadamard chemical balance 의 정수

1 Two-Pan Balance Design

정의: Chemical Balance Weighing Design

각 측정에서 물건들을 두 접시에 분배. design entry \(\in \{-1, 0, +1\}\):

\(+1\): 왼쪽 접시.
\(-1\): 오른쪽 접시.
\(0\): 측정에서 제외.

저울 측정값: \[ y_i = \sum_{j: x_{ij} = +1} w_j - \sum_{j: x_{ij} = -1} w_j + \varepsilon_i \] \[ = \sum_j x_{ij} w_j + \varepsilon_i \]

reinforced 는 0 사용 (= 일부 측정에 일부 물건 제외 가능). non-reinforced 는 0 없음 (모든 측정에 모든 물건 사용).

2 Reinforced vs Non-Reinforced

2.1 Non-Reinforced (\(\pm 1\) 만)

각 측정에 모든 \(p\) 물건 참여. design matrix 가 Hadamard matrix.

장점: 정보 효율 최대. 단점: 모든 측정에 모든 물건 사용 — 일부 응용에서는 일부 물건만 가능.

2.2 Reinforced (\(\pm 1, 0\))

일부 측정에 일부 물건만. 나머지는 0.

장점: 유연한 design. 단점: 효율 약간 ↓ (Hadamard 보다).

3 Hadamard Matrix 의 정수형

직관: 2-pan 의 정수가 Hadamard

Hadamard matrix \(\mathbf{H}\) 의 \(\pm 1\) entry 가 정확히 chemical balance design 의 entry.

\[ \mathbf{H} \mathbf{H}^T = N \mathbf{I} \]

→ 임의의 두 행 직교, 임의의 두 열 직교.

각 무게의 분산: \[ \text{Var}(\hat w_j) = \sigma^2 \cdot [\mathbf{H}^T \mathbf{H}^{-1}]_{jj} = \sigma^2 / N \]

이는 Cramér-Rao lower bound 를 달성하는 최적 design.

4 Sylvester Hadamard Construction

\(N = 2^k\) 의 경우:

\[ \mathbf{H}_2 = \begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix} \]

재귀: \[ \mathbf{H}_{2N} = \begin{pmatrix} \mathbf{H}_N & \mathbf{H}_N \\ \mathbf{H}_N & -\mathbf{H}_N \end{pmatrix} \]

\(\mathbf{H}_4, \mathbf{H}_8, \mathbf{H}_{16}, \ldots\) 자동 생성.

5 Paley Construction

\(N = q + 1\), \(q\) prime power, \(q \equiv 3 \pmod 4\):

\(N = 4, 8, 12, 20, 24, 28, 36, ...\)

quadratic residue 활용.

6 Williamson Construction

\(N = 4 m\), \(m\) odd. 4 개의 circulant matrix 로 구성.

\(N = 12, 20, 28, 36, ...\)

7 \(H_4\) 의 4 물건 측정

\(H_4 = \begin{pmatrix} +1 & +1 & +1 & +1 \\ +1 & -1 & +1 & -1 \\ +1 & +1 & -1 & -1 \\ +1 & -1 & -1 & +1 \end{pmatrix}\)

각 행이 한 측정. 4 물건 (\(w_1, w_2, w_3, w_4\)).

측정 1: \(y_1 = w_1 + w_2 + w_3 + w_4\). 측정 2: \(y_2 = w_1 - w_2 + w_3 - w_4\). 측정 3: \(y_3 = w_1 + w_2 - w_3 - w_4\). 측정 4: \(y_4 = w_1 - w_2 - w_3 + w_4\).

추정: \[ \hat w_1 = (y_1 + y_2 + y_3 + y_4) / 4 \] \[ \hat w_2 = (y_1 - y_2 + y_3 - y_4) / 4 \] \[ \hat w_3 = (y_1 + y_2 - y_3 - y_4) / 4 \] \[ \hat w_4 = (y_1 - y_2 - y_3 + y_4) / 4 \]

각 분산 = \(\sigma^2 / 4\) (4 개 잡음의 평균).

개별 측정 (1 회/물건) 의 분산 \(\sigma^2\) 에 비해 1/4 — 4 배 정밀.

8 효율 검증

각 추정량의 분산:

Var(ŵ₁) = (Var(y₁) + Var(y₂) + Var(y₃) + Var(y₄)) / 16 = 4σ²/16 = σ²/4

마찬가지로 \(\hat w_2, \hat w_3, \hat w_4\) 도 분산 \(\sigma^2/4\).

표준오차 \(\sigma / 2\). 측정 횟수 4 회 (= 물건 수) 인데 정밀도 4 배.

9 \(H_8\) 와 8 물건

Sylvester 재귀로 \(H_8\):

H_8 = [H_4   H_4]   = [+1 +1 +1 +1  +1 +1 +1 +1]
      [H_4  -H_4]     [+1 -1 +1 -1  +1 -1 +1 -1]
                      [+1 +1 -1 -1  +1 +1 -1 -1]
                      [+1 -1 -1 +1  +1 -1 -1 +1]
                      [+1 +1 +1 +1  -1 -1 -1 -1]
                      [+1 -1 +1 -1  -1 +1 -1 +1]
                      [+1 +1 -1 -1  -1 -1 +1 +1]
                      [+1 -1 -1 +1  -1 +1 +1 -1]

8 측정으로 8 물건 측정. 각 분산 \(\sigma^2 / 8\). 정밀도 8 배.

10 Plackett-Burman Design 의 weighing

PB design = Hadamard matrix 의 \(\pm 1\) 표현. \(N\) runs 에 \(N - 1\) factors 의 saturated factorial.

\(N\)	Hadamard?	PB factors
4	✓	3
8	✓	7
12	✓ (Paley)	11
16	✓	15
20	✓	19
24	✓	23

산업 screening 의 표준 도구. weighing 의 정수형으로 응용.

11 측정 절차의 신뢰성

함정: 저울 calibration 오차

Hadamard 의 정보 효율은 저울이 정확하다는 가정. 실제로는:

Calibration drift: 시간이 지나며 저울 zero point 변화.
Operator effect: 측정자마다 약간 다름.
Environmental: 온도, 진동, 습도 영향.

이는 측정 잡음 \(\varepsilon\) 의 추가 source. Hadamard 가 잡음에 robust 하지만 systematic 오차에는 약함.

해결: - Reference weight 포함: 한 측정에 known reference 무게도 같이. - Replicate: 같은 측정 반복 (시간 분산). - Randomized order: 측정 순서 무작위화.

12 Reinforced Design

Reinforced 는 일부 측정에 일부 물건 제외 가능. 0 entry 사용.

이는 Hadamard 의 일반화 — 모든 측정에 모든 물건이 들어가지 않아도 됨.

12.1 사례 — 8 물건 중 4 만 사용

\(H_8\) 의 일부 column 만 사용 → 4 물건의 8 측정. 나머지 column 은 0.

추가 측정: 다른 4 물건의 4 측정 (\(H_4\) 사용).

총 12 측정으로 8 물건 측정. 효율 약간 ↓ 이지만 유연.

13 D-Optimal Weighing

정의: D-Optimality

design 의 정보 행렬 \(\mathbf{X}^T \mathbf{X}\) 의 결정자 (determinant) 를 최대화.

\[ D = |\mathbf{X}^T \mathbf{X}|^{1/p} \]

Hadamard matrix 가 \(\pm 1\) entry 의 D-optimal: \(|\mathbf{X}^T \mathbf{X}| = N^p\).

D-optimal weighing 은 Hadamard 가 자명한 답. non-Hadamard 모수 (\(N \ne 4k\)) 에서는 D-optimal 검색 (computer algorithm 으로).

14 응용 — 산업 측정 표준화

14.1 사례 — 표준 무게 calibration

NIST (미국 표준기술연구소) 가 표준 무게 (1 kg, 100 g, 10 g, …) 를 calibration. 수십 표준 무게를 동시에 측정하기 위해 weighing design.

전통적 방법: 각 표준 따로 측정. Hadamard 방법: 동시 측정 + 회귀로 분리. 정밀도 ↑.

이는 NIST 의 전통적 도구.

14.2 사례 — 분동 비교

기준 분동 (1 kg 표준) 과 작은 분동 (1 g, 10 g) 의 비교 측정. 누적적 측정으로 작은 분동의 무게 정밀도 ↑.

이는 chemical balance 의 자연스러운 응용.

15 Python 코드 — H_8 Weighing

import numpy as np
from scipy.linalg import hadamard

# H_8 (Sylvester)
H8 = hadamard(8)

# 직교성 검증
print(f"H_8 ⋅ H_8.T = {H8 @ H8.T}")
print(f"= 8I? {np.allclose(H8 @ H8.T, 8 * np.eye(8))}")

# 8 물건 무게 측정
np.random.seed(2026)
true_w = np.array([0.5, 0.7, 0.3, 0.9, 0.4, 0.6, 0.8, 0.2])
sigma = 0.05  # 측정 잡음 표준편차

# 측정
y = H8 @ true_w + np.random.normal(0, sigma, 8)
print(f"\n측정값 y: {y.round(3)}")

# 추정
w_hat = (1/8) * H8.T @ y
print(f"\n추정 무게: {w_hat.round(4)}")
print(f"진짜 무게: {true_w.round(4)}")
print(f"오차:      {(w_hat - true_w).round(4)}")
print(f"RMSE:      {np.sqrt(np.mean((w_hat - true_w)**2)):.4f}")

# 이론적 표준오차
se_theory = sigma / np.sqrt(8)
print(f"\n이론적 SE: {se_theory:.4f}")

# 1000 회 시뮬레이션 — 분산 검증
n_sim = 1000
errs = []
for _ in range(n_sim):
    y_sim = H8 @ true_w + np.random.normal(0, sigma, 8)
    w_sim = (1/8) * H8.T @ y_sim
    errs.append(w_sim - true_w)
errs = np.array(errs)
print(f"\nMonte Carlo (N={n_sim}):")
print(f"  Empirical SE per weight: {errs.std(axis=0).mean():.4f}")
print(f"  Theoretical SE: {se_theory:.4f}")

# Reinforced — 일부 측정 제외
# H_8 의 첫 4 측정만 사용 → 효율 손실
H_partial = H8[:4]
print(f"\n=== Reinforced (4/8 measurements) ===")
y_partial = H_partial @ true_w + np.random.normal(0, sigma, 4)
# pseudo-inverse 로 추정 (underdetermined 가능)
w_partial = np.linalg.lstsq(H_partial, y_partial, rcond=None)[0]
print(f"부분 추정: {w_partial.round(4)} (4 측정으로 8 물건 — underdetermined)")

16 다중 측정의 결합

각 weighing design 의 각 무게 추정량은 BLUE (Best Linear Unbiased Estimator). 분산 최소.

여러 different design 의 결과 결합:

\[ \hat w_j^{\text{combined}} = \frac{\sum_i w_i \hat w_j^{(i)}}{\sum_i w_i} \]

\(w_i = 1/\hat\sigma_i^2\). inverse-variance weighting.

이는 메타분석의 동일 도구.

17 가정과 한계

17.1 Chemical Balance 의 가정

잡음 등분산: 모든 측정 같은 \(\sigma^2\).
잡음 독립성: 측정 간 독립.
저울 linearity: 무게 가산성.
저울 calibration: 무편향.

17.2 실용 한계

2-pan 저울 필요: 1-pan 저울로는 spring balance 만.
Hadamard 의 존재: \(N = 4k\) 만 표준. 다른 \(N\) 은 truncated 또는 PBD.
측정 시간: 동시 측정의 시간이 길수록 calibration drift.
물건 수의 제약: \(p \le N\).

18 디지털 응용

매핑: 다중 가설 평가의 weighing

ML 모델의 다중 평가:

Designs: $H_8$ — 8 모델 평가, 8 dataset combination
각 평가는 일부 모델의 ensemble accuracy.

이는 spring balance 와 비슷 — non-negative weights.

만약 모델의 개별 contribution 을 분리하려면 회귀로 추정.

이는 모델 selection 의 통계적 형식. 단일 모델 평가가 아니라 동시 평가로 효율 ↑.

19 본 시리즈

G-MON9-0  개관
G-MON9-1  Definition + Estimation
G-MON9-2  One Pan from BIB
G-MON9-3  Two Pan Weighing  ← 현재 글
G-MON9-4  PBIB + Truncated + Efficiency

20 관련 주제

선행 지식

후속 주제

G-MON9-4: PBIB + Efficiency

다른 카테고리 연결

Math — Linear Algebra (placeholder) — Hadamard, eigenvalue
Statistics — SLR BLUE

21 더 읽을 거리

Hotelling, H. (1944). “Some improvements in weighing and other experimental techniques.” Annals of Mathematical Statistics 15: 297-306.
Plackett, R. L., Burman, J. P. (1946). “The design of optimum multifactorial experiments.” Biometrika 33(4): 305-325.
Banerjee, K. S. (1975). “Weighing Designs.” Marcel Dekker.
Sloane, N. J. A. “A Library of Hadamard Matrices.” http://neilsloane.com/hadamard/
Hedayat, A., Wallis, W. D. (1978). “Hadamard matrices and their applications.” Annals of Statistics 6(6): 1184-1238.