Kwangmin Kim - 균형 교락 비대칭 factorial 의 구성

1 Partial Confounding

정의: Partial Confounding

완전 confounding 은 한 효과를 영원히 추정 불가능. Partial confounding 은 여러 replicate 사이에 서로 다른 효과를 confound 하여 각 효과를 일부 replicate 에서 추정 가능.

각 효과의 자유도 = (그 효과가 confounded 되지 않은 replicate 수) × (효과 자유도 / replicate).

2 동기

직관: Partial confounding 의 trade-off

완전 confounding: 한 효과 (예: \(ABC\)) 가 영원히 추정 불가. Partial confounding: \(ABC\) 를 일부 replicate 만 confound, 다른 replicate 는 추정 가능.

trade-off: - 일부 효과의 정밀도 ↓ (일부 replicate 만 사용). - 모든 효과 추정 가능.

산업 실험에서 자원 제약 + 모든 효과 관심이 있을 때 사용.

3 \(2^3\) 의 partial confounding 사례

3 replicate, 각 replicate 가 다른 high-order interaction 을 block 과 confound:

Replicate 1: ABC confounded (8 cells, 2 blocks of 4)
Replicate 2: AB confounded (또는 AC)
Replicate 3: AC confounded (또는 BC)

각 효과는 자기가 confounded 된 replicate 만 빼고 다른 replicate 에서 추정 가능.

3.1 각 효과의 자유도 분석

효과	Confounded in	추정 가능한 replicate
\(A\)	없음	1, 2, 3 (모두)
\(B\)	없음	1, 2, 3
\(C\)	없음	1, 2, 3
\(AB\)	Rep 2	1, 3
\(AC\)	Rep 3	1, 2
\(BC\)	없음	1, 2, 3
\(ABC\)	Rep 1	2, 3

각 효과의 정밀도가 다름. \(A, B, C, BC\) 가 가장 정밀 (3 replicate 모두). \(AB, AC, ABC\) 는 2 replicate.

4 Yates 의 Balanced Confounded Design

정의: Balanced Confounded Design

각 효과가 같은 횟수 confounded. 정밀도 균등.

Yates (1937) 의 balanced confounded design — 산업 실험의 표준.

조건: replicate 수 \(r\) 와 confounded 효과 수 \(c\) 의 결합. - 각 효과가 정확히 \(r/m\) 회 confounded. - \(m\) = 한 replicate 의 confounded 효과 수.

4.1 \(2^3\) 의 7 replicate 균형 (예시)

각 replicate 가 다른 효과 confound:

Rep 1: AB
Rep 2: AC
Rep 3: BC
Rep 4: ABC
Rep 5: AB (반복)
Rep 6: AC (반복)
Rep 7: BC (반복)

(예시 — 정확한 균형은 모수에 따라.)

5 Python 코드

import numpy as np
import pandas as pd
from itertools import product

# 2^3 with partial confounding (3 replicates)
np.random.seed(2026)
factors = ["A", "B", "C"]
levels = [0, 1]
cells = list(product(levels, repeat=3))

# 각 replicate 가 다른 효과를 block 과 confound
# Rep 1: ABC
# Rep 2: AB
# Rep 3: AC

records = []
for rep_idx, conf in enumerate(["ABC", "AB", "AC"], 1):
    for cell in cells:
        a, b, c = cell
        # confound 된 효과의 ±1 부호로 block 결정
        if conf == "ABC":
            block = (a + b + c) % 2
        elif conf == "AB":
            block = (a + b) % 2
        elif conf == "AC":
            block = (a + c) % 2
        # 가상의 응답
        y = (50 + 3 * (2*a-1) + 2 * (2*b-1) + 1 * (2*c-1)
             + 1.5 * (2*a-1) * (2*b-1)
             + np.random.normal(0, 2))
        records.append({"replicate": rep_idx, "block": block,
                       "A": a, "B": b, "C": c, "confounded": conf,
                       "Y": y})

data = pd.DataFrame(records)
print(data.groupby(["replicate", "confounded"]).size())

# 각 effect 의 추정 가능 replicate 식별
# Replicate 1 에서는 ABC confounded — A, B, C, AB, AC, BC 추정 가능
# Replicate 2 에서는 AB confounded — A, B, C, AC, BC, ABC 추정 가능
# Replicate 3 에서는 AC confounded — A, B, C, AB, BC, ABC 추정 가능

# A 의 추정: 모든 replicate 활용 (어디서도 confound 안 됨)
# AB 의 추정: Rep 1, 3 만 (Rep 2 에서 confound)
# AC 의 추정: Rep 1, 2 만
# ABC 의 추정: Rep 2, 3 만

6 균형 vs 비균형 confounded

균형: 각 효과가 같은 횟수 confounded. 정밀도 균등.

비균형: 일부 효과가 더 자주 confounded. 일부는 정밀도 ↑, 일부 ↓.

선택은 도메인 우선순위에 따라: - 모든 효과 관심 → 균형. - 일부 효과 (예: 주효과) 가 더 중요 → 비균형 (주효과는 confound X).

7 비대칭 Confounded 의 일반 절차

\(s_1 \times s_2 \times \ldots \times s_k\) 비대칭 factorial:

Defining relations 선택 (자원 제약 고려).
각 cell 에 GF(\(s_i\)) 좌표 부여.
Block 분할: defining contrast 의 값에 따라.
Replicate 추가 (다른 defining relations).
균형 점검: 각 효과의 confounded 횟수.

자세한 알고리즘은 Das-Giri (1986) 또는 Bose-Kishen (1940).

8 가정과 한계

모든 효과 추정 가능: partial confounded 는 모든 효과 추정 가능.
균형 손실: 일부 효과 정밀도 ↓.
분석 복잡: replicate 별로 다른 효과 보고.
자원 비용: 여러 replicate 필요.

9 응용

9.1 산업 실험 — 자원 제약

화학 공정의 8 처치 조합. 각 batch 에 4 cells 만.

3 replicate × 2 block × 4 cells = 24 cells.

각 replicate 가 다른 효과를 block 과 confound. 모든 효과 추정 가능, 일부 정밀도 ↓.

9.2 농학 — 다년 실험

매년 다른 sub-design 으로 실험. 각 년의 결과를 partial confounding 으로 통합.

10 ML 매핑

매핑: ML 의 progressive hyperparameter sweep

ML 모델 평가에서 자원 제약:

$2^4 = 16$ hyperparameter 조합. GPU 한정으로 한 번에 8 만 실행 가능.

해결: 2 replicate × 8 cells. - Replicate 1: \(ABCD\) 효과를 batch 와 confound. - Replicate 2: 다른 고차 효과 confound.

각 replicate 의 결과를 통합 → 모든 효과 추정.

이는 ML 의 progressive screening 의 통계적 형식.

11 본 시리즈

G-MON4-0  개관
G-MON4-1  Asymmetrical + Confounded
G-MON4-2  Construction Balanced  ← 현재 글
G-MON4-3  v×2² Analysis
G-MON4-4  Split-Plot Analysis

12 관련 주제

선행 지식

후속 주제

다른 카테고리 연결

Statistics — LDA Mixed Effects

13 더 읽을 거리

Yates, F. (1937). “The Design and Analysis of Factorial Experiments.” Imperial Bureau of Soil Science.
Bose, R. C., Kishen, K. (1940). “On the problem of confounding in the general symmetrical factorial design.” Sankhyā 5: 21-36.
Das, M. N., Giri, N. C. (1986). “Design and Analysis of Experiments” (2nd ed). Wiley Eastern.
Cochran, W. G., Cox, G. M. (1957). “Experimental Designs” (2nd ed). Wiley.