Kwangmin Kim - Split-Plot 설계와 분석 — 두 단계 randomization 의 분산 분해

1 정의 (재방문)

정의: Split-Plot Design

두 단계 randomization: 1. Whole plot: 큰 단위에 한 요인 (whole-plot factor) 무작위 배정. 2. Sub plot: whole plot 안의 작은 단위에 다른 요인 (sub-plot factor) 무작위 배정.

농학 기원: 큰 plot 에 비료 종류 (whole), 작은 sub-plot 에 종자 품종 (sub).

산업: 큰 batch 단위의 변수 (예: 온도) 와 작은 단위의 변수 (예: 압력) 의 결합.

2 모형

\[ Y_{ijk} = \mu + \alpha_j + \pi_{i(j)} + \beta_k + (\alpha\beta)_{jk} + \varepsilon_{ijk} \]

\(\alpha_j\): whole plot factor (fixed).
\(\pi_{i(j)} \sim N(0, \sigma^2_\pi)\): whole plot \(i\) within \(A=j\) 의 random effect.
\(\beta_k\): sub-plot factor (fixed).
\((\alpha\beta)_{jk}\): interaction (fixed).
\(\varepsilon_{ijk}\): sub-plot residual.

3 ANOVA 분해

Source	\(df\)	EMS	검정 분모
Whole-plot	\(an - 1\)
┌ \(A\)	\(a-1\)	\(\sigma^2 + b\sigma^2_\pi + nb\theta_\alpha\)	Whole-plot error
└ Whole-plot error (\(\pi\))	\(a(n-1)\)	\(\sigma^2 + b\sigma^2_\pi\)	—
Sub-plot	\(an(b-1)\)
┌ \(B\)	\(b-1\)	\(\sigma^2 + an\theta_\beta\)	Sub-plot error
│ \(A \times B\)	\((a-1)(b-1)\)	\(\sigma^2 + n\theta_{\alpha\beta}\)	Sub-plot error
└ Sub-plot error	\(a(b-1)(n-1)\)	\(\sigma^2\)	—

핵심: \(A\) (whole-plot factor) 의 분모는 whole-plot error, \(B\) 와 \(A \times B\) 는 sub-plot error.

함정: 잘못된 검정 분모

split-plot 데이터를 일반 factorial ANOVA 로 분석하면 모든 효과의 분모가 sub-plot error (\(MS_E\)) 가 되어 \(A\) 의 검정이 inflated (false positive).

→ 반드시 split-plot 모형 명시 또는 mixed model 로 적절한 random effect 지정.

4 검정력 비교

직관: Whole-plot vs Sub-plot 의 검정력

Whole-plot factor (\(A\)) 의 검정력은 일반 factorial 보다 낮음: - 분모 자유도 작음 (\(a(n-1)\)). - 분모 분산 큼 (\(\sigma^2 + b \sigma^2_\pi\)).

Sub-plot factor (\(B\)) 와 \(A \times B\) 의 검정력은 높음: - 분모 자유도 큼. - 분모 분산 작음 (\(\sigma^2\)).

→ 가장 관심 있는 효과를 sub-plot 에 배치 권장.

농학에서는 비료 (whole) × 품종 (sub) 일 때 비료 효과보다 품종 효과의 검정력이 높음. 연구자가 품종 효과에 더 관심이면 적절. 비료 효과에 더 관심이면 다른 설계 (RBD) 가 나음.

5 Whole-plot factor 의 두 단계 처리

5.1 일반 split-plot (CRD whole-plot)

whole plots 자체가 무작위 배정 (\(A\) levels 에).

whole plot 1: A=high
whole plot 2: A=low
whole plot 3: A=high
...

각 whole plot 에 sub-plot factor B 의 모든 levels 가 들어감.

5.2 Block 화된 split-plot (RBD whole-plot)

whole plots 가 block 으로 묶임. 각 block 안에서 \(A\) 의 모든 levels 가 등장.

농학: 각 농장 (block) 에 비료 A, B, C 모두 (각 plot 에 다른 비료).

6 사례 — 농학

6.1 가상 실험

\(A\) = 비료 (3 종류, whole-plot), \(B\) = 종자 품종 (4 종류, sub-plot), \(n = 4\) replicates.

ANOVA:

Source	\(SS\)	\(df\)	\(MS\)	\(F\)	\(p\)
비료 (\(A\))	800	2	400	\(400/100 = 4.0\)	0.078
Whole-plot error	900	9	100	—	—
품종 (\(B\))	1500	3	500	\(500/25 = 20.0\)	\(<0.001\)
비료 × 품종	200	6	33	\(33/25 = 1.3\)	0.275
Sub-plot error	675	27	25	—	—

해석: - 비료 효과 marginal (whole-plot 자유도 작음). - 품종 효과 매우 강함. - 상호작용 약.

→ 품종을 sub-plot 에 배치한 것이 적절. 만약 비료 효과가 가장 관심이었다면 RBD 가 더 좋았을 것.

7 Python 코드

import numpy as np
import pandas as pd
import statsmodels.api as sm
from statsmodels.formula.api import mixedlm

np.random.seed(2026)
n = 4
fertilizers = ["F1", "F2", "F3"]
varieties = ["V1", "V2", "V3", "V4"]

records = []
for rep in range(n):
    for f in fertilizers:
        wp_eff = np.random.normal(0, 4)  # whole-plot error
        f_idx = fertilizers.index(f)
        for v in varieties:
            v_idx = varieties.index(v)
            mu = 50 + 5 * f_idx + 8 * v_idx + 1 * f_idx * v_idx
            y = mu + wp_eff + np.random.normal(0, 2)
            records.append({"replicate": rep, "fertilizer": f, "variety": v,
                           "wp_id": f"{rep}_{f}", "Y": y})

data = pd.DataFrame(records)

# Mixed model (recommended)
md = mixedlm("Y ~ C(fertilizer) * C(variety)",
             data=data, groups=data["wp_id"]).fit()
print("=== Mixed Model (split-plot) ===")
print(md.summary().tables[1])

# Standard ANOVA — 잘못된 분모
from statsmodels.formula.api import ols
md_wrong = ols("Y ~ C(fertilizer) * C(variety)", data=data).fit()
print("\n=== INCORRECT: 일반 factorial ANOVA ===")
print(sm.stats.anova_lm(md_wrong, typ=2).round(3))
print("\n주의: fertilizer 의 F 가 inflated (whole-plot error 무시)")

8 Maxwell Ch.12 와의 비교

	Maxwell G-MAX12-2	Montgomery G-MON4-4
응용 분야	임상·심리	농학·산업
Whole plot	group (between-subjects)	plot (큰 농장 단위)
Sub plot	time (within-subjects)	sub-plot (작은 단위)
강조	longitudinal RCT	spatial 농학
분석 도구	Mixed model with random subject	Mixed model with random plot

수학적으로 동일 framework. 응용 분야 차이.

9 Variant — Multiple Within Factors

Split-plot 의 일반화: 여러 within 요인 + 여러 between 요인.

예: 처치 (between) × 시점 (within) × 측정 위치 (within).

각 within 요인의 분모는 그 자신과 subject within group 의 상호작용. multilevel model 로 자연스럽게 처리.

10 가정과 한계

두 단계 randomization 의 정확한 명시: 잘못된 분모 사용 위험.
Whole-plot 자유도: 작으면 \(A\) 검정력 약.
Mixed model 권장: 일반 ANOVA 보다 명시적.
Whole-plot vs sub-plot 의 적절한 식별: 어느 변수가 어느 level 에 있는지 명확.

11 응용

분야	Whole plot	Sub plot
농학	비료 (큰 plot)	종자 (작은 sub-plot)
산업	온도 (oven 단위)	압력 (개별 부품)
임상	처치 (group 무작위)	시점 (within-subject)
IT	사용자 그룹 (큰 단위)	UI 변종 (개별 사용자)
식품	가공 방법 (batch)	보관 조건
교육	학교 (school-level)	학생 (개인)

12 ML 매핑

매핑: deep learning 의 자연스러운 split-plot

deep learning 에서 hyperparameter 검색 시 split-plot 구조:

Whole plot (train run 단위): 같은 모델 architecture × seed 의 한 학습 run.
Sub plot (training step 단위): 같은 run 내의 다른 시점에서 측정 (validation accuracy).

Whole-plot factor: model architecture, optimizer. Sub-plot factor: epoch (시간).

이는 자연스러운 split-plot. 다른 architecture 를 시험하려면 새 run 필요 (비싼 whole plot). 같은 run 내의 epoch 별 측정은 cheap (sub plot).

분석: split-plot mixed model. architecture × epoch interaction → “어느 architecture 가 학습이 빠른가” 의 정확한 검정.

13 MON Ch.4 시리즈 정리

G-MON4-0  Asymmetrical/Split-Plot 개관
G-MON4-1  Asymmetrical + Confounded
G-MON4-2  Construction Balanced
G-MON4-3  v×2² Analysis
G-MON4-4  Split-Plot Analysis  ← 현재 글 (Ch.4 마지막)
    ↓
G-MON5 (Incomplete Block — BIB)

14 관련 주제

선행 지식

후속 주제

G-MON5 — Incomplete Block (작성 예정)

다른 카테고리 연결

15 더 읽을 거리

Federer, W. T., King, F. (2007). “Variations on Split Plot and Split Block Experiment Designs.” Wiley.
Box, G. E. P., Jones, S. (1992). “Split-plot designs for robust product experimentation.” Journal of Applied Statistics 19(1): 3-26.
Montgomery, D. C. (2017). “Design and Analysis of Experiments” (9th ed). Wiley.
Cox, D. R. (1958). “Planning of Experiments.” Wiley.
Das, M. N., Giri, N. C. (1986). “Design and Analysis of Experiments” (2nd ed). Wiley.