Split-Plot 설계와 분석 — 두 단계 randomization 의 분산 분해

Montgomery Ch.4.6-4.7 Split-Plot Design · Analysis

Whole-plot 과 sub-plot 두 단계의 무작위 배정을 가진 split-plot design 의 ANOVA 분해와 올바른 검정 분모 결정을 정리한다. 농학·산업의 표준 lens, Maxwell Ch.12 의 split-plot 과 통합 비교, ML 적용까지 다룬다.

Experimentation
DOE
저자

Kwangmin Kim

공개

2026년 05월 08일

1 정의 (재방문)

정의: Split-Plot Design

두 단계 randomization: 1. Whole plot: 큰 단위에 한 요인 (whole-plot factor) 무작위 배정. 2. Sub plot: whole plot 안의 작은 단위에 다른 요인 (sub-plot factor) 무작위 배정.

농학 기원: 큰 plot 에 비료 종류 (whole), 작은 sub-plot 에 종자 품종 (sub).

산업: 큰 batch 단위의 변수 (예: 온도) 와 작은 단위의 변수 (예: 압력) 의 결합.

2 모형

\[ Y_{ijk} = \mu + \alpha_j + \pi_{i(j)} + \beta_k + (\alpha\beta)_{jk} + \varepsilon_{ijk} \]

  • \(\alpha_j\): whole plot factor (fixed).
  • \(\pi_{i(j)} \sim N(0, \sigma^2_\pi)\): whole plot \(i\) within \(A=j\) 의 random effect.
  • \(\beta_k\): sub-plot factor (fixed).
  • \((\alpha\beta)_{jk}\): interaction (fixed).
  • \(\varepsilon_{ijk}\): sub-plot residual.

3 ANOVA 분해

Source \(df\) EMS 검정 분모
Whole-plot \(an - 1\)
\(A\) \(a-1\) \(\sigma^2 + b\sigma^2_\pi + nb\theta_\alpha\) Whole-plot error
└ Whole-plot error (\(\pi\)) \(a(n-1)\) \(\sigma^2 + b\sigma^2_\pi\)
Sub-plot \(an(b-1)\)
\(B\) \(b-1\) \(\sigma^2 + an\theta_\beta\) Sub-plot error
\(A \times B\) \((a-1)(b-1)\) \(\sigma^2 + n\theta_{\alpha\beta}\) Sub-plot error
└ Sub-plot error \(a(b-1)(n-1)\) \(\sigma^2\)

핵심: \(A\) (whole-plot factor) 의 분모는 whole-plot error, \(B\)\(A \times B\) 는 sub-plot error.

함정: 잘못된 검정 분모

split-plot 데이터를 일반 factorial ANOVA 로 분석하면 모든 효과의 분모가 sub-plot error (\(MS_E\)) 가 되어 \(A\) 의 검정이 inflated (false positive).

→ 반드시 split-plot 모형 명시 또는 mixed model 로 적절한 random effect 지정.

4 검정력 비교

직관: Whole-plot vs Sub-plot 의 검정력

Whole-plot factor (\(A\)) 의 검정력은 일반 factorial 보다 낮음: - 분모 자유도 작음 (\(a(n-1)\)). - 분모 분산 큼 (\(\sigma^2 + b \sigma^2_\pi\)).

Sub-plot factor (\(B\))\(A \times B\) 의 검정력은 높음: - 분모 자유도 큼. - 분모 분산 작음 (\(\sigma^2\)).

가장 관심 있는 효과를 sub-plot 에 배치 권장.

농학에서는 비료 (whole) × 품종 (sub) 일 때 비료 효과보다 품종 효과의 검정력이 높음. 연구자가 품종 효과에 더 관심이면 적절. 비료 효과에 더 관심이면 다른 설계 (RBD) 가 나음.

5 Whole-plot factor 의 두 단계 처리

5.1 일반 split-plot (CRD whole-plot)

whole plots 자체가 무작위 배정 (\(A\) levels 에).

whole plot 1: A=high
whole plot 2: A=low
whole plot 3: A=high
...

각 whole plot 에 sub-plot factor B 의 모든 levels 가 들어감.

5.2 Block 화된 split-plot (RBD whole-plot)

whole plots 가 block 으로 묶임. 각 block 안에서 \(A\) 의 모든 levels 가 등장.

농학: 각 농장 (block) 에 비료 A, B, C 모두 (각 plot 에 다른 비료).

6 사례 — 농학

6.1 가상 실험

\(A\) = 비료 (3 종류, whole-plot), \(B\) = 종자 품종 (4 종류, sub-plot), \(n = 4\) replicates.

ANOVA:

Source \(SS\) \(df\) \(MS\) \(F\) \(p\)
비료 (\(A\)) 800 2 400 \(400/100 = 4.0\) 0.078
Whole-plot error 900 9 100
품종 (\(B\)) 1500 3 500 \(500/25 = 20.0\) \(<0.001\)
비료 × 품종 200 6 33 \(33/25 = 1.3\) 0.275
Sub-plot error 675 27 25

해석: - 비료 효과 marginal (whole-plot 자유도 작음). - 품종 효과 매우 강함. - 상호작용 약.

→ 품종을 sub-plot 에 배치한 것이 적절. 만약 비료 효과가 가장 관심이었다면 RBD 가 더 좋았을 것.

7 Python 코드

import numpy as np
import pandas as pd
import statsmodels.api as sm
from statsmodels.formula.api import mixedlm

np.random.seed(2026)
n = 4
fertilizers = ["F1", "F2", "F3"]
varieties = ["V1", "V2", "V3", "V4"]

records = []
for rep in range(n):
    for f in fertilizers:
        wp_eff = np.random.normal(0, 4)  # whole-plot error
        f_idx = fertilizers.index(f)
        for v in varieties:
            v_idx = varieties.index(v)
            mu = 50 + 5 * f_idx + 8 * v_idx + 1 * f_idx * v_idx
            y = mu + wp_eff + np.random.normal(0, 2)
            records.append({"replicate": rep, "fertilizer": f, "variety": v,
                           "wp_id": f"{rep}_{f}", "Y": y})

data = pd.DataFrame(records)

# Mixed model (recommended)
md = mixedlm("Y ~ C(fertilizer) * C(variety)",
             data=data, groups=data["wp_id"]).fit()
print("=== Mixed Model (split-plot) ===")
print(md.summary().tables[1])

# Standard ANOVA — 잘못된 분모
from statsmodels.formula.api import ols
md_wrong = ols("Y ~ C(fertilizer) * C(variety)", data=data).fit()
print("\n=== INCORRECT: 일반 factorial ANOVA ===")
print(sm.stats.anova_lm(md_wrong, typ=2).round(3))
print("\n주의: fertilizer 의 F 가 inflated (whole-plot error 무시)")

8 Maxwell Ch.12 와의 비교

Maxwell G-MAX12-2 Montgomery G-MON4-4
응용 분야 임상·심리 농학·산업
Whole plot group (between-subjects) plot (큰 농장 단위)
Sub plot time (within-subjects) sub-plot (작은 단위)
강조 longitudinal RCT spatial 농학
분석 도구 Mixed model with random subject Mixed model with random plot

수학적으로 동일 framework. 응용 분야 차이.

9 Variant — Multiple Within Factors

Split-plot 의 일반화: 여러 within 요인 + 여러 between 요인.

예: 처치 (between) × 시점 (within) × 측정 위치 (within).

각 within 요인의 분모는 그 자신과 subject within group 의 상호작용. multilevel model 로 자연스럽게 처리.

10 가정과 한계

  • 두 단계 randomization 의 정확한 명시: 잘못된 분모 사용 위험.
  • Whole-plot 자유도: 작으면 \(A\) 검정력 약.
  • Mixed model 권장: 일반 ANOVA 보다 명시적.
  • Whole-plot vs sub-plot 의 적절한 식별: 어느 변수가 어느 level 에 있는지 명확.

11 응용

분야 Whole plot Sub plot
농학 비료 (큰 plot) 종자 (작은 sub-plot)
산업 온도 (oven 단위) 압력 (개별 부품)
임상 처치 (group 무작위) 시점 (within-subject)
IT 사용자 그룹 (큰 단위) UI 변종 (개별 사용자)
식품 가공 방법 (batch) 보관 조건
교육 학교 (school-level) 학생 (개인)

12 ML 매핑

매핑: deep learning 의 자연스러운 split-plot

deep learning 에서 hyperparameter 검색 시 split-plot 구조:

  • Whole plot (train run 단위): 같은 모델 architecture × seed 의 한 학습 run.
  • Sub plot (training step 단위): 같은 run 내의 다른 시점에서 측정 (validation accuracy).

Whole-plot factor: model architecture, optimizer. Sub-plot factor: epoch (시간).

이는 자연스러운 split-plot. 다른 architecture 를 시험하려면 새 run 필요 (비싼 whole plot). 같은 run 내의 epoch 별 측정은 cheap (sub plot).

분석: split-plot mixed model. architecture × epoch interaction → “어느 architecture 가 학습이 빠른가” 의 정확한 검정.

13 MON Ch.4 시리즈 정리

G-MON4-0  Asymmetrical/Split-Plot 개관
G-MON4-1  Asymmetrical + Confounded
G-MON4-2  Construction Balanced
G-MON4-3  v×2² Analysis
G-MON4-4  Split-Plot Analysis  ← 현재 글 (Ch.4 마지막)
    ↓
G-MON5 (Incomplete Block — BIB)

14 관련 주제

선행 지식

후속 주제

  • G-MON5 — Incomplete Block (작성 예정)

다른 카테고리 연결

15 더 읽을 거리

  • Federer, W. T., King, F. (2007). “Variations on Split Plot and Split Block Experiment Designs.” Wiley.
  • Box, G. E. P., Jones, S. (1992). “Split-plot designs for robust product experimentation.” Journal of Applied Statistics 19(1): 3-26.
  • Montgomery, D. C. (2017). “Design and Analysis of Experiments” (9th ed). Wiley.
  • Cox, D. R. (1958). “Planning of Experiments.” Wiley.
  • Das, M. N., Giri, N. C. (1986). “Design and Analysis of Experiments” (2nd ed). Wiley.

Subscribe

Enjoy this blog? Get notified of new posts by email: