§ 6.2.5 — Random-Effects 구조: MRM 과 CPM 을 잇는 다리

메커니즘 기반 분산-공분산 · between/within 분리 · MRM 마진 등가 · 5 구조 통합 시각

Hedeker & Gibbons (2006) Ch.6 §6.2.5 의 자세한 풀이. 공분산 패턴 모형 (CPM) 의 다섯 번째 구조 — Random-Effects (RE) — 는 다른 4 구조와 근본적으로 다르다. CS·AR(1)·Toeplitz·UN 이 분산-공분산 행렬을 직접 명세하는 “fully specified” 구조라면, RE 는 랜덤 효과 (\(\upsilon_i\), \(\varepsilon_i\)) 라는 메커니즘으로부터 분산-공분산을 도출한다. 이 차이가 between-subjects vs within-subjects 분산 분리, MRM 과의 마진 등가, 통합적 시각을 만든다. 랜덤 효과 수 \(r\) 에 따른 구조 변화, \(r=1\) 일 때 CS 와의 동치성, 다른 구조와의 통합 비교 표까지 정리한다.

Statistics
저자

Kwangmin Kim

공개

2026년 04월 30일

1 들어가며 — 다른 4 구조와 무엇이 다른가

Ch.6 Overview 에서 5 가지 공분산 구조를 한 표로 정리했다. 그중 앞의 네 구조 — CS·AR(1), Toeplitz·UN — 는 모두 한 가지 공통점이 있다.

분산-공분산 행렬 \(\Sigma_i\) 를 직접 명세 한다. 그 안의 모수 (\(\sigma^2\), \(\rho\), \(\theta_k\) 등) 가 어디서 왔는지 묻지 않는다.

Jennrich & Schluchter (1986) 는 이 네 구조를 “fully specified structures” 라 부른다. 행렬 자체가 모형의 출발점이다.

다섯 번째 — Random-Effects (RE) 구조 — 는 정반대다.

분산-공분산을 만들어내는 메커니즘 (랜덤 효과 \(\upsilon_i\) 와 잔차 \(\varepsilon_i\)) 을 명세하고, 그 결과로 \(\Sigma_i\) 가 도출된다.

한 줄 비유 — 네 구조 vs RE

fully specified (CS, AR(1), Toeplitz, UN): “사진 (분산-공분산 행렬) 을 보고 모수를 채운다.” RE: “필름 (랜덤 효과 모형) 으로부터 사진을 현상한다.”

같은 사진 (마진 분산-공분산) 을 두 방식으로 얻을 수 있다 — 그 동치성이 이 포스트의 핵심.

이 차이가 한 가지 중요한 결과를 만든다.

다른 4 구조는 between-subjects 분산과 within-subjects 분산을 구분 안 한다. RE 만이 둘을 분리한다.

이 통합적 시각이 RE 구조의 가치다 — 또한 MRM 과 CPM 의 다리 역할을 하는 이유.

2 출발점 — RE 구조 정의

2.1 메커니즘 명세

정의: Random-Effects 구조

CPM 의 일반 식 \(y_i = X_i\beta + e_i\) 에서, 오차 벡터 \(e_i\) 를 다음과 같이 분해한다.

\[ e_i = Z_i \upsilon_i + \varepsilon_i, \tag{6.7} \]

여기서

  • \(Z_i\): \(n_i \times r\) 의 랜덤 효과 디자인 행렬 (예: 절편 + 시간).
  • \(\upsilon_i\): \(r \times 1\) 의 피험자별 랜덤 효과 벡터, \(\upsilon_i \sim \mathcal{N}_r(0, \Sigma_\upsilon)\).
  • \(\varepsilon_i\): \(n_i \times 1\) 의 잔차 벡터, \(\varepsilon_i \sim \mathcal{N}_{n_i}(0, \sigma^2 I_{n_i})\).
  • \(\upsilon_i \perp \varepsilon_i\) (독립).

이로부터 마진 분산-공분산 행렬은 다음 형태를 띤다.

\[ \Sigma_i = Z_i \Sigma_\upsilon Z_i^\top + \sigma^2 I_{n_i}. \tag{6.8} \]

  • 모수: \(\Sigma_\upsilon\)\(r(r+1)/2\) 개 + \(\sigma^2\) 1 개 = \(q = r(r+1)/2 + 1\).
식 (6.8) 의 두 부분 분해

\[ \underbrace{\Sigma_i}_{\text{전체 분산}} = \underbrace{Z_i \Sigma_\upsilon Z_i^\top}_{\text{between-subjects}} + \underbrace{\sigma^2 I_{n_i}}_{\text{within-subjects}} \]

  • Between: 같은 피험자의 모든 시점이 공유하는 변동 (피험자별 랜덤 효과로부터).
  • Within: 같은 피험자 안에서 시점마다 독립적으로 흔들리는 변동 (잔차로부터).

이 분해가 RE 구조의 본질 — CS·AR(1)·Toeplitz·UN 어느 것도 이 분해를 명시적으로 하지 않는다.

2.2 추가 명세가 필요한 이유

§6.2.1~§6.2.4 의 4 구조는 식 (6.1) — \(y_i = X_i\beta + e_i\), \(e_i \sim \mathcal{N}(0, \Sigma_i)\) — 만으로 정의가 끝난다. \(\Sigma_i\) 의 형태를 직접 명세하기 때문.

RE 구조는 다르다. 추가 명세 (식 6.7) 가 필요하다 — 랜덤 효과 디자인 \(Z_i\), 랜덤 효과 분산 \(\Sigma_\upsilon\), 잔차 분산 \(\sigma^2\) 를 분리하여 명시해야 비로소 \(\Sigma_i\) 가 결정된다.

Jennrich & Schluchter [1986] 의 표현: RE 는 “fully specified” 구조가 아니다 — 디자인 \(Z_i\) 의 선택이 모형의 일부이기 때문.

3 직관 — 메커니즘이 만드는 패턴

3.1 가장 단순한 경우 — 랜덤 절편만 (\(r = 1\))

\(Z_i = \mathbf{1}_{n_i}\) (모든 원소가 1 인 벡터) 이고 \(\Sigma_\upsilon = \sigma_\upsilon^2\) (스칼라) 일 때:

\[ \Sigma_i = \sigma_\upsilon^2 \mathbf{1}\mathbf{1}^\top + \sigma^2 I_{n_i} = \begin{bmatrix} \sigma_\upsilon^2 + \sigma^2 & \sigma_\upsilon^2 & \cdots & \sigma_\upsilon^2 \\ \sigma_\upsilon^2 & \sigma_\upsilon^2 + \sigma^2 & \cdots & \sigma_\upsilon^2 \\ \vdots & \vdots & \ddots & \vdots \\ \sigma_\upsilon^2 & \sigma_\upsilon^2 & \cdots & \sigma_\upsilon^2 + \sigma^2 \end{bmatrix} \]

결과 — RE (\(r=1\)) = CS

이 행렬은 § 6.2.1 의 CS 구조 (식 6.2) 와 정확히 같다. \(\sigma^2 + \sigma_1^2 \leftrightarrow \sigma^2 + \sigma_\upsilon^2\), \(\sigma_1^2 \leftrightarrow \sigma_\upsilon^2\) 의 대응.

랜덤 절편 MRM 의 마진 분포 = CS-CPM

이미 §6.2.1 포스트에서 본 동치성을 RE 구조 일반 식 (6.8) 의 한 특수 경우로 재확인한다. 모수 수도 일치 — RE (\(r=1\)) 의 \(q = 1(2)/2 + 1 = 2\), CS 의 \(q = 2\).

3.2 한 단계 더 — 랜덤 절편 + 기울기 (\(r = 2\))

\(Z_i = [\mathbf{1}, t_i]\) (절편 + 시간 벡터), \(\Sigma_\upsilon = \begin{bmatrix} \sigma_{\upsilon_0}^2 & \sigma_{\upsilon_{01}} \\ \sigma_{\upsilon_{01}} & \sigma_{\upsilon_1}^2 \end{bmatrix}\).

\(\Sigma_i\)\((j, j')\) 원소를 풀어 쓰면:

\[ [\Sigma_i]_{jj'} = \sigma_{\upsilon_0}^2 + \sigma_{\upsilon_{01}}(t_{ij} + t_{ij'}) + \sigma_{\upsilon_1}^2 t_{ij} t_{ij'} + \sigma^2 \mathbb{1}[j = j'] \]

직관 — 랜덤 기울기가 추가되면

\(t_{ij}, t_{ij'}\) 가 식에 들어오므로 시점에 따라 분산과 공분산이 변동 한다.

시점 패턴 분산 공분산
시점이 0 근처 (\(t \to 0\)) \(\sigma_{\upsilon_0}^2 + \sigma^2\) \(\sigma_{\upsilon_0}^2\)
시점이 큼 (\(t\) 큼) \(\sigma_{\upsilon_0}^2 + 2\sigma_{\upsilon_{01}} t + \sigma_{\upsilon_1}^2 t^2 + \sigma^2\) (시점에 따라 다름)

시점별 분산이 시간의 이차 함수로 변동 한다. CS·AR(1)·Toeplitz 의 정상성 (시점별 분산 동일) 을 깬다.

이 패턴이 § 4.4 — MRM 행렬 공식화 에서 나온 마진 분산 곡선과 동일하다 — RE-CPM 은 MRM 의 다른 표기다.

3.3 \(r\) 이 늘면 어떻게 되는가

랜덤 효과 수 \(r\) 이 커지면 모수 수가 빠르게 증가한다.

\(r\) \(q = r(r+1)/2 + 1\) 디자인 예
1 2 랜덤 절편만 (CS 동치)
2 4 절편 + 기울기
3 7 절편 + 기울기 + 이차
4 11 절편 + 기울기 + 이차 + 삼차
5 16 4 차 다항식까지
\(r\) 의 상한 — UN 보다 적은 모수

랜덤 효과는 자유롭게 늘릴 수 없다.

  • \(r\) 의 이론적 상한: \(\min(n_i)\) (각 피험자가 적어도 \(r\) 개 시점 관측 필요).
  • 실제 상한: \(\Sigma_\upsilon\) 가 양정치를 유지해야 하므로 보통 \(r \leq 3\) 또는 \(4\).
  • \(r\) 이 너무 크면 ML 추정이 boundary 추정 (\(\Sigma_\upsilon\) 의 일부 모수 = 0) 으로 떨어짐.

비교: 같은 시점 \(n=10\) 에서 UN 모수 \(q=55\), RE (\(r=4\)) 모수 \(q=11\) — RE 는 UN 의 1/5 모수로 비슷한 유연성 일부를 표현.

3.4 RE 구조가 자연스럽게 표현하는 패턴

다른 4 구조가 표현 못하는 RE 의 강점.

패턴 RE 가 자연 처리 다른 구조
시점별 분산 변동 \(r \geq 2\) 면 자동 UN 만 가능 (\(q\) 비싸짐)
같은 lag 의 비균질 상관 \(r \geq 2\) 면 가능 UN 만 가능
개인별 절편·기울기 추정 \(\hat\upsilon_i\) BLUP 으로 가능 불가능 (다른 4 구조 모두)
불등간격 시점 시점 \(t_i\) 가 디자인의 일부 CS·AR(1)·Toeplitz 모두 등간격 가정

4 RE 구조와 MRM 의 등가 — 같은 모형 두 표현

4.1 명시적 비교

두 모형, 한 분포

MRM 식 (Ch.4 §4.4 행렬 공식화):

\[ y_i = X_i\beta + Z_i\upsilon_i + \varepsilon_i, \quad \upsilon_i \sim \mathcal{N}(0, \Sigma_\upsilon), \quad \varepsilon_i \sim \mathcal{N}(0, \sigma^2 I_{n_i}) \]

RE-CPM 식:

\[ y_i = X_i\beta + e_i, \quad e_i \sim \mathcal{N}(0, Z_i \Sigma_\upsilon Z_i^\top + \sigma^2 I_{n_i}) \]

두 모형의 마진 분포 \(y_i \sim \mathcal{N}(X_i\beta, Z_i\Sigma_\upsilon Z_i^\top + \sigma^2 I)\) 가 정확히 같다.

이 등가의 결과:

  • ML 우도가 같다 → 추정량 일치, 표준오차 일치.
  • 고정 효과 추정 일치 (\(\hat\beta\) 와 SE 동일).
  • AIC, BIC 일치.
  • 모형 선택 기준 일치.

차이는 표현 방식과 해석 뿐이다.

측면 MRM RE-CPM
식의 형태 \(y_{ij} = x_{ij}^\top \beta + z_{ij}^\top \upsilon_i + \varepsilon_{ij}\) \(y_i = X_i\beta + e_i\), \(e_i \sim \mathcal{N}(0, Z_i\Sigma_\upsilon Z_i' + \sigma^2 I)\)
모수 해석 \(\sigma_\upsilon^2\): 피험자 간, \(\sigma^2\): 피험자 내 (같은 모수, 다른 강조점)
개인별 추론 \(\hat\upsilon_i\) BLUP 자연스러움 같은 BLUP 가능 (\(\Sigma_\upsilon\), \(Z_i\) 알면)
인과 메커니즘 “사람마다 다른 절편·기울기” 메커니즘 미상, 마진만 모형화
어디서 자주 쓰는가 임상·교육·심리 (개인 곡선) 시계열·계량경제 (총 분산만)
같은 모형, 다른 강조점 — 어느 표기를 쓸까

연구의 관심사가 결정한다.

  • 개인별 곡선·예측이 본질적 관심 → MRM 표기 (\(\upsilon_i\) 명시, BLUP 해석)
  • 모집단 평균 효과만 관심 → RE-CPM 표기 (마진만 강조)
  • 분산 구조가 연구 질문 → CPM 표기 (5 구조 비교 자연)
  • 두 표기를 자유롭게 오감 → 통합 이해의 척도

같은 결과에 도달하는 두 길이라는 사실이 이 등가성의 가치다.

5 5 구조 통합 시각 — RE 가 합쳐주는 그림

5.1 RE 와 다른 구조의 nested 관계

RE 구조가 다른 4 구조의 특수 경우가 될 수 있다.

RE 디자인 (\(Z_i\), \(\Sigma_\upsilon\)) 결과 분산 구조
\(Z_i = \mathbf{1}\), \(\Sigma_\upsilon = \sigma_\upsilon^2\) CS (\(r=1\))
일반 \(Z_i\) + 특정 제약 AR(1) 근사 (간접)
\(Z_i\) 가 모든 시점 지시자 (\(r = n\)), \(\Sigma_\upsilon\) 자유 UN (사실상)
RE 가 모든 fully specified 구조의 일반화일까

부분적으로 그렇다 — 적절한 \(Z_i\)\(\Sigma_\upsilon\) 선택으로 CS 와 UN 을 표현 가능. 하지만 AR(1) 의 지수 감쇠나 Toeplitz 의 lag 별 자유를 그대로 만들기는 어렵다.

또한 모수 수가 다르다. UN 을 RE 로 표현하려면 \(r = n\) 이 필요한데, 이러면 식별 가능성 문제 (랜덤 효과 디자인이 데이터 차원과 같음) 가 발생한다.

→ RE 와 fully specified 구조는 부분적 nested 다. 둘을 자유롭게 오갈 수는 있지만 완벽한 포함 관계는 아님.

5.2 5 구조 한 페이지 비교 (재정리)

구조 명세 방식 분산 분리 \(q\) 적합 우위
CS 직접 (행렬) X 2 클러스터·짧은 추적
AR(1) 직접 (행렬) X 2 등간격·지수 감쇠
Toeplitz 직접 (행렬) X \(n\) 등간격·비지수 감쇠
UN 직접 (행렬) X \(n(n+1)/2\) 시점 적음·표본 큼·구조 무가정
RE 메커니즘 (\(\upsilon_i\), \(\varepsilon_i\)) O (between/within) \(r(r+1)/2 + 1\) 개인 곡선·불등간격·시변 분산
직관 — “RE 가 합쳐주는 시각”

다른 4 구조는 분산-공분산 행렬을 “있는 그대로 모형화” 한다. 그게 어디서 왔는지 묻지 않는다.

RE 는 메커니즘을 묻는다 — “왜 같은 사람의 시점들이 상관되는가?” 답: “같은 사람이 자기만의 절편·기울기를 가지기 때문.”

이 메커니즘 모형화가 RE 의 가치이자 비용이다 — 해석 가능성 을 얻고 모형 단순성 을 잃는다 (디자인 선택, 양정치 제약 등 추가 부담).

6 코드 예시

6.1 Step 1: RE 구조 분산-공분산 직접 구성 (numpy)

import numpy as np


def re_cov(Z: np.ndarray, Sigma_v: np.ndarray, sigma2: float) -> np.ndarray:
    """RE 구조 마진 분산-공분산: Z Sigma_v Z' + sigma^2 I

    Z:        n x r 랜덤 효과 디자인 행렬.
    Sigma_v:  r x r 랜덤 효과 분산-공분산 행렬.
    sigma2:   잔차 분산.
    """
    n = Z.shape[0]
    return Z @ Sigma_v @ Z.T + sigma2 * np.eye(n)


# 예시 1 — 랜덤 절편만 (r=1) → CS 와 동치
n = 6
Z1 = np.ones((n, 1))            # 모든 행이 1 (절편)
Sv1 = np.array([[2.0]])          # sigma_v^2 = 2.0
print("RE (랜덤 절편만):")
print(re_cov(Z1, Sv1, sigma2=1.0).round(2))
# 대각: 3.0, 비대각: 2.0 — CS 형태 (sigma^2=1, sigma_1^2=2)
# 예시 2 — 랜덤 절편 + 기울기 (r=2)
t = np.arange(n)                # 시간 0, 1, ..., 5
Z2 = np.column_stack([np.ones(n), t])
Sv2 = np.array([
    [1.0, 0.1],   # sigma_v0^2 = 1.0, cov = 0.1
    [0.1, 0.05],  # sigma_v1^2 = 0.05
])
print("\nRE (랜덤 절편 + 기울기):")
print(re_cov(Z2, Sv2, sigma2=0.5).round(2))
검증 포인트 — 시점별 분산 변동

예시 2 의 출력에서 대각 (시점별 분산) 을 살펴보자.

  • \(t=0\): \(\sigma_{\upsilon_0}^2 + 0 + 0 + \sigma^2 = 1.0 + 0.5 = 1.5\)
  • \(t=5\): \(\sigma_{\upsilon_0}^2 + 2(0.1)(5) + 0.05 \cdot 25 + 0.5 = 1.0 + 1.0 + 1.25 + 0.5 = 3.75\)

분산이 시간의 이차 함수로 증가. CS·AR(1)·Toeplitz 가 표현 못하는 패턴이다.

6.2 Step 2: RE 와 CS 의 동치 시뮬레이션 검증

import numpy as np


# 같은 마진 분포에서 ML 우도가 같음을 수치 시뮬레이션으로 확인
np.random.seed(2026)

n_subj, n_time = 100, 6
sigma_v2, sigma2 = 2.0, 1.0

# 진짜 데이터 생성 — 랜덤 절편 메커니즘
upsilon = np.random.normal(0, np.sqrt(sigma_v2), n_subj)
epsilon = np.random.normal(0, np.sqrt(sigma2), (n_subj, n_time))
y = upsilon[:, None] + epsilon

# 마진 공분산 행렬 두 방식
Sigma_re = re_cov(np.ones((n_time, 1)), np.array([[sigma_v2]]), sigma2)
Sigma_cs = sigma2 * np.eye(n_time) + sigma_v2 * np.ones((n_time, n_time))

print(f"두 행렬 동일 여부: {np.allclose(Sigma_re, Sigma_cs)}")
# True — RE (r=1) 와 CS 의 마진 행렬이 정확히 같음

# 표본 공분산과 비교
S_emp = np.cov(y.T)
print(f"\n이론 (RE = CS):\n{Sigma_re.round(2)}")
print(f"\n표본:\n{S_emp.round(2)}")

표본 공분산이 이론값에 수렴 — RE 와 CS 가 같은 모집단을 표현함을 직접 확인.

6.3 Step 3: R 에서 RE-CPM 적합 (= MRM 적합)

library(nlme)
library(lme4)

# 합성 종단 데이터
set.seed(2026)
n_subj <- 80
n_time <- 6
df <- expand.grid(week = 0:(n_time - 1), id = 1:n_subj)
df$y  <- rnorm(nrow(df))

# 방식 1 — MRM 표기 (lme4)
m_mrm <- lmer(y ~ week + (1 + week | id), data = df, REML = FALSE)
summary(m_mrm)
# 추정: sigma_v0^2, sigma_v1^2, cov(v0,v1), sigma^2

# 방식 2 — CPM 표기 (nlme::lme)
m_cpm <- lme(y ~ week,
             random = ~ week | id,
             data = df,
             method = "ML")
summary(m_cpm)

# 두 방식의 우도·고정효과 일치 확인
logLik(m_mrm)
logLik(m_cpm)
fixef(m_mrm)
fixef(m_cpm)
R 에서 두 표기의 차이

lmer 는 MRM 표기 ((1 + week | id)) 를 직접 받는다. lme 도 같은 모형을 표현 (random = ~ week | id).

R 의 다른 패키지에서 RE 구조를 명시할 때:

패키지 함수 형태
lme4 lmer (랜덤 효과 식 \| 그룹)
nlme lme random = ~ ... \| 그룹
glmmTMB glmmTMB (랜덤 효과 식 \| 그룹)

세 패키지 모두 RE-CPM 의 마진 우도를 계산. SAS PROC MIXED 의 random statement 도 같은 역할.

6.4 Step 4: BLUP — RE 가 다른 4 구조와 다른 결정적 능력

# 피험자별 랜덤 효과 추정 (BLUP)
library(lme4)

m <- lmer(y ~ week + (1 + week | id), data = df, REML = FALSE)

# 각 피험자의 절편·기울기 추정
re <- ranef(m)$id
head(re)  # 각 행: 한 피험자의 (절편 편차, 기울기 편차)

# 개인별 예측 곡선
df$pred_individual <- predict(m)  # 개인별 예측
df$pred_average    <- predict(m, re.form = NA)  # 모집단 평균 예측

# 시각화 (생략)
개인별 추론 — RE 의 결정적 차별점

다른 4 구조 (CS, AR(1), Toeplitz, UN) 는 마진 분포만 모형화 한다 → 개인별 절편·기울기를 추정할 수 없다.

RE 구조만이 \(\hat\upsilon_i\) (BLUP) 를 통해 답한다.

  • “환자 A 의 호전 속도는?” — RE 가능, 다른 4 구조 불가능.
  • “정밀의료에서 환자별 반응 곡선은?” — RE 가능, 다른 4 구조 불가능.
  • “센터별 효과의 이질성은?” — RE 가능, 다른 4 구조 불가능.

이 차별점이 RE 를 단순한 “다섯 번째 구조” 가 아니라 MRM 으로 가는 다리 로 만든다.

7 RE 의 한계와 다음 단계

7.1 RE 가 못 하는 것

한계 의미 대안
디자인 \(Z_i\) 선택 의존 잘못된 디자인이면 분산 구조 misspecified 잔차 진단, 모형 비교 (LR, AIC)
양정치 제약 \(\Sigma_\upsilon\) 가 양정치 유지 어려움 (\(r\) 클수록) Cholesky 매개변수화, \(r\) 제한
함수 형태 강제 시간 의존이 \(Z_i\) 의 함수 형태로 제한 NS-AR(1), continuous-time AR (Ch.7)
마진 효과만 관심일 때 과한 추가 가정 메커니즘이 본질이 아닌 경우 UN-CPM 으로 직접 마진만 모형화

7.2 Ch.7 — RE 와 fully specified 구조의 결합

가장 유연한 종단 모형은 RE 와 fully specified 구조를 합친 것이다 (Ch.7).

\[ y_i = X_i\beta + Z_i\upsilon_i + \varepsilon_i, \quad \varepsilon_i \sim \mathcal{N}(0, \sigma^2 R_i) \]

여기서 \(R_i\) 는 CS·AR(1)·Toeplitz·NS-AR(1) 중 하나. MRM 의 조건부 독립 가정 (\(R_i = I\)) 을 풀어 두 패러다임을 통합.

8 § 6.3 모형 선택과의 연결

§ 6.3 — 모형 선택 에서는 LR 검정으로 분산 구조를 비교한다. 이때 RE 구조는 다른 4 구조와 약간 다른 위치를 차지한다.

RE vs fully specified 구조의 LR 검정
  • RE vs UN: 둘 다 분산-공분산을 일반적으로 모형화 → 직접 비교 가능. UN 이 보통 더 유연 (RE 의 \(r\) 제한 해소).
  • RE vs CS·AR(1)·Toeplitz: 모수 공간이 달라 nested 가 아닌 경우 많음 → AIC/BIC 가 안전.
  • RE 자체의 \(r\) 비교: \(r=1\) vs \(r=2\) 는 nested → LR 검정 가능, p-value 2 로 나눔 (분산 모수).

§ 6.4 Bock 예시 에서는 4 fully specified 구조만 비교했으나, 본 책의 다음 chapter (Ch.7) 에서 RE + AC 결합 모형이 실제 데이터에 적합되는 사례를 본다.

9 핵심 정리

한 페이지 요약
  1. RE 구조 정의: \(e_i = Z_i\upsilon_i + \varepsilon_i\), \(\upsilon_i \sim \mathcal{N}(0, \Sigma_\upsilon)\), \(\varepsilon_i \sim \mathcal{N}(0, \sigma^2 I)\). 마진 \(\Sigma_i = Z_i\Sigma_\upsilon Z_i^\top + \sigma^2 I\).
  2. 다른 4 구조와 차이: CS·AR(1)·Toeplitz·UN 은 분산-공분산 행렬을 직접 명세 (“fully specified”), RE 는 메커니즘 (랜덤 효과) 으로부터 도출.
  3. 분산 분리: RE 만이 between-subjects (\(\Sigma_\upsilon\)) 와 within-subjects (\(\sigma^2\)) 분산을 분리.
  4. 모수 수: \(q = r(r+1)/2 + 1\), \(r\) = 랜덤 효과 수. \(r=1 \to q=2\), \(r=2 \to q=4\).
  5. CS 와의 동치: \(r=1\) (\(Z_i = \mathbf{1}\)) 일 때 RE 의 마진 = CS. 모수 수도 일치.
  6. MRM 과의 등가: RE-CPM 의 마진 분포 = MRM 의 마진 분포. 추정량·표준오차·우도 모두 일치. 차이는 표기와 강조점뿐.
  7. 결정적 차별점: BLUP (\(\hat\upsilon_i\)) — 개인별 절편·기울기 추정. 다른 4 구조는 마진만 모형화하므로 불가능.
  8. 시점별 분산 변동: \(r \geq 2\) 면 자동 (CS·AR(1)·Toeplitz 의 정상성을 자연스럽게 깸).
  9. 한계: 디자인 \(Z_i\) 선택 의존, 양정치 제약, \(r\) 의 실제 상한 (~3-4).
  10. 다음 단계: RE 와 fully specified 구조 결합 (Ch.7) 가 가장 유연한 종단 모형.

RE 구조는 CPM 의 다섯 번째 구조이지만 단순한 추가 옵션이 아니다. 다른 4 구조와 MRM 을 잇는 다리 로서 종단 모형 전체의 통합 시각을 제공한다. “분산-공분산을 어디서 받아쓸 것인가” 의 답을 메커니즘 (랜덤 효과) 에서 찾는 것 — 이것이 종단 데이터 분석의 본질적 선택이다.

10 Ch.6 마무리 — 5 구조의 여정

다섯 sub-post 를 통해 CPM 의 5 구조를 다 다뤘다.

구조 sub-post 핵심 직관
모형 일반·5 구조 비교 Ch.6 Overview “분산-공분산을 어떻게 모수화할까”
CS, AR(1) § 6.2.1-6.2.2 “두 절약 구조 — lag 무시 vs 지수 감쇠”
Toeplitz, UN § 6.2.3-6.2.4 “두 유연 구조 — 가정을 단계적으로 풀기”
RE 이 포스트 “메커니즘으로부터 분산 도출 — MRM 과의 다리”

남은 것: - § 6.4 Bock WPSS 예시 sub-post — 5 모형 적합 비교의 수치적 재현 (작성 예정). - Ch.7 — RE + AC 결합 모형 (이미 overview§7.2 작성됨).

11 관련 주제

선행 지식

관련

후속 주제

교재

  • Hedeker, D. & Gibbons, R. D. (2006). Longitudinal Data Analysis, Wiley, Ch.6 §6.2.5 (pp. 104-105)
  • Jennrich, R. I. & Schluchter, M. D. (1986). “Unbalanced repeated-measures models with structured covariance matrices”, Biometrics 42, 805-820 — “fully specified” vs RE 구분의 원전
  • Laird, N. M. & Ware, J. H. (1982). “Random-effects models for longitudinal data”, Biometrics 38, 963-974 — RE 모형의 종단 적용 원전

Subscribe

Enjoy this blog? Get notified of new posts by email: