1 들어가며 — 다른 4 구조와 무엇이 다른가
Ch.6 Overview 에서 5 가지 공분산 구조를 한 표로 정리했다. 그중 앞의 네 구조 — CS·AR(1), Toeplitz·UN — 는 모두 한 가지 공통점이 있다.
분산-공분산 행렬 \(\Sigma_i\) 를 직접 명세 한다. 그 안의 모수 (\(\sigma^2\), \(\rho\), \(\theta_k\) 등) 가 어디서 왔는지 묻지 않는다.
Jennrich & Schluchter (1986) 는 이 네 구조를 “fully specified structures” 라 부른다. 행렬 자체가 모형의 출발점이다.
다섯 번째 — Random-Effects (RE) 구조 — 는 정반대다.
분산-공분산을 만들어내는 메커니즘 (랜덤 효과 \(\upsilon_i\) 와 잔차 \(\varepsilon_i\)) 을 명세하고, 그 결과로 \(\Sigma_i\) 가 도출된다.
fully specified (CS, AR(1), Toeplitz, UN): “사진 (분산-공분산 행렬) 을 보고 모수를 채운다.” RE: “필름 (랜덤 효과 모형) 으로부터 사진을 현상한다.”
같은 사진 (마진 분산-공분산) 을 두 방식으로 얻을 수 있다 — 그 동치성이 이 포스트의 핵심.
이 차이가 한 가지 중요한 결과를 만든다.
다른 4 구조는 between-subjects 분산과 within-subjects 분산을 구분 안 한다. RE 만이 둘을 분리한다.
이 통합적 시각이 RE 구조의 가치다 — 또한 MRM 과 CPM 의 다리 역할을 하는 이유.
2 출발점 — RE 구조 정의
2.1 메커니즘 명세
CPM 의 일반 식 \(y_i = X_i\beta + e_i\) 에서, 오차 벡터 \(e_i\) 를 다음과 같이 분해한다.
\[ e_i = Z_i \upsilon_i + \varepsilon_i, \tag{6.7} \]
여기서
- \(Z_i\): \(n_i \times r\) 의 랜덤 효과 디자인 행렬 (예: 절편 + 시간).
- \(\upsilon_i\): \(r \times 1\) 의 피험자별 랜덤 효과 벡터, \(\upsilon_i \sim \mathcal{N}_r(0, \Sigma_\upsilon)\).
- \(\varepsilon_i\): \(n_i \times 1\) 의 잔차 벡터, \(\varepsilon_i \sim \mathcal{N}_{n_i}(0, \sigma^2 I_{n_i})\).
- \(\upsilon_i \perp \varepsilon_i\) (독립).
이로부터 마진 분산-공분산 행렬은 다음 형태를 띤다.
\[ \Sigma_i = Z_i \Sigma_\upsilon Z_i^\top + \sigma^2 I_{n_i}. \tag{6.8} \]
- 모수: \(\Sigma_\upsilon\) 의 \(r(r+1)/2\) 개 + \(\sigma^2\) 1 개 = \(q = r(r+1)/2 + 1\).
\[ \underbrace{\Sigma_i}_{\text{전체 분산}} = \underbrace{Z_i \Sigma_\upsilon Z_i^\top}_{\text{between-subjects}} + \underbrace{\sigma^2 I_{n_i}}_{\text{within-subjects}} \]
- Between: 같은 피험자의 모든 시점이 공유하는 변동 (피험자별 랜덤 효과로부터).
- Within: 같은 피험자 안에서 시점마다 독립적으로 흔들리는 변동 (잔차로부터).
이 분해가 RE 구조의 본질 — CS·AR(1)·Toeplitz·UN 어느 것도 이 분해를 명시적으로 하지 않는다.
2.2 추가 명세가 필요한 이유
§6.2.1~§6.2.4 의 4 구조는 식 (6.1) — \(y_i = X_i\beta + e_i\), \(e_i \sim \mathcal{N}(0, \Sigma_i)\) — 만으로 정의가 끝난다. \(\Sigma_i\) 의 형태를 직접 명세하기 때문.
RE 구조는 다르다. 추가 명세 (식 6.7) 가 필요하다 — 랜덤 효과 디자인 \(Z_i\), 랜덤 효과 분산 \(\Sigma_\upsilon\), 잔차 분산 \(\sigma^2\) 를 분리하여 명시해야 비로소 \(\Sigma_i\) 가 결정된다.
Jennrich & Schluchter [1986] 의 표현: RE 는 “fully specified” 구조가 아니다 — 디자인 \(Z_i\) 의 선택이 모형의 일부이기 때문.
3 직관 — 메커니즘이 만드는 패턴
3.1 가장 단순한 경우 — 랜덤 절편만 (\(r = 1\))
\(Z_i = \mathbf{1}_{n_i}\) (모든 원소가 1 인 벡터) 이고 \(\Sigma_\upsilon = \sigma_\upsilon^2\) (스칼라) 일 때:
\[ \Sigma_i = \sigma_\upsilon^2 \mathbf{1}\mathbf{1}^\top + \sigma^2 I_{n_i} = \begin{bmatrix} \sigma_\upsilon^2 + \sigma^2 & \sigma_\upsilon^2 & \cdots & \sigma_\upsilon^2 \\ \sigma_\upsilon^2 & \sigma_\upsilon^2 + \sigma^2 & \cdots & \sigma_\upsilon^2 \\ \vdots & \vdots & \ddots & \vdots \\ \sigma_\upsilon^2 & \sigma_\upsilon^2 & \cdots & \sigma_\upsilon^2 + \sigma^2 \end{bmatrix} \]
이 행렬은 § 6.2.1 의 CS 구조 (식 6.2) 와 정확히 같다. \(\sigma^2 + \sigma_1^2 \leftrightarrow \sigma^2 + \sigma_\upsilon^2\), \(\sigma_1^2 \leftrightarrow \sigma_\upsilon^2\) 의 대응.
→ 랜덤 절편 MRM 의 마진 분포 = CS-CPM
이미 §6.2.1 포스트에서 본 동치성을 RE 구조 일반 식 (6.8) 의 한 특수 경우로 재확인한다. 모수 수도 일치 — RE (\(r=1\)) 의 \(q = 1(2)/2 + 1 = 2\), CS 의 \(q = 2\).
3.2 한 단계 더 — 랜덤 절편 + 기울기 (\(r = 2\))
\(Z_i = [\mathbf{1}, t_i]\) (절편 + 시간 벡터), \(\Sigma_\upsilon = \begin{bmatrix} \sigma_{\upsilon_0}^2 & \sigma_{\upsilon_{01}} \\ \sigma_{\upsilon_{01}} & \sigma_{\upsilon_1}^2 \end{bmatrix}\).
\(\Sigma_i\) 의 \((j, j')\) 원소를 풀어 쓰면:
\[ [\Sigma_i]_{jj'} = \sigma_{\upsilon_0}^2 + \sigma_{\upsilon_{01}}(t_{ij} + t_{ij'}) + \sigma_{\upsilon_1}^2 t_{ij} t_{ij'} + \sigma^2 \mathbb{1}[j = j'] \]
\(t_{ij}, t_{ij'}\) 가 식에 들어오므로 시점에 따라 분산과 공분산이 변동 한다.
| 시점 패턴 | 분산 | 공분산 |
|---|---|---|
| 시점이 0 근처 (\(t \to 0\)) | \(\sigma_{\upsilon_0}^2 + \sigma^2\) | \(\sigma_{\upsilon_0}^2\) |
| 시점이 큼 (\(t\) 큼) | \(\sigma_{\upsilon_0}^2 + 2\sigma_{\upsilon_{01}} t + \sigma_{\upsilon_1}^2 t^2 + \sigma^2\) | (시점에 따라 다름) |
→ 시점별 분산이 시간의 이차 함수로 변동 한다. CS·AR(1)·Toeplitz 의 정상성 (시점별 분산 동일) 을 깬다.
이 패턴이 § 4.4 — MRM 행렬 공식화 에서 나온 마진 분산 곡선과 동일하다 — RE-CPM 은 MRM 의 다른 표기다.
3.3 \(r\) 이 늘면 어떻게 되는가
랜덤 효과 수 \(r\) 이 커지면 모수 수가 빠르게 증가한다.
| \(r\) | \(q = r(r+1)/2 + 1\) | 디자인 예 |
|---|---|---|
| 1 | 2 | 랜덤 절편만 (CS 동치) |
| 2 | 4 | 절편 + 기울기 |
| 3 | 7 | 절편 + 기울기 + 이차 |
| 4 | 11 | 절편 + 기울기 + 이차 + 삼차 |
| 5 | 16 | 4 차 다항식까지 |
랜덤 효과는 자유롭게 늘릴 수 없다.
- \(r\) 의 이론적 상한: \(\min(n_i)\) (각 피험자가 적어도 \(r\) 개 시점 관측 필요).
- 실제 상한: \(\Sigma_\upsilon\) 가 양정치를 유지해야 하므로 보통 \(r \leq 3\) 또는 \(4\).
- \(r\) 이 너무 크면 ML 추정이 boundary 추정 (\(\Sigma_\upsilon\) 의 일부 모수 = 0) 으로 떨어짐.
비교: 같은 시점 \(n=10\) 에서 UN 모수 \(q=55\), RE (\(r=4\)) 모수 \(q=11\) — RE 는 UN 의 1/5 모수로 비슷한 유연성 일부를 표현.
3.4 RE 구조가 자연스럽게 표현하는 패턴
다른 4 구조가 표현 못하는 RE 의 강점.
| 패턴 | RE 가 자연 처리 | 다른 구조 |
|---|---|---|
| 시점별 분산 변동 | \(r \geq 2\) 면 자동 | UN 만 가능 (\(q\) 비싸짐) |
| 같은 lag 의 비균질 상관 | \(r \geq 2\) 면 가능 | UN 만 가능 |
| 개인별 절편·기울기 추정 | \(\hat\upsilon_i\) BLUP 으로 가능 | 불가능 (다른 4 구조 모두) |
| 불등간격 시점 | 시점 \(t_i\) 가 디자인의 일부 | CS·AR(1)·Toeplitz 모두 등간격 가정 |
4 RE 구조와 MRM 의 등가 — 같은 모형 두 표현
4.1 명시적 비교
MRM 식 (Ch.4 §4.4 행렬 공식화):
\[ y_i = X_i\beta + Z_i\upsilon_i + \varepsilon_i, \quad \upsilon_i \sim \mathcal{N}(0, \Sigma_\upsilon), \quad \varepsilon_i \sim \mathcal{N}(0, \sigma^2 I_{n_i}) \]
RE-CPM 식:
\[ y_i = X_i\beta + e_i, \quad e_i \sim \mathcal{N}(0, Z_i \Sigma_\upsilon Z_i^\top + \sigma^2 I_{n_i}) \]
두 모형의 마진 분포 \(y_i \sim \mathcal{N}(X_i\beta, Z_i\Sigma_\upsilon Z_i^\top + \sigma^2 I)\) 가 정확히 같다.
이 등가의 결과:
- ML 우도가 같다 → 추정량 일치, 표준오차 일치.
- 고정 효과 추정 일치 (\(\hat\beta\) 와 SE 동일).
- AIC, BIC 일치.
- 모형 선택 기준 일치.
차이는 표현 방식과 해석 뿐이다.
| 측면 | MRM | RE-CPM |
|---|---|---|
| 식의 형태 | \(y_{ij} = x_{ij}^\top \beta + z_{ij}^\top \upsilon_i + \varepsilon_{ij}\) | \(y_i = X_i\beta + e_i\), \(e_i \sim \mathcal{N}(0, Z_i\Sigma_\upsilon Z_i' + \sigma^2 I)\) |
| 모수 해석 | \(\sigma_\upsilon^2\): 피험자 간, \(\sigma^2\): 피험자 내 | (같은 모수, 다른 강조점) |
| 개인별 추론 | \(\hat\upsilon_i\) BLUP 자연스러움 | 같은 BLUP 가능 (\(\Sigma_\upsilon\), \(Z_i\) 알면) |
| 인과 메커니즘 | “사람마다 다른 절편·기울기” | 메커니즘 미상, 마진만 모형화 |
| 어디서 자주 쓰는가 | 임상·교육·심리 (개인 곡선) | 시계열·계량경제 (총 분산만) |
연구의 관심사가 결정한다.
- 개인별 곡선·예측이 본질적 관심 → MRM 표기 (\(\upsilon_i\) 명시, BLUP 해석)
- 모집단 평균 효과만 관심 → RE-CPM 표기 (마진만 강조)
- 분산 구조가 연구 질문 → CPM 표기 (5 구조 비교 자연)
- 두 표기를 자유롭게 오감 → 통합 이해의 척도
같은 결과에 도달하는 두 길이라는 사실이 이 등가성의 가치다.
5 5 구조 통합 시각 — RE 가 합쳐주는 그림
5.1 RE 와 다른 구조의 nested 관계
RE 구조가 다른 4 구조의 특수 경우가 될 수 있다.
| RE 디자인 (\(Z_i\), \(\Sigma_\upsilon\)) | 결과 분산 구조 |
|---|---|
| \(Z_i = \mathbf{1}\), \(\Sigma_\upsilon = \sigma_\upsilon^2\) | CS (\(r=1\)) |
| 일반 \(Z_i\) + 특정 제약 | AR(1) 근사 (간접) |
| \(Z_i\) 가 모든 시점 지시자 (\(r = n\)), \(\Sigma_\upsilon\) 자유 | UN (사실상) |
부분적으로 그렇다 — 적절한 \(Z_i\) 와 \(\Sigma_\upsilon\) 선택으로 CS 와 UN 을 표현 가능. 하지만 AR(1) 의 지수 감쇠나 Toeplitz 의 lag 별 자유를 그대로 만들기는 어렵다.
또한 모수 수가 다르다. UN 을 RE 로 표현하려면 \(r = n\) 이 필요한데, 이러면 식별 가능성 문제 (랜덤 효과 디자인이 데이터 차원과 같음) 가 발생한다.
→ RE 와 fully specified 구조는 부분적 nested 다. 둘을 자유롭게 오갈 수는 있지만 완벽한 포함 관계는 아님.
5.2 5 구조 한 페이지 비교 (재정리)
| 구조 | 명세 방식 | 분산 분리 | \(q\) | 적합 우위 |
|---|---|---|---|---|
| CS | 직접 (행렬) | X | 2 | 클러스터·짧은 추적 |
| AR(1) | 직접 (행렬) | X | 2 | 등간격·지수 감쇠 |
| Toeplitz | 직접 (행렬) | X | \(n\) | 등간격·비지수 감쇠 |
| UN | 직접 (행렬) | X | \(n(n+1)/2\) | 시점 적음·표본 큼·구조 무가정 |
| RE | 메커니즘 (\(\upsilon_i\), \(\varepsilon_i\)) | O (between/within) | \(r(r+1)/2 + 1\) | 개인 곡선·불등간격·시변 분산 |
다른 4 구조는 분산-공분산 행렬을 “있는 그대로 모형화” 한다. 그게 어디서 왔는지 묻지 않는다.
RE 는 메커니즘을 묻는다 — “왜 같은 사람의 시점들이 상관되는가?” 답: “같은 사람이 자기만의 절편·기울기를 가지기 때문.”
이 메커니즘 모형화가 RE 의 가치이자 비용이다 — 해석 가능성 을 얻고 모형 단순성 을 잃는다 (디자인 선택, 양정치 제약 등 추가 부담).
6 코드 예시
6.1 Step 1: RE 구조 분산-공분산 직접 구성 (numpy)
import numpy as np
def re_cov(Z: np.ndarray, Sigma_v: np.ndarray, sigma2: float) -> np.ndarray:
"""RE 구조 마진 분산-공분산: Z Sigma_v Z' + sigma^2 I
Z: n x r 랜덤 효과 디자인 행렬.
Sigma_v: r x r 랜덤 효과 분산-공분산 행렬.
sigma2: 잔차 분산.
"""
n = Z.shape[0]
return Z @ Sigma_v @ Z.T + sigma2 * np.eye(n)
# 예시 1 — 랜덤 절편만 (r=1) → CS 와 동치
n = 6
Z1 = np.ones((n, 1)) # 모든 행이 1 (절편)
Sv1 = np.array([[2.0]]) # sigma_v^2 = 2.0
print("RE (랜덤 절편만):")
print(re_cov(Z1, Sv1, sigma2=1.0).round(2))
# 대각: 3.0, 비대각: 2.0 — CS 형태 (sigma^2=1, sigma_1^2=2)# 예시 2 — 랜덤 절편 + 기울기 (r=2)
t = np.arange(n) # 시간 0, 1, ..., 5
Z2 = np.column_stack([np.ones(n), t])
Sv2 = np.array([
[1.0, 0.1], # sigma_v0^2 = 1.0, cov = 0.1
[0.1, 0.05], # sigma_v1^2 = 0.05
])
print("\nRE (랜덤 절편 + 기울기):")
print(re_cov(Z2, Sv2, sigma2=0.5).round(2))예시 2 의 출력에서 대각 (시점별 분산) 을 살펴보자.
- \(t=0\): \(\sigma_{\upsilon_0}^2 + 0 + 0 + \sigma^2 = 1.0 + 0.5 = 1.5\)
- \(t=5\): \(\sigma_{\upsilon_0}^2 + 2(0.1)(5) + 0.05 \cdot 25 + 0.5 = 1.0 + 1.0 + 1.25 + 0.5 = 3.75\)
분산이 시간의 이차 함수로 증가. CS·AR(1)·Toeplitz 가 표현 못하는 패턴이다.
6.2 Step 2: RE 와 CS 의 동치 시뮬레이션 검증
import numpy as np
# 같은 마진 분포에서 ML 우도가 같음을 수치 시뮬레이션으로 확인
np.random.seed(2026)
n_subj, n_time = 100, 6
sigma_v2, sigma2 = 2.0, 1.0
# 진짜 데이터 생성 — 랜덤 절편 메커니즘
upsilon = np.random.normal(0, np.sqrt(sigma_v2), n_subj)
epsilon = np.random.normal(0, np.sqrt(sigma2), (n_subj, n_time))
y = upsilon[:, None] + epsilon
# 마진 공분산 행렬 두 방식
Sigma_re = re_cov(np.ones((n_time, 1)), np.array([[sigma_v2]]), sigma2)
Sigma_cs = sigma2 * np.eye(n_time) + sigma_v2 * np.ones((n_time, n_time))
print(f"두 행렬 동일 여부: {np.allclose(Sigma_re, Sigma_cs)}")
# True — RE (r=1) 와 CS 의 마진 행렬이 정확히 같음
# 표본 공분산과 비교
S_emp = np.cov(y.T)
print(f"\n이론 (RE = CS):\n{Sigma_re.round(2)}")
print(f"\n표본:\n{S_emp.round(2)}")표본 공분산이 이론값에 수렴 — RE 와 CS 가 같은 모집단을 표현함을 직접 확인.
6.3 Step 3: R 에서 RE-CPM 적합 (= MRM 적합)
library(nlme)
library(lme4)
# 합성 종단 데이터
set.seed(2026)
n_subj <- 80
n_time <- 6
df <- expand.grid(week = 0:(n_time - 1), id = 1:n_subj)
df$y <- rnorm(nrow(df))
# 방식 1 — MRM 표기 (lme4)
m_mrm <- lmer(y ~ week + (1 + week | id), data = df, REML = FALSE)
summary(m_mrm)
# 추정: sigma_v0^2, sigma_v1^2, cov(v0,v1), sigma^2
# 방식 2 — CPM 표기 (nlme::lme)
m_cpm <- lme(y ~ week,
random = ~ week | id,
data = df,
method = "ML")
summary(m_cpm)
# 두 방식의 우도·고정효과 일치 확인
logLik(m_mrm)
logLik(m_cpm)
fixef(m_mrm)
fixef(m_cpm)lmer 는 MRM 표기 ((1 + week | id)) 를 직접 받는다. lme 도 같은 모형을 표현 (random = ~ week | id).
R 의 다른 패키지에서 RE 구조를 명시할 때:
| 패키지 | 함수 | 형태 |
|---|---|---|
lme4 |
lmer |
(랜덤 효과 식 \| 그룹) |
nlme |
lme |
random = ~ ... \| 그룹 |
glmmTMB |
glmmTMB |
(랜덤 효과 식 \| 그룹) |
세 패키지 모두 RE-CPM 의 마진 우도를 계산. SAS PROC MIXED 의 random statement 도 같은 역할.
6.4 Step 4: BLUP — RE 가 다른 4 구조와 다른 결정적 능력
# 피험자별 랜덤 효과 추정 (BLUP)
library(lme4)
m <- lmer(y ~ week + (1 + week | id), data = df, REML = FALSE)
# 각 피험자의 절편·기울기 추정
re <- ranef(m)$id
head(re) # 각 행: 한 피험자의 (절편 편차, 기울기 편차)
# 개인별 예측 곡선
df$pred_individual <- predict(m) # 개인별 예측
df$pred_average <- predict(m, re.form = NA) # 모집단 평균 예측
# 시각화 (생략)다른 4 구조 (CS, AR(1), Toeplitz, UN) 는 마진 분포만 모형화 한다 → 개인별 절편·기울기를 추정할 수 없다.
RE 구조만이 \(\hat\upsilon_i\) (BLUP) 를 통해 답한다.
- “환자 A 의 호전 속도는?” — RE 가능, 다른 4 구조 불가능.
- “정밀의료에서 환자별 반응 곡선은?” — RE 가능, 다른 4 구조 불가능.
- “센터별 효과의 이질성은?” — RE 가능, 다른 4 구조 불가능.
이 차별점이 RE 를 단순한 “다섯 번째 구조” 가 아니라 MRM 으로 가는 다리 로 만든다.
7 RE 의 한계와 다음 단계
7.1 RE 가 못 하는 것
| 한계 | 의미 | 대안 |
|---|---|---|
| 디자인 \(Z_i\) 선택 의존 | 잘못된 디자인이면 분산 구조 misspecified | 잔차 진단, 모형 비교 (LR, AIC) |
| 양정치 제약 | \(\Sigma_\upsilon\) 가 양정치 유지 어려움 (\(r\) 클수록) | Cholesky 매개변수화, \(r\) 제한 |
| 함수 형태 강제 | 시간 의존이 \(Z_i\) 의 함수 형태로 제한 | NS-AR(1), continuous-time AR (Ch.7) |
| 마진 효과만 관심일 때 과한 추가 가정 | 메커니즘이 본질이 아닌 경우 | UN-CPM 으로 직접 마진만 모형화 |
7.2 Ch.7 — RE 와 fully specified 구조의 결합
가장 유연한 종단 모형은 RE 와 fully specified 구조를 합친 것이다 (Ch.7).
\[ y_i = X_i\beta + Z_i\upsilon_i + \varepsilon_i, \quad \varepsilon_i \sim \mathcal{N}(0, \sigma^2 R_i) \]
여기서 \(R_i\) 는 CS·AR(1)·Toeplitz·NS-AR(1) 중 하나. MRM 의 조건부 독립 가정 (\(R_i = I\)) 을 풀어 두 패러다임을 통합.
8 § 6.3 모형 선택과의 연결
§ 6.3 — 모형 선택 에서는 LR 검정으로 분산 구조를 비교한다. 이때 RE 구조는 다른 4 구조와 약간 다른 위치를 차지한다.
- RE vs UN: 둘 다 분산-공분산을 일반적으로 모형화 → 직접 비교 가능. UN 이 보통 더 유연 (RE 의 \(r\) 제한 해소).
- RE vs CS·AR(1)·Toeplitz: 모수 공간이 달라 nested 가 아닌 경우 많음 → AIC/BIC 가 안전.
- RE 자체의 \(r\) 비교: \(r=1\) vs \(r=2\) 는 nested → LR 검정 가능, p-value 2 로 나눔 (분산 모수).
§ 6.4 Bock 예시 에서는 4 fully specified 구조만 비교했으나, 본 책의 다음 chapter (Ch.7) 에서 RE + AC 결합 모형이 실제 데이터에 적합되는 사례를 본다.
9 핵심 정리
- RE 구조 정의: \(e_i = Z_i\upsilon_i + \varepsilon_i\), \(\upsilon_i \sim \mathcal{N}(0, \Sigma_\upsilon)\), \(\varepsilon_i \sim \mathcal{N}(0, \sigma^2 I)\). 마진 \(\Sigma_i = Z_i\Sigma_\upsilon Z_i^\top + \sigma^2 I\).
- 다른 4 구조와 차이: CS·AR(1)·Toeplitz·UN 은 분산-공분산 행렬을 직접 명세 (“fully specified”), RE 는 메커니즘 (랜덤 효과) 으로부터 도출.
- 분산 분리: RE 만이 between-subjects (\(\Sigma_\upsilon\)) 와 within-subjects (\(\sigma^2\)) 분산을 분리.
- 모수 수: \(q = r(r+1)/2 + 1\), \(r\) = 랜덤 효과 수. \(r=1 \to q=2\), \(r=2 \to q=4\).
- CS 와의 동치: \(r=1\) (\(Z_i = \mathbf{1}\)) 일 때 RE 의 마진 = CS. 모수 수도 일치.
- MRM 과의 등가: RE-CPM 의 마진 분포 = MRM 의 마진 분포. 추정량·표준오차·우도 모두 일치. 차이는 표기와 강조점뿐.
- 결정적 차별점: BLUP (\(\hat\upsilon_i\)) — 개인별 절편·기울기 추정. 다른 4 구조는 마진만 모형화하므로 불가능.
- 시점별 분산 변동: \(r \geq 2\) 면 자동 (CS·AR(1)·Toeplitz 의 정상성을 자연스럽게 깸).
- 한계: 디자인 \(Z_i\) 선택 의존, 양정치 제약, \(r\) 의 실제 상한 (~3-4).
- 다음 단계: RE 와 fully specified 구조 결합 (Ch.7) 가 가장 유연한 종단 모형.
RE 구조는 CPM 의 다섯 번째 구조이지만 단순한 추가 옵션이 아니다. 다른 4 구조와 MRM 을 잇는 다리 로서 종단 모형 전체의 통합 시각을 제공한다. “분산-공분산을 어디서 받아쓸 것인가” 의 답을 메커니즘 (랜덤 효과) 에서 찾는 것 — 이것이 종단 데이터 분석의 본질적 선택이다.
10 Ch.6 마무리 — 5 구조의 여정
다섯 sub-post 를 통해 CPM 의 5 구조를 다 다뤘다.
| 구조 | sub-post | 핵심 직관 |
|---|---|---|
| 모형 일반·5 구조 비교 | Ch.6 Overview | “분산-공분산을 어떻게 모수화할까” |
| CS, AR(1) | § 6.2.1-6.2.2 | “두 절약 구조 — lag 무시 vs 지수 감쇠” |
| Toeplitz, UN | § 6.2.3-6.2.4 | “두 유연 구조 — 가정을 단계적으로 풀기” |
| RE | 이 포스트 | “메커니즘으로부터 분산 도출 — MRM 과의 다리” |
남은 것: - § 6.4 Bock WPSS 예시 sub-post — 5 모형 적합 비교의 수치적 재현 (작성 예정). - Ch.7 — RE + AC 결합 모형 (이미 overview 와 §7.2 작성됨).
11 관련 주제
선행 지식
- Ch.6 Overview — 공분산 패턴 모형 (CPM) — 5 구조 개요
- § 6.2.1-6.2.2 — CS 와 AR(1) — RE(\(r=1\)) = CS 동치
- § 6.2.3-6.2.4 — Toeplitz 와 UN — RE 와 UN 의 부분적 nested
- § 4.4 — MRM 행렬 공식화 — RE 와 등가인 마진 분산 도출
관련
- § 4.2 — 랜덤 절편 MRM — RE(\(r=1\)) 의 메커니즘적 표현
- § 4.3 — 랜덤 절편·추세 MRM — RE(\(r=2\)) 의 메커니즘적 표현
- § 4.5 — MRM 추정론 — ML/REML/EM/Fisher Scoring
후속 주제
- § 6.4 Bock WPSS 5 모형 적합 비교 (작성 예정)
- Ch.7 Overview — MRM with Autocorrelated Errors — RE + fully specified 결합
- § 7.2 — AR(1)·MA(1)·ARMA(1,1)·Toeplitz·NS-AR(1) — 자기상관 구조 상세
교재
- Hedeker, D. & Gibbons, R. D. (2006). Longitudinal Data Analysis, Wiley, Ch.6 §6.2.5 (pp. 104-105)
- Jennrich, R. I. & Schluchter, M. D. (1986). “Unbalanced repeated-measures models with structured covariance matrices”, Biometrics 42, 805-820 — “fully specified” vs RE 구분의 원전
- Laird, N. M. & Ware, J. H. (1982). “Random-effects models for longitudinal data”, Biometrics 38, 963-974 — RE 모형의 종단 적용 원전