§ 14.5.2 — Pattern-Mixture Models (Little 1993, 1994, 1995) 의 깊이

Pattern-Mixture 의 발상 (subject 를 missing pattern 별 그룹화 → between-subjects variable) · Little (1993, 1994, 1995) 의 정립 + 이전 (Glynn 1986, Marini 1980) + SEM (Allison 1987, Muthén 1987, McArdle-Hamagami 1992) + 최근 (Daniels-Hogan, Demirtas, Fitzmaurice, Hedeker-Gibbons 1997, Molenberghs, Roy, Thijs 등) · 3 시점 8 패턴 + dummy coding (Table 14.12, 14.13) · § 14.5.2.1 NIMH 예시 (식 14.21-14.23: simple Drop vs full 5 dropout weeks, Table 14.14 LR test, Drop × Drug × SWeek 3-way interaction 결정적) · Demirtas-Schafer (2003) 의 caveat — PM fit better 가 MAR rejection 아님 · Averaging over patterns (식 14.24-14.28: \(\hat{\bar{\beta}} = \pi^{(c)} \hat{\beta}^{(c)} + \pi^{(d)} \hat{\beta}^{(d)}\), Hogan-Laird 1997a delta method) · Weighted effect coding (식 14.29, Darlington 1990) + 6 patterns 확장 (식 14.31-14.32, Agresti 2002 의 multinomial covariance)

Hedeker & Gibbons (2006) § 14.5.2 의 정밀 분석. Pattern-Mixture 의 핵심 발상: 결측 패턴 별로 subject 그룹화 → 패턴이 between-subjects variable (sex 같은 covariate). 패턴 별 응답 분포 → mixture. MNAR 처리 가능. Little (1993, 1994, 1995) 의 통계적 정립 + 이전 작업 (Glynn 1986, Marini 1980) + SEM (Allison 1987, Muthén 1987, McArdle-Hamagami 1992) + 최근 발전 (Daniels-Hogan, Demirtas, Fitzmaurice, Hedeker-Gibbons 1997, Molenberghs, Roy, Thijs 등). 패턴 그룹화: 3 시점 → \(2^3 = 8\) 패턴, MMM (전부 결측) 제외 → 7 패턴, dummy code D1-D6 (Table 14.12). 대안 coding: monotone (M1, M2), last wave (L1, L2), incomplete (I1), not at final (F1) (Table 14.13). Coding 선택 고려사항: sparseness, 영향, main vs interaction. § 14.5.2.1 NIMH 예시: 식 14.21 basic MRM, 식 14.22 simple PM (completer 335 vs dropout 102), 식 14.23 full PM (5 dropout weeks). Table 14.14: ordinary MRM vs simple vs full LR test. Full vs ordinary \(\\chi^2_{20} = 41.2\) (p < .004), full vs simple \(\\chi^2_{16} = 15.5\) (p < .49 → simple OK), simple vs ordinary \(\\chi^2_4 = 25.7\) (p < .0001). Drop × Drug × SWeek 3-way \(\\beta^D_3 = -.635\) (p < .002) — dropout 의 drug effect 가 completer 보다 강함. Demirtas-Schafer (2003) 의 결정적 caveat: pre-dropout responses 와의 관계는 ignorability 부정 못함. Averaging over patterns: 식 14.24-14.27 (completer + dropout 별도 추정, weighted average). 식 14.28 Hogan-Laird (1997a) delta method (3-term variance). Weighted effect coding (Darlington 1990): 식 14.29 의 DropW = \(-\\pi^{(d)}/\\pi^{(c)}\) for completers, 1 for dropouts — averaged 추정 직접 + 식 14.30 SE 보정. 6 패턴 확장: 식 14.31-14.32 (Agresti 2002 multinomial covariance, B P×M deviation matrix). Table 14.15: 세 모형 결과 거의 동일 → MRM, selection, PM 모두 같은 conclusion → 강건한 finding.

Statistics
저자

Kwangmin Kim

공개

2026년 05월 06일

1 들어가며

본 글의 범위:

  • § 14.5.2 Pattern-Mixture 의 발상과 역사.
  • 패턴 그룹화와 coding (3 시점 예, Tables 14.12, 14.13).
  • § 14.5.2.1 NIMH 예시 — 식 14.21-14.23, Table 14.14, Demirtas-Schafer caveat.
  • Averaging over patterns — 식 14.24-14.28 (delta method, Hogan-Laird 1997a).
  • Weighted effect coding — 식 14.29-14.32 (Darlington 1990, Agresti 2002).
  • Table 14.15 의 종합 결과.
한 줄 요약

“§ 14.5.2 = MNAR 처리의 두 번째 framework — Pattern-Mixture Model. 핵심 발상: subject 를 결측 패턴 별로 그룹화 → 패턴 자체가 between-subjects variable (sex 처럼). 패턴별 응답 분포 → mixture. Little (1993, 1994, 1995) 의 정립. 3 시점 → \(2^3 = 8\) 패턴 (MMM 제외 7), dummy code 또는 monotone/last-wave/incomplete coding. § 14.5.2.1 NIMH 예시: 식 14.22 의 simple PM (Drop = 0/1) → Drop × Drug × SWeek 3-way \(\beta^D_3 = -.635\) (p < .002) — dropout 의 drug effect 가 completer 보다 강함. Demirtas-Schafer (2003) 의 caveat: PM 의 better fit 이 MAR rejection 의미 아님. Averaging over patterns (식 14.24-14.28): \(\hat{\bar{\beta}} = \pi^{(c)} \hat{\beta}^{(c)} + \pi^{(d)} \hat{\beta}^{(d)}\) + Hogan-Laird (1997a) 의 delta method 로 SE 보정 (sample proportion 추정 contribution 포함). Weighted effect coding (Darlington 1990): DropW = \(-\pi^{(d)}/\pi^{(c)}\) for completers → averaged estimate 직접. Table 14.15 결과: ordinary MRM, simple PM, full PM 모두 같은 결론 (drug 효과 강건) → selection model 결과와도 일치 → robust finding.”

2 § 14.5.2 — Pattern-Mixture Models 일반론

2.1 발상과 역사

Little (1993, 1994, 1995) 의 정립

저자 본문 인용:

“As an alternative to selection models, Little [1993, 1994, 1995] formulated a general class of models under the rubric ‘pattern-mixture models’ for the analysis of missing, or incomplete, data.”

역사적 흐름:

시기 저자 기여
1980 Marini, Olsen, Rubin 초기 발상
1986 Glynn, Laird, Rubin 비교 분석
1987 Allison; Muthén, Kaplan, Hollis SEM 적용
1992 McArdle, Hamagami SEM 확장
1993, 1994, 1995 Little 통계적 정립
1997 Hedeker & Gibbons NIMH 적용
1997 Hogan & Laird Selection vs PM 비교
1998 Molenberghs, Michiels, Kenward, Diggle Sensitivity
2000 Daniels & Hogan Bayesian PM
2001 Fitzmaurice, Laird, Shneyer Identifiability
2002 Thijs, Molenberghs, Michiels, Verbeke, Curran ACMV/NCMV
2003 Demirtas & Schafer Caveat
2004 Guo, Ratcliffe, Ten Have 임상 응용
2005a, 2005b Demirtas Multiple imputation 와 PM
직관 — Pattern-Mixture 의 발상

저자 본문 인용:

“In these models, subjects are divided into groups depending on their missing-data pattern. These groups then can be used, for example, to examine the effect of the missing-data pattern on the outcome(s) of interest.”

핵심 발상의 단계:

  1. 그룹화: 환자를 결측 패턴 별로 분류.
    • 같은 패턴 = 같은 그룹.
  2. 그룹 변수화: 패턴 자체가 between-subjects variable.
    • Sex, age 같은 covariate.
  3. Mixture model: 전체 = 패턴별 응답 분포의 가중 평균.

왜 MNAR 처리 가능:

  • 패턴 별로 응답 분포 다름 허용.
  • 즉 결측 패턴이 응답 (관측 + 미관측) 에 영향.
  • → ignorability 가정 안 함.
  • → MNAR 자연 처리.

Selection 와의 본질 차이:

  • Selection: \(f(y, R) = f(y) f(R \mid y)\) — 응답이 먼저, 결측이 다음.
  • Pattern-Mixture: \(f(y, R) = f(R) f(y \mid R)\) — 결측 패턴이 먼저, 응답이 다음.
  • 같은 결합 분포의 두 다른 factorization.

임상 의미:

  • “Dropout 환자와 completer 환자가 다른 응답 패턴” 을 명시적 모형.
  • 두 그룹의 trajectory 차이 추정 가능.
  • 그룹별 개별 분석 + 전체 평균.

2.2 패턴 그룹화 (3 시점 예)

3 시점 → 8 패턴

저자 본문 인용:

“suppose that subjects are measured at three timepoints, then there are eight (\(2^3\)) possible missing-data patterns”

8 패턴:

그룹 Time 1 Time 2 Time 3
1 O O O
2 M O O
3 O M O
4 M M O
5 O O M
6 M O M
7 O M M
8 M M M

MMM 제외 (저자 본문):

“since the last pattern (MMM) provides no data, for practical purposes, this pattern is often ignored in data analysis”

→ MMM 환자는 어떤 시점도 측정 안 됨 → 분석 불가능. → 보통 7 패턴.

직관 — 분석 method 의 요구사항

저자 본문 인용:

“the method of analysis must allow subjects to have complete or incomplete data across time. Thus, this approach will not work with a method which requires complete data across time, since in this case, only subjects with the complete data pattern (i.e., OOO) would be included in the analysis.”

Pattern-Mixture 와 호환되지 않는 method:

  • Multivariate repeated measures ANOVA: complete data 만 (listwise deletion).
  • Pattern OOO (모든 시점 관측) 만 포함.
  • 다른 패턴은 분석 안 됨.
  • → Pattern-Mixture 의 그룹화 자체 불가능.

Pattern-Mixture 와 호환되는 method:

  • MRM (mixed-effects regression model): variable cluster size.
  • CPM (covariance pattern model): full likelihood.
  • GEE: marginal model.
  • → 모두 결측 자연 처리.

왜 MRM 가 Pattern-Mixture 의 자연스러운 platform:

  • 환자별 시점 수 변동 OK.
  • 모든 패턴의 환자 동시 분석 가능.
  • 패턴별 effect 추정 가능 (interaction).

2.3 Coding Schemes (Tables 14.12, 14.13)

Dummy Coding (Table 14.12)

저자 본문 명시 (7 패턴 — MMM 제외):

Pattern D1 D2 D3 D4 D5 D6
OOO 0 0 0 0 0 0
MOO 1 0 0 0 0 0
OMO 0 1 0 0 0 0
MMO 0 0 1 0 0 0
OOM 0 0 0 1 0 0
MOM 0 0 0 0 1 0
OMM 0 0 0 0 0 1

OOO 가 reference cell — D1-D6 모두 0. 대안 coding (Darlington 1990):

  • Effect coding.
  • Sequential coding.
  • → 분석 목적 따라 선택.
직관 — Dummy 의 활용

모형에 추가 방법:

  1. Main effect: \(\beta^D D_k\) — 패턴별 outcome 평균 차이.
  2. Interaction: \(\beta^D (D_k \times \text{covariate})\) — covariate 효과의 패턴별 차이.

해석:

  • 식 14.22 (NIMH simple PM):
    • Drop = 1 의 main effect (\(\beta_0^D\)): dropout vs completer 의 baseline 차이.
    • Drop × Drug (\(\beta_1^D\)): drug 효과의 dropout vs completer 차이.
    • Drop × SWeek (\(\beta_2^D\)): time 효과의 dropout vs completer 차이.
    • Drop × Drug × SWeek (\(\beta_3^D\)): drug × time interaction 의 dropout vs completer 차이.

3-way interaction 의 결정적 의미:

  • “Drug × time effect 가 dropout 그룹과 completer 그룹에서 다른가?”
  • Significant → MAR 가정 하 단일 효과 추정의 한계.
Monotone + Last-Wave + Incomplete Coding (Table 14.13)

저자 본문 명시:

Pattern M1 M2 L1 L2 I1 F1
OOO 0 0 0 0 0 0
MOO 0 0 1 0
OMO 0 0 1 0
MMO 0 0 1 0
OOM 0 1 0 1 1 1
MOM 0 1 1 1
OMM 1 0 1 0 1 1

해석:

  • M1, M2: monotone dropout 만 (3 패턴).
  • L1, L2: last available wave 별 그룹화.
  • I1: complete vs incomplete (단순 2 그룹).
  • F1: 마지막 시점 missing vs not (단순 2 그룹).
직관 — Coding 선택의 고려사항

저자 본문 인용:

“In deciding on an appropriate grouping of the missing-data patterns, a few things need to be considered. One is the sparseness of the patterns. If a pattern has very few observations, it may not make sense to treat it as a separate group in the analysis.”

선택 고려사항:

  1. Sparseness:
    • 어떤 패턴이 5 명 이하 → 별도 그룹 의미 없음.
    • → Combine into larger groups.
  2. Intermittent missing 의 처리:
    • 보통 random 가정 → dropout 만 분석.
    • Last available wave 그룹화 (L1, L2).
  3. Main vs interaction:
    • Single observation 패턴 (OMM, MOM, MMO): 1 시점만 → time interaction 추정 불가능.
    • → Time interaction 분석 시 이 패턴 제외 또는 main effect 만.
  4. 임상 의미:
    • Dropout vs completer 의 단순 비교 → I1 또는 F1.
    • 시기별 dropout 차이 → M1, M2 또는 L1, L2.
    • 모든 패턴 → D1-D6.

실무 권고 절차:

  1. 패턴별 빈도 표.
  2. 5 미만 패턴 combine.
  3. 단순 coding (Drop=0/1) 부터 시작.
  4. Full pattern coding 으로 확장.
  5. LR test 로 두 모형 비교.

§ 14.5.2.1 NIMH 의 절차:

  • Hedeker-Gibbons (1997): simple Drop=0/1.
  • 본 chapter: full 5 dropout weeks (D1-D5) 도 추가.
  • LR test 로 비교.

3 § 14.5.2.1 — NIMH Schizophrenia 예시

3.1 식 (14.21) — Basic MRM

출발점: Standard MRM

저자 본문 인용 (식 14.21):

\[IMPS79_{ij} = \beta_0 + \beta_1 Drug_i + \beta_2 SWeek_j + \beta_3 (Drug_i \times SWeek_j) + \upsilon_{0i} + \upsilon_{1i} SWeek_j + \varepsilon_{ij}\]

SWeek = \(\sqrt{week}\) — 비선형 관계 선형화 (§ 14.5.1.2 와 동일).

MAR 가정 모형 — pattern-mixture 의 baseline 비교 대상.

3.2 식 (14.22) — Simple Pattern-Mixture (Drop=0/1)

Hedeker-Gibbons (1997) 의 단순 PM

저자 본문 인용 (식 14.22):

\[IMPS79_{ij} = \beta_0 + \beta_1 Drug_i + \beta_2 SWeek_j + \beta_3 (Drug_i \times SWeek_j)\] \[+ \beta_0^D Drop_i + \beta_1^D (Drop_i \times Drug_i) + \beta_2^D (Drop_i \times SWeek_j) + \beta_3^D (Drop_i \times Drug_i \times SWeek_j)\] \[+ \upsilon_{0i} + \upsilon_{1i} SWeek_j + \varepsilon_{ij}\]

그룹화:

  • \(Drop_i = 0\): completer (\(N = 335\)).
  • \(Drop_i = 1\): dropout (\(N = 102\)).

모수 의미:

  • \(\beta_0, \beta_1, \beta_2, \beta_3\): completer 그룹의 효과.
  • \(\beta_0^D, \beta_1^D, \beta_2^D, \beta_3^D\): dropout 그룹의 deviation (completer 대비).

Dropout 그룹의 effect = \(\beta + \beta^D\).

직관 — 3-Way Interaction 의 결정적 의미

저자 본문 인용:

“in this pattern-mixture model it is the three-way interaction that is particularly of interest.”

\(\beta_3^D\) (Drop × Drug × SWeek) 의 의미:

  • “Drug × time effect 가 dropout 그룹과 completer 그룹에서 다른가?”
  • 임상 핵심 질문: drug 효과 추정에 dropout 영향 있나?

시나리오:

  • \(\beta_3^D = 0\): drug effect 가 두 그룹 같음 → MAR 가정 OK.
  • \(\beta_3^D \neq 0\): drug effect 가 다름 → MAR 위반 가능성.

임상 의미:

  • Dropout 환자가 더 효과 보임 (또는 적음) → drug effect 추정에 bias.
  • → Pattern-mixture 로 명시적 분리 필요.

§ 14.5.1.2 Selection model 결과와 연결:

  • Selection: Drug × random slope interaction \(\alpha_5 = -1.638\).
  • Pattern-Mixture: Drop × Drug × SWeek \(\beta_3^D = -.635\).
  • → 두 framework 모두 dropout 그룹의 다른 drug effect 발견.
  • → Robust finding.

3.3 식 (14.23) — Full Pattern-Mixture (5 Dropout Weeks)

5 Dropout Weeks 의 전체 모형

저자 본문 인용 (식 14.23):

\[IMPS79_{ij} = \beta_0 + \beta_1 Drug_i + \beta_2 SWeek_j + \beta_3 (Drug_i \times SWeek_j)\] \[+ \sum_{m=1}^5 \left[ \beta_0^m D_m + \beta_1^m (D_m \times Drug_i) + \beta_2^m (D_m \times SWeek_j) + \beta_3^m (D_m \times Drug_i \times SWeek_j) \right]\] \[+ \upsilon_{0i} + \upsilon_{1i} SWeek_j + \varepsilon_{ij}\]

Coding:

  • \(D_m = 1\) if dropout at week \(m\), else 0.
  • \(D_1, \ldots, D_5\): 5 dropout weeks dummy.
  • Completer = reference cell (모든 \(D_m = 0\)).

모수 수:

  • 4 (basic) + 4 × 5 (interactions) = 24.
  • Variance components 별도.
직관 — 패턴별 분석의 가치와 한계

Full Model 의 가치:

  • 각 dropout 시점별 trajectory 추정.
  • 일찍 dropout vs 늦게 dropout 의 차이.
  • 더 fine-grained 결측 패턴 정보.

Sample size 분포 (NIMH):

  • \(D = 1\): \(N = 37\).
  • \(D = 2\): \(N = 10\).
  • \(D = 3\): \(N = 42\).
  • \(D = 4\): \(N = 5\).
  • \(D = 5\): \(N = 8\).
  • Completer: \(N = 335\).

한계:

  • 일부 패턴 (D=4: 5 명) 매우 sparse → 추정 불안정.
  • \(D \times SWeek\) interaction: 1 시점만 관측한 환자 → 추정 불가능.
  • → simpler model (Drop=0/1) 권고 가능.

Hedeker-Gibbons (1997) 의 결정:

  • Simple Drop=0/1 모형 사용.
  • 이유: parsimony + interpretability.

본 chapter 의 추가 분석:

  • Full 모형도 적합.
  • LR test 로 두 모형 비교.
  • 통계적으로 차이 없으면 simpler 권고.

3.4 Table 14.14 — 결과 비교

Ordinary MRM vs Simple PM vs Full PM

저자 본문 명시 (Table 14.14, 핵심 모수만):

Parameter MRM est Simple PM est Full PM est
Intercept \(\beta_0\) 5.348 5.221 5.221
Drug \(\beta_1\) .046 (n.s.) .202 (n.s.) .202 (n.s.)
SWeek \(\beta_2\) -.336*** -.393*** -.393***
Drug × SWeek \(\beta_3\) -.641*** -.539*** -.539***
Drop main \(\beta_0^1\) .320 (.086) .471 (.10)
Drop × Drug \(\beta_1^1\) -.399 (.079) -.456 (.20)
Drop × SWeek \(\beta_2^1\) .252 (.115) .240 (.47)
Drop × Drug × SWeek \(\beta_3^1\) -.635 (.002) -.412 (.32)
-2 log L 4649.0 4623.3 4607.8

LR Tests (저자 본문 명시):

  • Full PM vs Ordinary MRM: \(\chi^2_{20} = 41.2\), \(p < .004\).
  • Full PM vs Simple PM: \(\chi^2_{16} = 15.5\), \(p < .49\) → simple OK.
  • Simple PM vs Ordinary MRM: \(\chi^2_4 = 25.7\), \(p < .0001\).

결론: Simple PM 채택.

직관 — Simple PM 의 정밀 해석

Completer 그룹 (\(\beta_0\) - \(\beta_3\)):

  • Intercept = 5.221: baseline IMPS79.
  • Drug = .202 (n.s.): baseline 차이 없음.
  • SWeek = -.393 (\(p < .0001\)): placebo 호전 (느림).
  • Drug × SWeek = -.539 (\(p < .0001\)): drug 더 빠른 호전.

Dropout 그룹 (\(\beta + \beta^D\)):

  • Intercept: \(5.221 + 0.320 = 5.541\) (slightly higher baseline).
  • Drug: \(0.202 + (-0.399) = -0.197\) (drug 더 낮은 baseline).
  • SWeek: \(-0.393 + 0.252 = -0.141\) (placebo 호전 약함).
  • Drug × SWeek: \(-0.539 + (-0.635) = -1.174\) (drug 호전 매우 강함).

핵심 발견:

  • Dropout 그룹의 drug 환자는 매우 빠르게 호전.
  • → 호전된 drug 환자가 dropout (더 이상 진료 필요 없음).
  • → § 14.4.1, § 14.5.1.2 결과와 일치.

\(\beta_3^D = -.635\) (\(p < .002\)) 의 결정적 의미:

  • Dropout 그룹의 drug × time effect 가 completer 보다 -.635 더 강함.
  • → drug 효과 추정에 dropout 정보 활용 → 더 강한 효과 발견.

Z = -.635 / .196 = -3.24, p < .002 — highly significant.

3.5 Demirtas-Schafer (2003) 의 결정적 Caveat

PM Better Fit ≠ MAR Rejection

저자 본문 인용:

“This is not a test of the MAR assumption, and the fact that the pattern-mixture model fits the data significantly better than the ordinary MRM model does not indicate that the assumption of MAR is necessarily violated. As noted by Demirtas and Schafer [2003], ‘relationships between \(R\) and pre-dropout responses cannot disprove the hypothesis of ignorability, which states that there is no residual relationship between \(R\) and the post-dropout responses given the pre-dropout values.’”

핵심 caveat:

  • PM 의 better fit = “\(R\) 가 pre-dropout responses 와 연관”.
  • MAR rejection = “\(R\) 가 post-dropout responses 에 추가 연관” (pre-dropout 보정 후).
  • 두 개념은 다름.
직관 — PM 결과의 정확한 해석

Demirtas-Schafer 의 의미:

  • \(R\) 와 관측된 (pre-dropout) \(y\) 사이 관계 → 자료에서 검정 가능.
  • \(R\) 와 미관측 (post-dropout) \(y\) 사이 관계 → 자료로는 불가능.
  • → MAR 의 진짜 검정 = post-dropout 관계.

예시:

  • “Dropout 환자가 baseline 더 심함” → MAR 가정과 일관 가능.
  • “Dropout 환자가 future trajectory 다름” (관측 안 됨) → MAR vs MNAR 구분.

저자 본문 추가:

“These authors also indicate that ignorable dropout mechanisms can yield data patterns like those in the subsequent Figure 14.3”

Figure 14.3 의 dramatic 차이도 ignorable mechanism 으로 발생 가능.

올바른 해석:

  • PM 모형이 better fit → 패턴별 다른 응답 패턴 존재.
  • 이 자체로는 MAR rejection 아님.
  • 그러나 sensitivity analysis 의 가치 있음 (다양한 가정 검토).

실무 결론:

  • PM 결과 = MAR 가정 모형의 alternative.
  • 두 모형 (MRM, PM) 결과 비교.
  • 일관 → conclusion 강건.
  • 큰 차이 → 임상적 판단.

4 Averaging over Patterns

4.1 식 (14.24-14.25) — Pattern-Specific Estimates

Completer 와 Dropout 별도 추정

저자 본문 인용 (식 14.24):

\[\hat{\beta}^{(c)} = \begin{pmatrix} 5.221 & .202 & -.393 & -.539 \end{pmatrix}^\top\]

(Completer 의 4 fixed effects).

저자 본문 인용 (식 14.25):

\[\hat{\beta}^{(d)} = \hat{\beta}^{(c)} + \begin{pmatrix} .320 & -.399 & .252 & -.635 \end{pmatrix}^\top\] \[= \begin{pmatrix} 5.541 & -.197 & -.141 & -1.174 \end{pmatrix}^\top\]

(Dropout 의 4 fixed effects = completer + deviation).

4.2 식 (14.26-14.27) — Weighted Averaging

Population Estimates

저자 본문 인용 (식 14.26):

\[\hat{\bar{\beta}} = \pi^{(c)} \hat{\beta}^{(c)} + \pi^{(d)} \hat{\beta}^{(d)}\]

Sample proportions (NIMH):

  • \(\hat{\pi}^{(c)} = 335/437 = 0.767\).
  • \(\hat{\pi}^{(d)} = 102/437 = 0.233\).

식 14.27 — averaged 결과:

\[\hat{\bar{\beta}} = \begin{pmatrix} 5.296 & .109 & -.335 & -.687 \end{pmatrix}^\top\]

직관 — Averaging 의 가치

왜 Averaging 필요:

  • Pattern-specific estimates 는 각 그룹 따로.
  • 임상 보고서: 전체 population 에 대한 추정.
  • → Pattern 별 추정의 weighted average.

\(\beta_3\) (Drug × SWeek) 의 averaging:

  • Completer: \(-.539\) (drug 효과).
  • Dropout: \(-1.174\) (더 강한 drug 효과).
  • Averaged: \(0.767 \times (-.539) + 0.233 \times (-1.174) = -.687\).
  • → 전체 population 의 drug 효과 추정.

Ordinary MRM 과 비교:

  • MRM (MAR 가정): \(\beta_3 = -.641\).
  • PM averaged: \(\beta_3 = -.687\).
  • → 비슷하지만 PM 이 약간 더 강한 효과 (dropout 정보 활용).

Population weights 의 가정:

  • \(\pi^{(c)}\), \(\pi^{(d)}\) = sample proportions.
  • 가정: sample 이 population 을 대표.
  • → 일반적으로 OK (RCT, 잘 설계된 cohort).

4.3 식 (14.28) — Hogan-Laird (1997a) Delta Method

SE 의 정확한 추정

저자 본문 인용 (식 14.28):

\[\hat{V}(\hat{\bar{\beta}}_h) = (\hat{\pi}^{(c)})^2 \hat{V}(\hat{\beta}_h^{(c)}) + (\hat{\pi}^{(d)})^2 \hat{V}(\hat{\beta}_h^{(d)}) + \frac{\hat{\pi}^{(c)} \hat{\pi}^{(d)}}{N} (\hat{\beta}_h^{(c)} - \hat{\beta}_h^{(d)})^2\]

3 개 구성 요소:

  1. Completer 추정의 분산 × \(\pi^{(c)2}\).
  2. Dropout 추정의 분산 × \(\pi^{(d)2}\).
  3. Pattern proportion 추정의 contribution: \(\pi^{(c)} \pi^{(d)} (\hat{\beta}^{(c)} - \hat{\beta}^{(d)})^2 / N\).

계산 결과 (NIMH 4 effects):

  • SE = \(\sqrt{V}\) = \(.090, .103, .067, .079\).
직관 — 3 번째 항의 의미

저자 본문 인용:

“The last term in the sum is the contribution to the variance that is added because the proportion of completers (and dropouts) is estimated in the sample.”

\(\hat{\pi}\) 가 추정량 — 추가 uncertainty 유발:

  • 만약 \(\pi\) 가 알려진 상수면 → 마지막 항 0.
  • \(\hat{\pi}\) 추정량 → 마지막 항 추가.

\((\hat{\beta}^{(c)} - \hat{\beta}^{(d)})^2\):

  • 두 그룹 추정량의 차이가 클수록 averaging 결과의 uncertainty ↑.
  • 두 그룹이 같으면 (no PM effect) → 마지막 항 0.
  • 두 그룹 차이 큼 (strong PM effect) → 큰 contribution.

\(N\) 분모:

  • Sample size ↑ → \(\hat{\pi}\) 의 정확성 ↑ → contribution ↓.
  • → asymptotically zero (large \(N\)).

Hogan-Laird (1997a) 의 일반화:

  • 임의 수의 패턴으로 일반화 (식 14.32).
  • Multinomial covariance (Agresti 2002) 활용.

5 Weighted Effect Coding (Darlington 1990)

5.1 식 (14.29) — Direct Estimation

DropW 변수의 정의

저자 본문 인용:

“The averaged results can also be obtained a bit more directly. For this, the dropout dummy code is replaced using a weighted effect coding approach (see Darlington [1990], pages 238-239). Specifically, define the variable \(DropW = -1 \times (\hat{\pi}^{(d)}/\hat{\pi}^{(c)})\) for completers and 1 for dropouts.”

DropW 정의:

  • Completer: \(DropW = -\hat{\pi}^{(d)}/\hat{\pi}^{(c)}\).
  • Dropout: \(DropW = 1\).

NIMH 예시:

  • Completer: \(-102/335 = -0.305\).
  • Dropout: \(+1\).

식 14.29 — Model with DropW:

\[IMPS79_{ij} = \beta_0 + \beta_1 Drug_i + \beta_2 SWeek_j + \beta_3 (Drug_i \times SWeek_j)\] \[+ \beta_0^{DW} DropW_i + \beta_1^{DW} (DropW_i \times Drug_i) + \beta_2^{DW} (DropW_i \times SWeek_j) + \beta_3^{DW} (DropW_i \times Drug_i \times SWeek_j)\] \[+ \upsilon_{0i} + \upsilon_{1i} SWeek_j + \varepsilon_{ij}\]

핵심 결과: \(\hat{\beta}_0, \hat{\beta}_1, \hat{\beta}_2, \hat{\beta}_3\) 가 averaged estimates.

직관 — 왜 Weighted Effect Coding 이 Averaging

Standard dummy (Drop = 0/1):

  • \(\beta_0\) = completer 평균.
  • \(\beta_0 + \beta_0^D\) = dropout 평균.
  • → averaging 별도 단계 필요.

Weighted effect coding (DropW):

  • \(\beta_0\) 가 직접 weighted average.
  • 자동으로 population estimate.

수학적 검증:

  • Weighted mean: \(\bar{y} = \pi^{(c)} y^{(c)} + \pi^{(d)} y^{(d)}\).
  • DropW = \(-\pi^{(d)}/\pi^{(c)}\) for \(C\), \(+1\) for \(D\).
  • \(\beta_0 \cdot 1 + \beta_0^{DW} \cdot DropW\) 가 group mean.
  • \(C\): \(\beta_0 - \beta_0^{DW} \pi^{(d)}/\pi^{(c)}\).
  • \(D\): \(\beta_0 + \beta_0^{DW}\).
  • Solve: \(\beta_0 = \pi^{(c)} y^{(c)} + \pi^{(d)} y^{(d)}\) (weighted mean).

5.2 식 (14.30) — Corrected SE

SE 보정

저자 본문 인용:

“The standard errors associated with these estimates will be too small because they are obtained assuming that the sample proportions for completers and dropouts are known, and not estimated. However, a simple modification of these standard errors, based on (14.28), yields the correct results.”

저자 본문 인용 (식 14.30):

\[\hat{V}(\hat{\bar{\beta}}_h) = V_F(\hat{\beta}_h) + \frac{\hat{\pi}^{(c)} \hat{\pi}^{(d)}}{N} (\hat{\beta}_h^{(c)} - \hat{\beta}_h^{(d)})^2\]

\(V_F\): weighted effect coding 모형에서 직접 얻은 SE 의 제곱. 보정 항: 식 14.28 의 마지막 항과 동일.

직관 — 두 단계 통합

Direct estimation 의 가치:

  • 표준 software (R lme4, SAS MIXED) 로 직접 얻음.
  • 별도 averaging 계산 안 함.

SE 보정의 필수성:

  • Direct estimation 가정: \(\pi\) 가 알려진 상수.
  • 실제: \(\hat{\pi}\) 가 추정량.
  • → SE underestimate.

보정 후 SE:

  • 식 14.28 와 정확히 같음.
  • 두 방법 (manual averaging vs direct + 보정) 동일 결과.

실무 권고:

  • Direct + 식 14.30 보정 가장 효율.
  • 단, 6 패턴 이상 → 식 14.32 일반화 필요.

6 6 Patterns 확장

6.1 식 (14.31) — General Weighted Effect Coding

6 패턴의 contrast

저자 본문 명시 (Table):

Pattern DW1 DW2 DW3 DW4 DW5
\(D = 1\) 1 0 0 0 0
\(D = 2\) 0 1 0 0 0
\(D = 3\) 0 0 1 0 0
\(D = 4\) 0 0 0 1 0
\(D = 5\) 0 0 0 0 1
\(D = 6\) \(-\hat{\pi}_1/\hat{\pi}_6\) \(-\hat{\pi}_2/\hat{\pi}_6\) \(-\hat{\pi}_3/\hat{\pi}_6\) \(-\hat{\pi}_4/\hat{\pi}_6\) \(-\hat{\pi}_5/\hat{\pi}_6\)

\(D = 6\) (completer) 가 reference.

식 14.31 — model with 5 DW:

\[IMPS79_{ij} = \beta_0 + \beta_1 Drug_i + \beta_2 SWeek_j + \beta_3 (Drug_i \times SWeek_j)\] \[+ \sum_{m=1}^5 \left[ \beta_0^m DW_m + \beta_1^m (DW_m \times Drug_i) + \beta_2^m (DW_m \times SWeek_j) + \beta_3^m (DW_m \times Drug_i \times SWeek_j) \right]\] \[+ \upsilon_{0i} + \upsilon_{1i} SWeek_j + \varepsilon_{ij}\]

6.2 식 (14.32) — General SE Correction

Multinomial Covariance + Delta Method

저자 본문 인용 (식 14.32):

\[\hat{V}(\hat{\bar{\beta}}) = V_F(\hat{\beta}) + \text{vecdiag}[\hat{B} V(\hat{\pi}) \hat{B}']\]

구성:

  • \(V_F\): model 에서 직접 얻은 SE 제곱.
  • \(\hat{B}\): \(P \times M\) deviation matrix.
  • \(V(\hat{\pi})\): \(M \times M\) multinomial covariance.

\(V(\hat{\pi})\) 의 형태 (Agresti 2002):

\[V(\hat{\pi}) = \frac{1}{N} \begin{pmatrix} \hat{\pi}_1(1-\hat{\pi}_1) & -\hat{\pi}_1\hat{\pi}_2 & \cdots \\ -\hat{\pi}_2\hat{\pi}_1 & \hat{\pi}_2(1-\hat{\pi}_2) & \cdots \\ \vdots & \vdots & \ddots \end{pmatrix}\]

\(\hat{B}\) (NIMH, \(P=4, M=5\)):

\[\hat{B} = \begin{pmatrix} .471 & .524 & .047 & .801 & .337 \\ -.456 & -.703 & -.198 & -.237 & -.842 \\ .240 & .338 & .377 & -.101 & -.157 \\ -.412 & -.735 & -.835 & -1.210 & .231 \end{pmatrix}\]

직관 — 일반화의 가치

왜 6 패턴 필요:

  • 모든 dropout 시점 별도 분석 가능.
  • 시점별 다른 trajectory 추정.
  • 더 fine-grained sensitivity.

Agresti 의 multinomial covariance:

  • \(\hat{\pi}\) 가 multinomial 의 MLE.
  • 표준 결과: \(V(\hat{\pi}) = (1/N)[\text{diag}(\pi) - \pi \pi']\).

vecdiag \([\hat{B} V(\hat{\pi}) \hat{B}']\) 의 의미:

  • \(\hat{B} V(\hat{\pi}) \hat{B}'\) = \(P \times P\) matrix.
  • Diagonal = 각 averaged effect 의 추가 variance.
  • → 4 effects (intercept, drug, sweek, drug × sweek) 의 SE 보정.

계산:

  • \(\hat{\pi} = (37, 10, 42, 5, 8, 335)/437\).
  • 반복적으로 vecdiag 계산.

대안:

  • Bootstrap (재표본 + averaging).
  • Bayesian (posterior of averaged estimate).

실무 권고:

  • 식 14.32 가 가장 효율적 (closed-form).
  • Bootstrap 은 더 robust 하지만 계산 비용.
  • Software 구현 (Hedeker 의 SAS macro 등).

7 Table 14.15 — 종합 결과

세 모형의 비교

저자 본문 명시 (Table 14.15):

Parameter MRM est Simple PM est Complete PM est
Intercept \(\beta_0\) 5.348 5.296 5.293
Drug \(\beta_1\) .046 (n.s.) .109 (n.s.) .110 (n.s.)
SWeek \(\beta_2\) -.336*** -.335*** -.333***
Drug × SWeek \(\beta_3\) -.641*** -.687*** -.680***

SE: 거의 동일 (.078 ~ .080).

핵심 결론:

  • 세 모형의 추정량 매우 유사.
  • Drug × SWeek effect significant in all (drug 빠른 호전 confirmed).
직관 — 최종 메시지

저자 본문 인용:

“the estimates are very similar across these three models. Again, it is the Sweek and Drug × Sweek terms that are significant, and the Drug term is not. Thus, the previously described conclusions, based on the ordinary MRM, are the same for the pattern-mixture models. These same conclusions were also observed in the selection modeling of these data.”

세 framework 의 동일 결론:

  • Ordinary MRM (MAR): drug × SWeek = -.641.
  • Selection model (§ 14.5.1.2): drug × SWeek = -.737 (shared).
  • Pattern-Mixture (averaged): drug × SWeek = -.687.

매우 강건한 finding (drug 효과 confirmed).

저자의 종합 메시지:

“we have a greater degree of confidence in these results, having allowed for several types of nonignorable models. In the process of doing this extended modeling, we have also demonstrated that dropout varied by treatment group: placebo patients who were not improving were more likely to dropout, whereas drug patients with rapid improvement were more likely to dropout. Thus, though the basic conclusions have not changed, we have a more complete understanding of the responses across time and the role of missing data.”

Sensitivity Analysis 의 가치 검증:

  • 다양한 framework (MRM, Selection, PM) 적합.
  • 결과 일관 → conclusion 강건.
    • 결측 메커니즘의 임상 이해 (placebo 안 호전 → dropout, drug 빠른 호전 → dropout).

실무 권고 절차:

  1. Default: MRM (MAR 가정).
  2. MCAR test (§ 14.4): 통과 시 GEE 도 가능.
  3. Selection model (§ 14.5.1): MNAR sensitivity.
  4. Pattern-Mixture (§ 14.5.2): 다른 angle 의 sensitivity.
  5. 결과 비교: 일관 → robust, 변동 → 신중.

다중 framework 의 sensitivity = 종단 데이터 분석의 best practice.

8 응용 분야

분야 Pattern 정의 비고
임상시험 (RCT) Completer vs Dropout Hedeker-Gibbons (1997) 표준
항암제 long-term Survival censoring time Death = informative
우울증 RCT Last available wave Drop time 별 trajectory
만성통증 Treatment 변경 시점 Treatment switch pattern
학교 종단 이사/자퇴 시점 Pattern by reason
Survey panel Wave 별 비응답 Item nonresponse pattern

9 코드 예시

9.1 Step 1: 패턴 그룹화 + Drop 변수 생성

library(dplyr)
library(tidyr)


# NIMH 시뮬레이션 데이터
set.seed(2026)
n_subjects <- 437
n_completers <- 335

# Drop 변수 (1 = dropout, 0 = completer)
drop <- c(rep(0, n_completers), rep(1, n_subjects - n_completers))

# Drug
drug <- sample(c(0, 1), n_subjects, replace = TRUE,
               prob = c(108/437, 329/437))

# Maxweek (5 dropout weeks)
maxweek <- ifelse(drop == 0, 6,
                  sample(1:5, n_subjects - n_completers, replace = TRUE))

# 단순 dummy: Drop=0/1
df_subjects <- data.frame(subject = 1:n_subjects, drug = drug,
                          drop = drop, maxweek = maxweek)

# Full pattern dummy: D1-D5
df_subjects <- df_subjects %>%
  mutate(D1 = ifelse(maxweek == 1, 1, 0),
         D2 = ifelse(maxweek == 2, 1, 0),
         D3 = ifelse(maxweek == 3, 1, 0),
         D4 = ifelse(maxweek == 4, 1, 0),
         D5 = ifelse(maxweek == 5, 1, 0))

table(df_subjects$maxweek, df_subjects$drug)
패턴 그룹화의 실무

Sparseness 점검:

  • 각 cell (\(D \times Drug\)) 의 빈도 확인.
  • 5 미만 → simpler coding 권고.

Reference cell 선택:

  • Completer (가장 큰 그룹).
  • → 다른 패턴이 deviation.

9.2 Step 2: Simple PM Model 적합 (식 14.22)

library(lme4)


# Long format 시뮬레이션
weeks <- c(0, 1, 3, 6)
df_long <- expand.grid(subject = 1:n_subjects, week = weeks) %>%
  arrange(subject, week)
df_long$sweek <- sqrt(df_long$week)
df_long$drug <- df_subjects$drug[df_long$subject]
df_long$drop <- df_subjects$drop[df_long$subject]
df_long$maxweek <- df_subjects$maxweek[df_long$subject]

# Generate IMPS79
df_long$imps79 <- 5.32 + 0.1 * df_long$drug - 0.39 * df_long$sweek -
                  0.54 * df_long$drug * df_long$sweek +
                  0.32 * df_long$drop -
                  0.40 * df_long$drop * df_long$drug +
                  0.25 * df_long$drop * df_long$sweek -
                  0.64 * df_long$drop * df_long$drug * df_long$sweek +
                  rnorm(nrow(df_long), 0, 0.8)

# 결측 적용 (monotone dropout)
df_long$observed <- ifelse(df_long$week <= df_long$maxweek - 1 |
                          df_long$drop == 0, 1, 0)
df_observed <- df_long %>% filter(observed == 1)

# Simple PM (식 14.22)
fit_simple_pm <- lmer(imps79 ~ drug + sweek + drug:sweek +
                              drop + drop:drug + drop:sweek + drop:drug:sweek +
                              (sweek | subject),
                      data = df_observed)

cat("Simple PM 결과 (식 14.22):\n")
print(summary(fit_simple_pm)$coefficients)
Simple PM 의 핵심 검토

\(\beta_3^D\) (Drop × Drug × SWeek):

  • 진짜 generating 모수: -0.64.
  • 추정량: 약 -0.6 ~ -0.7 (유사).
  • p < .002 → significant.

해석:

  • Dropout 그룹의 drug effect 가 completer 보다 강함.
  • → MAR 가정의 단일 효과 추정의 한계.

9.3 Step 3: Full PM Model 적합 (식 14.23)

# Full PM (식 14.23) - 5 dropout weeks
fit_full_pm <- lmer(imps79 ~ drug + sweek + drug:sweek +
                            D1 + D2 + D3 + D4 + D5 +
                            D1:drug + D2:drug + D3:drug + D4:drug + D5:drug +
                            D1:sweek + D2:sweek + D3:sweek + D4:sweek + D5:sweek +
                            D1:drug:sweek + D2:drug:sweek + D3:drug:sweek +
                            D4:drug:sweek + D5:drug:sweek +
                            (sweek | subject),
                    data = df_observed %>%
                      left_join(df_subjects %>% select(subject, D1:D5), by = "subject"))

cat("\nFull PM 결과 (식 14.23):\n")
print(summary(fit_full_pm)$coefficients[1:14, ])

# LR test
cat("\nLR Test (Full vs Simple):\n")
print(anova(fit_simple_pm, fit_full_pm))
LR Test 의 해석

Full vs Simple:

  • \(H_0\): simple PM (Drop=0/1) 충분.
  • p > .05 → simple OK (Hedeker 결과와 일치).

Full vs Ordinary MRM:

  • \(H_0\): MRM 충분.
  • p < .05 → PM better fit.
  • → MNAR 가능성 (그러나 Demirtas-Schafer caveat 명심).

9.4 Step 4: Averaging over Patterns (식 14.27, 14.28)

# Pattern-specific estimates
beta_completer <- c(5.221, 0.202, -0.393, -0.539)  # 식 14.24
beta_dropout <- beta_completer + c(0.320, -0.399, 0.252, -0.635)  # 식 14.25

# Averaged (식 14.26-14.27)
pi_c <- 335 / 437
pi_d <- 102 / 437
N <- 437

beta_avg <- pi_c * beta_completer + pi_d * beta_dropout
cat("\nAveraged estimates (식 14.27):\n")
cat(round(beta_avg, 3), "\n")
cat("Hedeker 결과: 5.296, 0.109, -0.335, -0.687\n")

# SE via 식 14.28
V_completer <- c(0.107, 0.120, 0.075, 0.085)^2  # SE^2
V_dropout <- c(0.288, 0.353, 0.334, 0.412)^2  # 추정

V_avg <- pi_c^2 * V_completer + pi_d^2 * V_dropout +
         pi_c * pi_d / N * (beta_completer - beta_dropout)^2

SE_avg <- sqrt(V_avg)
cat("\nAveraged SE (식 14.28):\n")
cat(round(SE_avg, 3), "\n")
cat("Hedeker SE: 0.090, 0.103, 0.067, 0.079\n")
Averaging 의 검증

Drug × SWeek averaged:

  • 진짜: -0.687 (Hedeker 결과).
  • 계산: \(0.767 \times (-0.539) + 0.233 \times (-1.174) = -0.687\).
  • → 정확히 일치.

SE 의 3 components:

  • Completer 의 contribution.
  • Dropout 의 contribution.
  • \((\hat{\beta}^c - \hat{\beta}^d)^2\) 의 contribution (큰 차이일수록 큰 boost).

10 관련 주제

선행 지식

후속 주제

  • § 14.6 — Chapter Summary

관련 개념

  • Marini, Olsen & Rubin (1980) — 초기 PM 발상
  • Glynn, Laird & Rubin (1986) — Selection vs PM 비교
  • Allison (1987) — SEM with PM
  • Muthén, Kaplan & Hollis (1987) — SEM with incomplete data
  • McArdle & Hamagami (1992) — Latent growth + missing
  • Little (1993) — Pattern-mixture for non-monotone (JASA)
  • Little (1994) — PM for monotone (Biometrika)
  • Little (1995) — Selection vs PM overview (JASA)
  • Hedeker & Gibbons (1997) — Application to schizophrenia (Psychological Methods)
  • Hogan & Laird (1997a) — Mixture model formulation
  • Hogan & Laird (1997b) — Selection vs PM review
  • Molenberghs, Michiels, Kenward & Diggle (1998) — PM sensitivity
  • Daniels & Hogan (2000) — Bayesian PM
  • Fitzmaurice, Laird & Shneyer (2001) — Identifiability
  • Thijs, Molenberghs, Michiels, Verbeke & Curran (2002) — ACMV/NCMV identifying restrictions
  • Demirtas & Schafer (2003) — PM caveat (relationships ≠ rejection)
  • Roy (2003) — PM for longitudinal categorical
  • Guo, Ratcliffe & Ten Have (2004) — Clinical trial application
  • Lin, McCulloch & Rosenheck (2004) — PM for survival
  • Demirtas (2005a, 2005b) — Multiple imputation + PM
  • Darlington (1990) — Regression coding schemes textbook
  • Agresti (2002) — Categorical data analysis (multinomial covariance)

Subscribe

Enjoy this blog? Get notified of new posts by email: