구조적 중첩 평균 모형(SNMM)과 rank preservation

Hernan Ch.14.3~14.4 — Semiparametric SNMM + 비현실적 가정의 교육적 사용

Hernan & Robins (2020) Ch.14.3~14.4 를 다룬다. 구조적 중첩 평균 모형(SNMM)의 semiparametric 정의, IPW·표준화 모형과의 비교, censoring 보정의 통합, 가법 조건부 rank preservation 의 정의와 비현실성, 그리고 g-estimation 이 rank preservation 없이도 작동하는 이유를 정리한다.

Experimentation
Causal Inference
저자

Kwangmin Kim

공개

2026년 05월 08일

1 정의

정의: Structural Nested Mean Model (SNMM)

\(L\) 의 각 값에서의 평균 인과 효과를 함수 형태로 모형화한 등식:

\[\mathrm{E}[Y^a - Y^{a=0} | A=a, L] = \beta_1 a + \beta_2 a L\]

  • 절편 없음 (잠재 결과 자체가 아닌 차이).
  • \(L\) 의 main effect 항 없음 (조건부에 흡수).
  • 효과 수정은 product term \(\beta_2 a L\) 로 표현.
  • “Nested” 는 시간변동 처치로 일반화 시 nested 구조에서 유래 (Robins 1994).
정의: 가법 조건부 Rank Preservation

\(L\) 의 같은 값에서 모든 개인의 인과 효과가 정확히 같으면 가법 조건부 rank preservation 성립:

\[Y_i^a - Y_i^{a=0} = \psi_1 a + \psi_2 a L_i \quad \forall i\]

이 가정 아래 잠재 결과 \(Y^{a=1}\)\(Y^{a=0}\) 의 순위가 같다 — 모든 사람이 같은 효과로 이동.

직관 — Nested 의 단일 시점 의미: 단일 시점 처치에서는 “nested” 가 무의미해 보이지만, 시간변동에서 매 시점의 SNMM 이 이전 시점의 SNMM 안에 nested 됨 — Part III 의 g-estimation 에서 명확해진다. Part II 는 \(T=1\) 의 단순화된 데모.

2 14.3 SNMM 의 정의

2.1 IPW·표준화와의 모형 비교

모형 형태 모수
MSM (Ch.12) \(\mathrm{E}[Y^a] = \beta_0 + \beta_1 a\) 절편 + 효과
결과 모형 (Ch.13) \(\mathrm{E}[Y|A,L] = \beta_0 + \beta_1 A + \beta_L L + \cdots\) 절편 + 효과 + 보정
SNMM \(\mathrm{E}[Y^a - Y^{a=0}|A=a,L] = \beta_1 a + \beta_2 a L\) 효과만 (절편·보정 없음)

직관 — Semiparametric 의 강점: SNMM 은 효과의 함수 형태만 specify, \(\mathrm{E}[Y^{a=0}|L]\) 의 함수 형태는 비제약. 결과 모형은 두 양 모두를 specify 해야 한다. 부분만 모수화 하므로 misspecification 위험이 분리된다.

직관 — \(\mathrm{E}[Y^{a=0}|L]\) 가 매우 비선형이라면: 결과 모형은 그 비선형성을 정확히 표현 못 하면 효과 추정도 편향. SNMM 은 nuisance 부분 (\(\mathrm{E}[Y^{a=0}|L]\)) 의 misspecification 에 일부 robust — 효과 모수에 직접 영향 안 줌. Hernan, Fine Point 14.1 의 핵심 메시지.

2.2 효과 수정의 표현

이항 처치 + 효과 수정 변수 \(V\) 의 SNMM:

\[\mathrm{E}[Y^a - Y^{a=0} | A=a, L] = \beta_1 a + \beta_2 a V\]

모수 의미
\(\beta_1\) \(V=0\) 에서의 평균 효과
\(\beta_2\) \(V\) 한 단위 증가 시 효과 변화량
\(\beta_1 + \beta_2 v\) \(V=v\) 에서의 평균 효과

직관 — Product term 의 직접 해석: SNMM 의 \(\beta_1, \beta_2\) 는 효과 수정의 직접적 모수. MSM 의 product term 도 같은 정보를 주지만 SNMM 은 보정 변수의 main effect 가 없어 모수가 더 깔끔. 인과적 의미가 모수와 1:1 대응.

2.3 Censoring 의 통합

Censoring 이 있으면 \(Y^{a, c=0}\) 의 SNMM:

\[\mathrm{E}[Y^{a, c=0} - Y^{a=0, c=0} | A=a, L] = \beta_1 a + \beta_2 a L\]

G-estimation 에 censoring 보정을 통합하려면 IP 가중치 \(W^C = 1/\Pr(C=0|L,A)\) 를 격자 검색 loop 의 logistic 회귀에 가중치로 적용. 단계:

  1. Logistic 모형으로 \(\Pr(C=0|L,A)\) 추정 → \(\widehat{W^C}\).
  2. 각 후보 \(\psi^\dagger\) 에 대해 \(H(\psi^\dagger)\) 계산.
  3. 가중 logistic 회귀 (uncensored 만 사용, 가중치 \(\widehat{W^C}\)).
  4. \(\widehat{\alpha}_1 = 0\)\(\psi^\dagger\)\(\widehat{\psi}_1\).

직관 — Censoring 통합의 자연스러움: G-estimation 의 logistic 회귀는 가중 회귀로 자연스럽게 확장된다. IPW·표준화에서 별도로 다뤄야 했던 censoring 이 같은 logistic loop 에 통합 — 절차의 단순함이 유지된다.

3 14.4 Rank Preservation

3.1 정의의 의미

가법 조건부 rank preservation 의 그림:

  • \(L=l\) 인 부분군의 \(Y^{a=0}\) 분포가 종 모양 곡선.
  • 같은 부분군의 \(Y^{a=1}\) 분포가 \(\psi_1 + \psi_2 l\) 만큼 옆으로 이동된 같은 곡선.
  • 모든 개인이 같은 거리만큼 이동 → 순위 보존.

직관 — “모두 같은 효과” 의 의미: 같은 9 변수를 가진 두 환자가 금연했을 때 정확히 같은 체중 변화 — 비현실적. 일부는 대사가 빠르고 일부는 느려 같은 baseline 에서도 효과가 다르다.

직관 — Rank preservation 의 시각적 결과: 좌·우 분포가 평행이동. 모든 점이 같은 거리만큼 이동. 순위 보존은 이 그림의 직접적 결과 — 가장 큰 \(Y^{a=0}\) 인 사람이 가장 큰 \(Y^{a=1}\) 도 가짐.

3.2 Sharp Null Hypothesis 의 특수 경우

처치가 모든 개인에게 효과가 0 이면 (\(Y_i^{a=1} = Y_i^{a=0}\) for all \(i\)), rank preservation 의 특수 경우 (\(\psi = 0\)). Fisher 의 sharp null hypothesis (Ch.1).

직관 — Sharp null 과 rank preservation 의 연결: 효과가 0 이면 모든 사람이 같은 효과 (0) 를 가지므로 rank preservation 만족. 비영 효과면 rank preservation 은 “모든 사람이 정확히 같은 비영 효과” 라는 매우 강한 가정.

3.3 비현실성과 g-estimation 의 robustness

Rank preservation 은 비현실적이지만 g-estimation 은 작동

대부분의 처치-결과 관계에서 개인 수준 효과는 변동성을 가진다. Rank preservation 은 거의 항상 실패하는 가정이다. 그러나 g-estimation 은 rank preservation 이 깨져도 평균 효과의 일치 추정량.

이유: g-estimation 의 logistic 회귀는 \(\mathrm{E}[H(\beta_1) | L]\) 의 평균만 사용 — \(H(\beta_1) = Y^{a=0}\) 의 정확한 동등성이 아니라 평균이 일치하면 충분.

직관 — 평균만 맞으면 된다: Rank preservation 은 “모든 개인” 이 같은 효과 — 너무 강함. SNMM 은 “평균 효과” 만 모형화 — 약한 가정. G-estimation 의 추정 절차는 평균 일치만 확인하므로 강한 rank preservation 가정 없이 작동. 교육적 단순화 vs 실용적 일반성.

직관 — Rank preservation 을 도입한 교육적 이유: 절차를 직관적으로 보여주기 위해서. 만약 rank preservation 이 성립한다면 \(H(\psi^\dagger) = Y - \psi^\dagger A\) 가 모든 개인의 \(Y^{a=0}\) 와 일치 → \(H \perp\!\!\!\perp A | L\) 을 모든 개인 수준에서 검정 가능. 비현실적이지만 절차의 본질을 명확히 보여준다.

4 가정의 위계 — 다시

SNMM g-estimation 이 의존하는 가정
가정 정확성 영향
식별 가정 (교환·양·일관) 깨지면 추정량 자체가 의미 없음 절대적
SNMM 의 함수 형태 깨지면 효과 추정 편향 강함
처치 모형 specification 깨지면 효과 추정 편향 강함
Rank preservation 깨져도 작동 없음

g-estimation 이 다른 도구보다 가정에 robust 한 이유: rank preservation 가정 없이 평균 효과 추정.

직관 — Robustness 의 비교: 결과 모형 (Ch.13) 은 \(\mathrm{E}[Y|A,L]\) 의 함수 형태를 specify — main effect + interaction + nuisance 모두. SNMM 은 효과의 함수 형태만 specify, nuisance 는 비제약. 따라서 nuisance specification error 에 대해 SNMM 이 더 robust.

5 비교 — Multiplicative SNMM (Technical Point 14.1)

이항 결과 또는 양의 연속 결과에는 multiplicative SNMM 이 자연스럽다:

\[\log\frac{\mathrm{E}[Y^a | A=a, L]}{\mathrm{E}[Y^{a=0} | A=a, L]} = \beta_1 a + \beta_2 a L\]

\(\exp(\beta_1)\) 이 risk ratio 형식의 효과. G-estimation 절차는 비슷하지만 \(H(\psi^\dagger) = Y \exp(-\psi_1^\dagger A - \psi_2^\dagger A L)\) 로 변경.

직관 — Additive vs multiplicative 의 선택: 결과가 음수도 가능 (체중 변화) → additive. 결과가 양수 또는 위험 (질병 발생률) → multiplicative. 도메인 의사결정의 결과.

6 응용 분야

  • 임상 코호트의 robust 효과 추정: nuisance specification 의 영향 감소
  • 개인화 의료의 HTE: SNMM 의 product term 으로 효과 수정 직접 표현
  • 약물 효과 분석: continuous 또는 binary outcome 의 multiplicative SNMM
  • 시간변동 처치: Part III 의 nested SNMM 표준 도구
  • 민감도 분석: nuisance 모형 변경에 대한 결과 robustness 점검

7 코드 — Censoring 통합 g-estimation

import pandas as pd
import numpy as np
import statsmodels.formula.api as smf

# 결측 포함 1629 명 표본
nhefs = pd.read_csv("nhefs.csv").reset_index(drop=True)
nhefs["uncensored"] = (~nhefs["wt82_71"].isna()).astype(int)

# Step 1: Censoring 가중치
c_formula = (
    "uncensored ~ qsmk + sex + race + C(education) + age + I(age**2) "
    "+ smokeintensity + I(smokeintensity**2) + smokeyrs + I(smokeyrs**2) "
    "+ C(exercise) + C(active) + wt71 + I(wt71**2)"
)
c_model = smf.logit(c_formula, data=nhefs).fit(disp=False)
nhefs["pc"] = c_model.predict()
nhefs["wc"] = 1 / nhefs["pc"]

# Step 2: 격자 검색 with weighted logistic
sub = nhefs[nhefs["uncensored"] == 1].copy()
psis = np.arange(2.0, 5.0 + 0.001, 0.01)
alphas = []

for psi in psis:
    sub["H"] = sub["wt82_71"] - psi * sub["qsmk"]
    a_formula = (
        "qsmk ~ H + sex + race + C(education) + age + I(age**2) "
        "+ smokeintensity + I(smokeintensity**2) + smokeyrs + I(smokeyrs**2) "
        "+ C(exercise) + C(active) + wt71 + I(wt71**2)"
    )
    # 가중 logistic
    m = smf.glm(a_formula, data=sub, family=sm_families.Binomial(),
                freq_weights=sub["wc"]).fit()
    alphas.append(m.params["H"])

best_idx = np.argmin(np.abs(alphas))
print(f"G-estimate (with censoring): psi = {psis[best_idx]:.3f}")

(코드는 schematic — sm_families import 등 일부 details 생략)

8 한 줄 요약

SNMM 은 효과의 함수 형태만 specify 하는 semiparametric 모형으로, 결과 모형보다 nuisance misspecification 에 robust. Censoring 보정은 IPW 가중을 g-estimation 의 logistic 회귀에 적용해 자연 통합. Rank preservation 은 비현실적 가정이지만 g-estimation 은 그 가정 없이도 평균 효과의 일치 추정 — 절차의 robustness 가 가정의 약점을 보완.

9 관련 주제

선행 지식

후속 주제

다른 카테고리 연결

Subscribe

Enjoy this blog? Get notified of new posts by email: