Kwangmin Kim - G-estimation과 구조적 중첩 모형

1 개요

Ch.12 의 IP 가중과 Ch.13 의 표준화 모두 g-method 의 일종이다. Ch.14 의 g-estimation 이 세 번째 g-method 로, 셋 모두 시간변동 처치(Part III) 로 일반화 가능한 동일한 가족에 속한다.

세 도구의 공통점과 차이점:

도구	모형 대상	NHEFS 점추정
IP 가중 (Ch.12)	처치 모형 \(\Pr(A\|L)\)	3.4 kg
표준화 (Ch.13)	결과 모형 \(\mathrm{E}[Y\|A,L]\)	3.5 kg
G-estimation (Ch.14)	처치 모형 + 구조 모형	3.4 kg

직관 — 왜 또 다른 도구가 필요한가: 단일 시점 처치에서 세 도구는 거의 같은 답을 준다. g-estimation 의 진가는 (a) semiparametric 모형 으로 misspecification 위험 감소, (b) 시간변동 처치 로의 자연스러운 확장, (c) 미관측 교란에 대한 sensitivity analysis 가 더 직관적, (d) structural nested 모형 의 모수가 인과 효과로 직접 해석 — 의 4 가지에 있다.

정의: G-estimation

구조적 중첩 평균 모형 (Structural Nested Mean Model, SNMM)

\[\mathrm{E}[Y^a - Y^{a=0} | A=a, L] = \beta_1 a + \beta_2 a L\]

의 모수 \(\beta\) 를 추정하는 절차. 핵심 trick: 조건부 교환가능성 \(Y^{a=0} \perp\!\!\!\perp A | L\) 아래 \(Y^{a=0}\) 의 조건부 평균이 \(A\) 와 독립 이라는 사실을 이용해 \(\beta\) 를 추정 (Robins 1994).

직관 — G-estimation 의 묘미: 표준화는 결과 모형 + 표본 분포로 평균. IPW 는 처치 모형으로 가중. G-estimation 은 잠재 결과의 표현이 옳다면 그 잠재 결과가 처치와 독립이라는 점을 직접 활용. 추정량 자체에 식별 가정이 자연스럽게 내장된다.

2 6 개 소챕터의 흐름

소챕터	핵심 질문	답
14.1	무엇을 추정하는가?	\(\mathrm{E}[Y^{a=1} - Y^{a=0} \| L]\) — 조건부 평균 효과
14.2	교환가능성을 어떻게 표현하나?	\(\Pr(A=1\|Y^{a=0}, L) = \Pr(A=1\|L)\) — logistic 모형의 \(\alpha_1 = 0\)
14.3	SNMM 의 형태는?	\(\mathrm{E}[Y^a - Y^{a=0}\|A=a,L] = \beta_1 a + \beta_2 a L\)
14.4	Rank preservation 이란?	개인 수준 효과가 동일이면 순위 보존 — 비현실적
14.5	G-estimation 절차는?	후보 \(\psi^\dagger\) 를 격자 검색해 \(\alpha_1 = 0\) 인 값 선택
14.6	다중 모수면?	닫힌형 추정량 또는 다차원 검색

3 NHEFS 사례 — 결과의 일관성

NHEFS g-estimation 결과 (Hernan, Program 14.2-14.3)

Single 모수 SNMM (\(\beta_1 a\)): - \(\widehat{\psi}_1 = 3.446\) kg, 95% CI \((2.5, 4.5)\).

다중 모수 SNMM (\(\beta_1 a + \beta_2 a \cdot \text{smokeintensity}\)): - \(\widehat{\beta}_1 = 2.86, \widehat{\beta}_2 = 0.03\). - 평균 baseline 흡연량 ≈ 21 → ATE ≈ \(2.86 + 21 \times 0.03 = 3.49\) kg.

직관 — 세 도구의 일치: IPW 3.4kg, 표준화 3.5kg, g-estimation 3.4kg. 세 도구가 다른 모형 가정에 의존함에도 거의 같은 답 → 결과의 robustness 강한 증거. 이것이 Hernan 이 세 도구를 모두 사용하라고 권장하는 이유.

4 핵심 개념 5 가지

4.1 1. 인과 질문의 재정의 — 조건부 효과 (14.1)

지금까지의 ATE 는 모집단 전체의 평균 효과 \(\mathrm{E}[Y^{a=1} - Y^{a=0}]\). G-estimation 은 조건부 효과 \(\mathrm{E}[Y^{a=1} - Y^{a=0} | L]\) 를 추정한다 — \(L\) 의 각 값에서의 효과.

직관 — 조건부 vs marginal 의 차이: ATE 는 “이 모집단 전체에 처치를 적용했을 때 평균 효과”, 조건부 효과는 “각 부분군에서의 효과”. 효과 수정이 없으면 둘이 같지만, 효과가 \(L\) 에 따라 달라지면 조건부 효과는 함수, ATE 는 그 함수의 평균.

4.2 2. 교환가능성의 새 표현 (14.2)

전통적 정의: \(Y^a \perp\!\!\!\perp A | L\).

G-estimation 의 표현: \(\Pr(A=1|Y^{a=0}, L) = \Pr(A=1|L)\) — “\(Y^{a=0}\) 가 \(L\) 을 알면 처치 확률 예측에 추가 정보를 주지 않는다”.

교환가능성의 logistic 형태

\[\mathrm{logit}\, \Pr(A=1|Y^{a=0}, L) = \alpha_0 + \alpha_1 Y^{a=0} + \alpha_2 L\]

조건부 교환가능성 아래 \(\alpha_1 = 0\).

이 사실이 g-estimation 의 핵심 추론 기반이 된다 — 만약 \(Y^{a=0}\) 의 후보 추정값에 대해 적합된 이 logistic 모형의 \(\widehat{\alpha}_1 = 0\) 이라면 그 후보가 진짜 \(Y^{a=0}\).

직관 — 두 표현의 등가성: \(A\) 와 \(Y^{a=0}\) 가 \(L\) 에 조건부 독립이면, 그 둘을 연결하는 어떤 모형(logistic 포함)에서도 한쪽이 다른 쪽의 정보를 더하지 못한다. 독립성을 회귀 계수 0 으로 검정할 수 있는 형식적 표현.

4.3 3. Structural Nested Mean Model (14.3)

SNMM 의 정의

\[\mathrm{E}[Y^a - Y^{a=0} | A=a, L] = \beta_1 a + \beta_2 a L\]

“\(A=a\) 받은 사람들의 잠재 결과 차이의 평균” 을 모형화.
절편 없음 (잠재 결과 자체가 아닌 차이).
\(L\) 의 main effect 항 없음 (조건부에 흡수).
효과 수정 표현은 product term \(a L\) 로.

직관 — Semiparametric 의 의미: SNMM 은 효과의 함수 형태만 specify, \(\mathrm{E}[Y^{a=0}|L]\) 의 함수 형태는 비제약. 표준화의 결과 모형이 두 양 모두를 specify 하는 것과 다르다 — 부분만 모수화 하므로 misspecification 위험이 분리.

직관 — Saturated SNMM 의 한계: 단일 모수 \(\beta_1 a\) 는 효과 수정 없음 가정. 만약 진짜 효과가 \(L\) 에 따라 다르면 잘못된 모수를 추정. 다중 모수 추가로 robust 가능.

4.4 4. Rank Preservation (14.4)

정의: 가법 조건부 Rank Preservation

\(L\) 의 같은 값에서 모든 개인의 인과 효과가 정확히 같으면 가법 조건부 rank preservation 성립:

\[Y_i^a - Y_i^{a=0} = \psi_1 a + \psi_2 a L_i \quad \forall i\]

비현실적이지만 g-estimation 의 도입에 유용 — 절차를 직관적으로 보여준다.

직관 — Rank preservation 의 비현실성: 같은 9 변수를 가진 두 환자가 금연했을 때 정확히 같은 체중 변화가 나올 가능성은 0. 일부는 5kg, 일부는 0.5kg 만 늘어날 것 — 개인 수준 효과의 변동성이 항상 존재.

직관 — 그러나 g-estimation 은 작동: rank preservation 이 깨져도 g-estimation 절차가 정확. 모형의 평균 효과만 옳으면 추정량이 일치 — 절차의 robustness 가 가정의 약점을 보완.

4.5 5. G-estimation 절차 (14.5)

G-estimation 의 단계

후보 모수 값 \(\psi^\dagger\) 격자 (예: 2.0, 2.1, …, 5.0).
각 \(\psi^\dagger\) 에 대해 \(H(\psi^\dagger) := Y - \psi^\dagger A\) 계산.
Logistic 회귀 적합: \(\mathrm{logit}\, \Pr(A=1|H(\psi^\dagger), L) = \alpha_0 + \alpha_1 H(\psi^\dagger) + \alpha_2 L\).
\(\widehat{\alpha}_1\) 이 0 에 가장 가까운 \(\psi^\dagger\) 가 \(\widehat{\psi}_1\).
95% CI 는 \(\widehat{\alpha}_1 = 0\) 검정의 P-value > 0.05 를 주는 \(\psi^\dagger\) 들의 범위.

직관 — \(H(\psi^\dagger)\) 가 가상의 \(Y^{a=0}\): 만약 \(\psi^\dagger\) 가 진짜 효과라면 \(H(\psi^\dagger) = Y - \psi^\dagger A\) 는 “처치 효과를 빼낸 잠재 결과 \(Y^{a=0}\)” 이다. 이 양이 \(A\) 와 독립이면 (\(\alpha_1 = 0\)) 진짜 \(Y^{a=0}\) 의 성질을 만족 → 그 \(\psi^\dagger\) 가 진짜 효과.

직관 — 검색이 1 차원 → 다차원: 단일 모수는 1 차원 격자, 다중 모수는 다차원 격자. 모수가 늘면 격자 크기가 폭발하므로 closed-form (선형 SNMM) 또는 Newton-Raphson (비선형) 으로 검색 회피.

5 가정의 위계

G-estimation 이 의존하는 가정

조건부 교환가능성: \(Y^a \perp\!\!\!\perp A | L\) — IPW·표준화와 동일.
양의 확률: \(\Pr(A=a|L) > 0\) — IPW 와 같은 위반 위험.
일관성: \(A=a\) 일 때 \(Y = Y^a\) — 동일.
SNMM specification: 효과의 함수 형태가 옳다.
처치 모형 specification: \(\mathrm{E}[A|L]\) logistic 모형이 옳다 (부분 의존).

이중 강건 추정량은 처치 모형과 결과 모형 (또는 SNMM 의 nuisance 부분) 둘 중 한쪽만 옳아도 된다.

직관 — Sensitivity Analysis 의 자연스러움: G-estimation 은 “\(\alpha_1 = 0\) 가정” 에 의존. 만약 미관측 교란이 있으면 \(\alpha_1 \neq 0\). 가설 값을 0 대신 0.1, 0.2 로 두면 미관측 교란 강도별 추정값을 계산 가능 — sensitivity analysis 가 절차에 자연스럽게 통합.

6 왜 필요한가

상황	IPW	표준화	G-estimation
단일 시점, 단순 보정	잘 작동	잘 작동	잘 작동
결과 모형 specification 어려움	영향 없음	위험	부분 (SNMM 만)
처치 모형 specification 어려움	위험	영향 없음	위험
Sensitivity analysis	가능	가능	자연스러움
시간변동 처치 (Part III)	가능	위험	표준 도구

직관 — 시간변동에서 g-estimation 이 빛나는 이유: 시간변동 처치-교란 피드백에서는 표준화가 무너진다 (g-formula 도 multiple integral 의 분산 폭발). G-estimation 은 같은 SNMM 절차로 시간변동 처치를 다루므로 Part III 의 핵심 도구. Part II 의 g-estimation 은 그 도구의 단순한 1 차원 데모.

7 응용 분야

임상 코호트의 robust 추정: 결과 모형 misspecification 위험 분리
시간변동 처치: HIV, 종양학 코호트의 표준 분석
미관측 교란 sensitivity: 환경역학·약물역학
개인화 의학: 조건부 효과의 명시적 추정 (SNMM 의 product term)
Mendelian randomization: 도구변수 + g-estimation 결합

8 후속 글로 이어지는 다리

글	다루는 내용
13-1	14.1 + 14.2 — 조건부 효과 + 교환가능성의 logistic 표현
13-2	14.3 + 14.4 — SNMM 정의 + rank preservation
13-3	14.5 + 14.6 — g-estimation 절차 + 다중 모수

9 코드 미리보기

import pandas as pd
import numpy as np
import statsmodels.formula.api as smf

nhefs = pd.read_csv("nhefs.csv").dropna(subset=["wt82_71"]).reset_index(drop=True)

# 격자 검색으로 g-estimate 찾기
grid = np.arange(2.0, 5.0 + 0.01, 0.01)
alpha_1_values = []

for psi in grid:
    nhefs["H"] = nhefs["wt82_71"] - psi * nhefs["qsmk"]
    formula = (
        "qsmk ~ H + sex + race + C(education) + age + I(age**2) "
        "+ smokeintensity + I(smokeintensity**2) + smokeyrs + I(smokeyrs**2) "
        "+ C(exercise) + C(active) + wt71 + I(wt71**2)"
    )
    m = smf.logit(formula, data=nhefs).fit(disp=False)
    alpha_1_values.append(m.params["H"])

# alpha_1 = 0 에 가장 가까운 psi
psi_hat = grid[np.argmin(np.abs(alpha_1_values))]
print(f"G-estimate: {psi_hat:.3f} kg")    # ~3.45

10 한 줄 요약

G-estimation 은 IPW·표준화에 이은 세 번째 g-method 로, semiparametric SNMM 의 모수를 “\(\alpha_1 = 0\) 을 만족하는 후보 검색” 으로 추정한다. NHEFS 사례에서 3.45kg — 다른 두 도구의 3.4~3.5kg 와 일치하는 robust 결과. 시간변동 처치로의 일반화와 sensitivity analysis 의 자연스러운 통합이 g-estimation 의 진가.

11 관련 주제

선행 지식

후속 주제

다른 카테고리 연결

추정 방정식 — semiparametric 추정의 기초
Sensitivity analysis