1 개요
Ch.12 의 IP 가중과 Ch.13 의 표준화 모두 g-method 의 일종이다. Ch.14 의 g-estimation 이 세 번째 g-method 로, 셋 모두 시간변동 처치(Part III) 로 일반화 가능한 동일한 가족에 속한다.
세 도구의 공통점과 차이점:
| 도구 | 모형 대상 | NHEFS 점추정 |
|---|---|---|
| IP 가중 (Ch.12) | 처치 모형 \(\Pr(A|L)\) | 3.4 kg |
| 표준화 (Ch.13) | 결과 모형 \(\mathrm{E}[Y|A,L]\) | 3.5 kg |
| G-estimation (Ch.14) | 처치 모형 + 구조 모형 | 3.4 kg |
직관 — 왜 또 다른 도구가 필요한가: 단일 시점 처치에서 세 도구는 거의 같은 답을 준다. g-estimation 의 진가는 (a) semiparametric 모형 으로 misspecification 위험 감소, (b) 시간변동 처치 로의 자연스러운 확장, (c) 미관측 교란에 대한 sensitivity analysis 가 더 직관적, (d) structural nested 모형 의 모수가 인과 효과로 직접 해석 — 의 4 가지에 있다.
구조적 중첩 평균 모형 (Structural Nested Mean Model, SNMM)
\[\mathrm{E}[Y^a - Y^{a=0} | A=a, L] = \beta_1 a + \beta_2 a L\]
의 모수 \(\beta\) 를 추정하는 절차. 핵심 trick: 조건부 교환가능성 \(Y^{a=0} \perp\!\!\!\perp A | L\) 아래 \(Y^{a=0}\) 의 조건부 평균이 \(A\) 와 독립 이라는 사실을 이용해 \(\beta\) 를 추정 (Robins 1994).
직관 — G-estimation 의 묘미: 표준화는 결과 모형 + 표본 분포로 평균. IPW 는 처치 모형으로 가중. G-estimation 은 잠재 결과의 표현이 옳다면 그 잠재 결과가 처치와 독립이라는 점을 직접 활용. 추정량 자체에 식별 가정이 자연스럽게 내장된다.
2 6 개 소챕터의 흐름
| 소챕터 | 핵심 질문 | 답 |
|---|---|---|
| 14.1 | 무엇을 추정하는가? | \(\mathrm{E}[Y^{a=1} - Y^{a=0} | L]\) — 조건부 평균 효과 |
| 14.2 | 교환가능성을 어떻게 표현하나? | \(\Pr(A=1|Y^{a=0}, L) = \Pr(A=1|L)\) — logistic 모형의 \(\alpha_1 = 0\) |
| 14.3 | SNMM 의 형태는? | \(\mathrm{E}[Y^a - Y^{a=0}|A=a,L] = \beta_1 a + \beta_2 a L\) |
| 14.4 | Rank preservation 이란? | 개인 수준 효과가 동일이면 순위 보존 — 비현실적 |
| 14.5 | G-estimation 절차는? | 후보 \(\psi^\dagger\) 를 격자 검색해 \(\alpha_1 = 0\) 인 값 선택 |
| 14.6 | 다중 모수면? | 닫힌형 추정량 또는 다차원 검색 |
3 NHEFS 사례 — 결과의 일관성
Single 모수 SNMM (\(\beta_1 a\)): - \(\widehat{\psi}_1 = 3.446\) kg, 95% CI \((2.5, 4.5)\).
다중 모수 SNMM (\(\beta_1 a + \beta_2 a \cdot \text{smokeintensity}\)): - \(\widehat{\beta}_1 = 2.86, \widehat{\beta}_2 = 0.03\). - 평균 baseline 흡연량 ≈ 21 → ATE ≈ \(2.86 + 21 \times 0.03 = 3.49\) kg.
직관 — 세 도구의 일치: IPW 3.4kg, 표준화 3.5kg, g-estimation 3.4kg. 세 도구가 다른 모형 가정에 의존함에도 거의 같은 답 → 결과의 robustness 강한 증거. 이것이 Hernan 이 세 도구를 모두 사용하라고 권장하는 이유.
4 핵심 개념 5 가지
4.1 1. 인과 질문의 재정의 — 조건부 효과 (14.1)
지금까지의 ATE 는 모집단 전체의 평균 효과 \(\mathrm{E}[Y^{a=1} - Y^{a=0}]\). G-estimation 은 조건부 효과 \(\mathrm{E}[Y^{a=1} - Y^{a=0} | L]\) 를 추정한다 — \(L\) 의 각 값에서의 효과.
직관 — 조건부 vs marginal 의 차이: ATE 는 “이 모집단 전체에 처치를 적용했을 때 평균 효과”, 조건부 효과는 “각 부분군에서의 효과”. 효과 수정이 없으면 둘이 같지만, 효과가 \(L\) 에 따라 달라지면 조건부 효과는 함수, ATE 는 그 함수의 평균.
4.2 2. 교환가능성의 새 표현 (14.2)
전통적 정의: \(Y^a \perp\!\!\!\perp A | L\).
G-estimation 의 표현: \(\Pr(A=1|Y^{a=0}, L) = \Pr(A=1|L)\) — “\(Y^{a=0}\) 가 \(L\) 을 알면 처치 확률 예측에 추가 정보를 주지 않는다”.
\[\mathrm{logit}\, \Pr(A=1|Y^{a=0}, L) = \alpha_0 + \alpha_1 Y^{a=0} + \alpha_2 L\]
조건부 교환가능성 아래 \(\alpha_1 = 0\).
이 사실이 g-estimation 의 핵심 추론 기반이 된다 — 만약 \(Y^{a=0}\) 의 후보 추정값에 대해 적합된 이 logistic 모형의 \(\widehat{\alpha}_1 = 0\) 이라면 그 후보가 진짜 \(Y^{a=0}\).
직관 — 두 표현의 등가성: \(A\) 와 \(Y^{a=0}\) 가 \(L\) 에 조건부 독립이면, 그 둘을 연결하는 어떤 모형(logistic 포함)에서도 한쪽이 다른 쪽의 정보를 더하지 못한다. 독립성을 회귀 계수 0 으로 검정할 수 있는 형식적 표현.
4.3 3. Structural Nested Mean Model (14.3)
\[\mathrm{E}[Y^a - Y^{a=0} | A=a, L] = \beta_1 a + \beta_2 a L\]
- “\(A=a\) 받은 사람들의 잠재 결과 차이의 평균” 을 모형화.
- 절편 없음 (잠재 결과 자체가 아닌 차이).
- \(L\) 의 main effect 항 없음 (조건부에 흡수).
- 효과 수정 표현은 product term \(a L\) 로.
직관 — Semiparametric 의 의미: SNMM 은 효과의 함수 형태만 specify, \(\mathrm{E}[Y^{a=0}|L]\) 의 함수 형태는 비제약. 표준화의 결과 모형이 두 양 모두를 specify 하는 것과 다르다 — 부분만 모수화 하므로 misspecification 위험이 분리.
직관 — Saturated SNMM 의 한계: 단일 모수 \(\beta_1 a\) 는 효과 수정 없음 가정. 만약 진짜 효과가 \(L\) 에 따라 다르면 잘못된 모수를 추정. 다중 모수 추가로 robust 가능.
4.4 4. Rank Preservation (14.4)
\(L\) 의 같은 값에서 모든 개인의 인과 효과가 정확히 같으면 가법 조건부 rank preservation 성립:
\[Y_i^a - Y_i^{a=0} = \psi_1 a + \psi_2 a L_i \quad \forall i\]
비현실적이지만 g-estimation 의 도입에 유용 — 절차를 직관적으로 보여준다.
직관 — Rank preservation 의 비현실성: 같은 9 변수를 가진 두 환자가 금연했을 때 정확히 같은 체중 변화가 나올 가능성은 0. 일부는 5kg, 일부는 0.5kg 만 늘어날 것 — 개인 수준 효과의 변동성이 항상 존재.
직관 — 그러나 g-estimation 은 작동: rank preservation 이 깨져도 g-estimation 절차가 정확. 모형의 평균 효과만 옳으면 추정량이 일치 — 절차의 robustness 가 가정의 약점을 보완.
4.5 5. G-estimation 절차 (14.5)
- 후보 모수 값 \(\psi^\dagger\) 격자 (예: 2.0, 2.1, …, 5.0).
- 각 \(\psi^\dagger\) 에 대해 \(H(\psi^\dagger) := Y - \psi^\dagger A\) 계산.
- Logistic 회귀 적합: \(\mathrm{logit}\, \Pr(A=1|H(\psi^\dagger), L) = \alpha_0 + \alpha_1 H(\psi^\dagger) + \alpha_2 L\).
- \(\widehat{\alpha}_1\) 이 0 에 가장 가까운 \(\psi^\dagger\) 가 \(\widehat{\psi}_1\).
- 95% CI 는 \(\widehat{\alpha}_1 = 0\) 검정의 P-value > 0.05 를 주는 \(\psi^\dagger\) 들의 범위.
직관 — \(H(\psi^\dagger)\) 가 가상의 \(Y^{a=0}\): 만약 \(\psi^\dagger\) 가 진짜 효과라면 \(H(\psi^\dagger) = Y - \psi^\dagger A\) 는 “처치 효과를 빼낸 잠재 결과 \(Y^{a=0}\)” 이다. 이 양이 \(A\) 와 독립이면 (\(\alpha_1 = 0\)) 진짜 \(Y^{a=0}\) 의 성질을 만족 → 그 \(\psi^\dagger\) 가 진짜 효과.
직관 — 검색이 1 차원 → 다차원: 단일 모수는 1 차원 격자, 다중 모수는 다차원 격자. 모수가 늘면 격자 크기가 폭발하므로 closed-form (선형 SNMM) 또는 Newton-Raphson (비선형) 으로 검색 회피.
5 가정의 위계
- 조건부 교환가능성: \(Y^a \perp\!\!\!\perp A | L\) — IPW·표준화와 동일.
- 양의 확률: \(\Pr(A=a|L) > 0\) — IPW 와 같은 위반 위험.
- 일관성: \(A=a\) 일 때 \(Y = Y^a\) — 동일.
- SNMM specification: 효과의 함수 형태가 옳다.
- 처치 모형 specification: \(\mathrm{E}[A|L]\) logistic 모형이 옳다 (부분 의존).
이중 강건 추정량은 처치 모형과 결과 모형 (또는 SNMM 의 nuisance 부분) 둘 중 한쪽만 옳아도 된다.
직관 — Sensitivity Analysis 의 자연스러움: G-estimation 은 “\(\alpha_1 = 0\) 가정” 에 의존. 만약 미관측 교란이 있으면 \(\alpha_1 \neq 0\). 가설 값을 0 대신 0.1, 0.2 로 두면 미관측 교란 강도별 추정값을 계산 가능 — sensitivity analysis 가 절차에 자연스럽게 통합.
6 왜 필요한가
| 상황 | IPW | 표준화 | G-estimation |
|---|---|---|---|
| 단일 시점, 단순 보정 | 잘 작동 | 잘 작동 | 잘 작동 |
| 결과 모형 specification 어려움 | 영향 없음 | 위험 | 부분 (SNMM 만) |
| 처치 모형 specification 어려움 | 위험 | 영향 없음 | 위험 |
| Sensitivity analysis | 가능 | 가능 | 자연스러움 |
| 시간변동 처치 (Part III) | 가능 | 위험 | 표준 도구 |
직관 — 시간변동에서 g-estimation 이 빛나는 이유: 시간변동 처치-교란 피드백에서는 표준화가 무너진다 (g-formula 도 multiple integral 의 분산 폭발). G-estimation 은 같은 SNMM 절차로 시간변동 처치를 다루므로 Part III 의 핵심 도구. Part II 의 g-estimation 은 그 도구의 단순한 1 차원 데모.
7 응용 분야
- 임상 코호트의 robust 추정: 결과 모형 misspecification 위험 분리
- 시간변동 처치: HIV, 종양학 코호트의 표준 분석
- 미관측 교란 sensitivity: 환경역학·약물역학
- 개인화 의학: 조건부 효과의 명시적 추정 (SNMM 의 product term)
- Mendelian randomization: 도구변수 + g-estimation 결합
8 후속 글로 이어지는 다리
| 글 | 다루는 내용 |
|---|---|
| 13-1 | 14.1 + 14.2 — 조건부 효과 + 교환가능성의 logistic 표현 |
| 13-2 | 14.3 + 14.4 — SNMM 정의 + rank preservation |
| 13-3 | 14.5 + 14.6 — g-estimation 절차 + 다중 모수 |
9 코드 미리보기
import pandas as pd
import numpy as np
import statsmodels.formula.api as smf
nhefs = pd.read_csv("nhefs.csv").dropna(subset=["wt82_71"]).reset_index(drop=True)
# 격자 검색으로 g-estimate 찾기
grid = np.arange(2.0, 5.0 + 0.01, 0.01)
alpha_1_values = []
for psi in grid:
nhefs["H"] = nhefs["wt82_71"] - psi * nhefs["qsmk"]
formula = (
"qsmk ~ H + sex + race + C(education) + age + I(age**2) "
"+ smokeintensity + I(smokeintensity**2) + smokeyrs + I(smokeyrs**2) "
"+ C(exercise) + C(active) + wt71 + I(wt71**2)"
)
m = smf.logit(formula, data=nhefs).fit(disp=False)
alpha_1_values.append(m.params["H"])
# alpha_1 = 0 에 가장 가까운 psi
psi_hat = grid[np.argmin(np.abs(alpha_1_values))]
print(f"G-estimate: {psi_hat:.3f} kg") # ~3.4510 한 줄 요약
G-estimation 은 IPW·표준화에 이은 세 번째 g-method 로, semiparametric SNMM 의 모수를 “\(\alpha_1 = 0\) 을 만족하는 후보 검색” 으로 추정한다. NHEFS 사례에서 3.45kg — 다른 두 도구의 3.4~3.5kg 와 일치하는 robust 결과. 시간변동 처치로의 일반화와 sensitivity analysis 의 자연스러운 통합이 g-estimation 의 진가.
11 관련 주제
선행 지식
후속 주제
- 조건부 효과 + 교환가능성 logistic 표현 — Ch.14.1-14.2
- SNMM 정의 + rank preservation — Ch.14.3-14.4
- G-estimation 절차 + 다중 모수 — Ch.14.5-14.6
- 성향점수 — Ch.15
- 시간변동 g-방법 — Ch.21
다른 카테고리 연결
- 추정 방정식 — semiparametric 추정의 기초
- Sensitivity analysis