Kwangmin Kim - Causal Mediation

1 개요

Part III (Ch.19~Ch.22) 는 시간 변동 치료 의 인과효과를 다뤘다. 목표는 결과 분포가 어떻게 변화하는가 — 다른 처치 전략 하에서. 어떻게 (how) 효과가 발생하는지는 묻지 않았다. Ch.23 은 그 질문에 답한다 — 처치가 결과로 가는 경로 를 분해.

핵심 아이디어: 매개 분석은 시간 변동 인과추론의 특수 사례. 단일 처치 \(A\) 와 매개자 \(M\) 가 서로 다른 시점에 측정된 두 변수. Ch.19~Ch.22 의 g-method 들이 그대로 적용. 단, 매개의 정의가 cross-world 반사실을 포함한다는 점이 추가 도전.

직관 — 매개의 비유: 약 \(A\) 가 심장병 \(Y\) 위험을 낮춘다. 그런데 어떻게? 혈압 \(M\) 을 통해서? 아니면 다른 경로 (염증, 콜레스테롤)? 매개 분석은 효과의 분해. Total = Direct + Indirect.

정의: 매개의 두 효과 (Robins & Greenland 1992)

Pure Direct Effect (PDE): \(A\) 가 \(Y\) 에 미치는 효과 중 \(M\) 을 거치지 않는 부분.

\[\text{PDE} = \mathrm{E}[Y^{a=1, M^{a=0}}] - \mathrm{E}[Y^{a=0, M^{a=0}}]\]

Total Indirect Effect (TIE): \(A\) 가 \(Y\) 에 미치는 효과 중 \(M\) 을 거치는 부분.

\[\text{TIE} = \mathrm{E}[Y^{a=1, M^{a=1}}] - \mathrm{E}[Y^{a=1, M^{a=0}}]\]

합산 정리: PDE + TIE = \(\mathrm{E}[Y^{a=1}] - \mathrm{E}[Y^{a=0}]\) = Total Effect.

Pearl (2001) 의 natural direct/indirect effect 와 동일 개념.

직관 — Cross-World 반사실의 기괴함: \(Y^{a=1, M^{a=0}}\) 는 “\(A=1\) 처치를 받았으나 매개자 \(M\) 은 \(A=0\) 일 때의 값으로 고정” 한 결과. 한 사람이 동시에 두 세계에 존재 — 흡연을 계속하면서 (한 세계) 동시에 금연했을 때의 혈압을 가짐 (다른 세계). 물리적으로 불가능.

2 매개 분석의 핵심 의문 3개

의문 1: Cross-world counterfactual 을 어떻게 식별하는가?

Hernán & Robins (2020, Ch.23.1) 는 mediation formula 를 도입.

\[\sum_m \mathrm{E}[Y \mid A = 1, M = m] \Pr[M = m \mid A = 0]\]

이 식은 cross-world quantity \(\mathrm{E}[Y^{a=1, M^{a=0}}]\) 와 같다 — 단, NPSEM-IE 모형 가 정 하에서만. FFRCISTG 모형 하에서는 부분적으로만 식별 가능.

직관 — Mediation Formula 의 모양: \(A=1\) 일 때의 결과 \(Y\) 의 평균 (각 \(M=m\) 별로)에 \(A=0\) 일 때의 매개자 \(M\) 분포 를 곱해 평균. “한 세계의 결과 분포 + 다른 세계의 매개자 분포 = 합쳐서 평균.”

의문 2: Mediation formula 는 정말로 cross-world quantity 를 식별하는가?

Mediation formula 는 관찰 가능 한 양 — \(A\), \(M\), \(Y\) 의 결합 분포만 사용. 하지만 cross- world counterfactual 은 결코 관측 불가. 그러므로 mediation formula 가 cross-world 양을 식별한다는 주장은 검증 불가능한 가정 에 의존.

이 가정은 NPSEM-IE 모형이 가정하는 cross-world independencies — \(Y^{a=1, m} \perp\!\!\!\perp M^{a=0}\). 두 다른 세계의 반사실 변수가 독립.

직관 — 검증 불가능한 가정의 위험: 어떤 무작위 실험도 동일 사람에게 동시에 두 세계의 값 을 주지 못한다. 따라서 NPSEM-IE 의 cross-world 독립성은 원리적으로 실험으로 증명 불가. 어떤 가정의 진실 을 영원히 모른 채 분석 결과를 받아들여야 함.

의문 3: 그래서 어떡할 것인가?

Ch.23 은 두 갈래를 제시.

NPSEM-IE 옹호 (23.2): Pearl 등이 매개 분석의 정책적 가치를 옹호. Separable effects \(N\)/ \(O\) 의 이야기를 통해 PDE 가 의미를 가진다 — 단, 가정이 옳다는 전제 하.
개입주의 framework (23.3-23.4): Robins & Richardson (2010) 이 도입. Cross-world counterfactual 을 사용하지 않고도 매개와 유사한 효과를 정의 — separable component effect. 이 효과는 미래 무작위 실험에서 검증 가능.

직관 — 두 가지 입장: NPSEM-IE 입장은 “가정이 옳으면 PDE 는 의미 있다.” 개입주의 입장은 “우리는 검증 가능한 효과만 다룬다 — separable effect \(N\)/\(O\) 가 진짜 의미.” 이 책은 후자 를 선호 (FFRCISTG 일관성).

3 NPSEM-IE vs FFRCISTG

정의: 두 인과 모형

NPSEM-IE (Non-Parametric Structural Equation Model with Independent Errors): Pearl 의 SCM 모형. Cross-world independencies 를 가정 — 두 세계의 반사실 변수가 독립.

FFRCISTG (Finest Fully Randomized Causally Interpretable Structured Tree Graph): Robins 의 모형. Single-world counterfactual 만 다룸. Cross-world independencies 는 가정하지 않음. 이 책 전체가 채택한 모형.

모형	Cross-world 독립성	PDE 식별	검증 가능성
NPSEM-IE	가정	점 식별 (mediation formula)	불가 (cross-world 독립성 검증 불가)
FFRCISTG	가정 안 함	부분 식별 (sharp bounds; Robins-Richardson 2010)	일부 가능

직관 — 왜 FFRCISTG 를 선호하는가?: 과학의 핵심은 검증 가능성. 어떤 가정이 영원히 검증 불가능하다면, 그 가정에 의존한 결론은 과학적이라기보다 형이상학적. FFRCISTG 는 검증 가능한 가정만 사용 — “single world 의 가설은 single world 의 실험으로 검증.”

4 개입주의 매개 이론 (Interventionist Mediation)

Robins & Richardson (2010), 확장: Robins, Richardson, Shpitser (2022).

핵심 변환: 처치 \(A\) 를 substantively meaningful, separable components 로 분해.

니코틴-담배 예: \(A\) = 흡연. \(A\) 의 두 component: - \(N\) = 니코틴 노출 (담배의 니코틴 성분) - \(O\) = 다른 화학 성분 (담배의 비-니코틴 성분)

가정 (i): \(N\) 은 \(Y\) 에 직접 효과 없음 — \(M\) (혈압) 을 통해서만. 가정 (ii): \(O\) 는 \(M\) 에 효과 없음.

이 가정 하에서 separable component effect 정의:

\[\mathrm{E}[Y^{n=0, o=1}] - \mathrm{E}[Y^{n=0, o=0}]\]

이는 “니코틴 제거, 다른 성분 유지” 의 효과. 미래 3-arm 무작위 실험으로 직접 검증 가능: 1. \(A = N = O = 1\) (담배 흡연) 2. \(A = N = O = 0\) (금연) 3. \(N = 0, O = 1\) (니코틴-free 담배)

직관 — 분리 가능 효과의 핵심: 가정 (i)+(ii) 가 옳으면, “니코틴-free 담배 효과” = PDE. 그러나 가정이 깨지면 PDE 의 정책 의미는 무너짐. 개입주의 framework 의 강점은 미래 실험으 로 가정을 원리적으로 검증할 수 있다는 점.

5 매개 분석이 어렵다 는 결론

Ch.23.4 의 결론:

매개 분석은 비-매개 분석보다 더 heroic 한 가정을 요구.
본문의 단순 DAG (Figure 23.1) 는 교육 도구 — 실제 매개 연구는 더 복잡한 confounding 구조.
모든 매개 분석은 확장된 exchangeability 가 필요 — \(A \to Y\) 교란 + \(M \to Y\) 교란 모두.
개입주의 framework 에서도 가정 (i)+(ii)+exchangeability 가 동시에 필요.

직관 — 왜 매개가 더 어려운가?: ATE 추정에는 한 세트의 confounder \(L_A\) 만 다루면 됨. 매개 추정에는 두 세트 — \(L_A\) (\(A\) 와 \(Y\)) + \(L_M\) (\(M\) 과 \(Y\)) — 동시 처리 + cross-world 가정. 이론적으로도 가정 부담이 기하급수 증가.

6 매개 분석의 도구 box

본문에서 다룬 도구들:

Mediation formula — cross-world identification (NPSEM-IE 가정).
Sharp bounds (Robins-Richardson 2010) — FFRCISTG 하의 부분 식별.
Separable effect g-formula — 개입주의 framework 의 식별식 (mediation formula 와 같음).
Front-door formula — Pearl 의 매개 우회 식별 (Ch.7.5 와 연결).
Sensitivity analysis — cross-world 가정의 위반에 대한 robustness 점검.

7 매개의 응용 영역

매개 분석의 실무 적용:

임상 시험: 약물의 작용 mechanism 분해 (총 효과 vs mediator 경유).
유전학: SNP \(\to\) 단백질 발현 \(\to\) 질병 (mediation by gene expression).
사회과학: 교육 \(\to\) 직업 \(\to\) 임금 (Wright 의 path analysis 의 후예).
HIV 연구: 항레트로바이러스 약물 \(\to\) CD4 count \(\to\) 사망 (Ch.20 의 HIV 사례 확장).
A/B 테스트: UI 변경 \(\to\) 클릭 \(\to\) 구매 (마케팅 funnel 분석의 인과 버전).

8 Ch.23 의 4 소챕터 흐름

소챕터	주제	핵심 메시지
23.1 Mediation analysis under attack	PDE 정의 + cross-world 비판	mediation formula 는 검증 불가 가정 의존
23.2 A defense of mediation analysis	NPSEM-IE 옹호 + separable effect 도입	“니코틴-free 담배” 이야기로 PDE 의 정책 의미 옹호
23.3 Empirically verifiable mediation	3-arm 미래 실험	가정 (i)+(ii) 의 경험적 검증 절차
23.4 An interventionist theory	통합 framework	Cross-world 없이도 매개 효과 정의·식별·검증 가능

9 코드: Mediation Formula 시뮬레이션

코드

import numpy as np
import pandas as pd

np.random.seed(42)
n = 10000

# 처치 A: 무작위 50/50
A = np.random.binomial(1, 0.5, n)

# 매개자 M: A 의 함수 + 노이즈 (logistic)
# M=1 이면 hypertension; A=1 (흡연 계속) 일 때 P(M=1)=0.5, A=0 일 때 P(M=1)=0.3
p_M = 0.3 + 0.2 * A
M = np.random.binomial(1, p_M, n)

# 결과 Y: A 와 M 양쪽에 의존 (PDE + TIE 둘 다 존재)
# Y=1 이면 heart disease
# baseline 위험 0.05; A=1 effect 0.05 (direct); M=1 effect 0.10 (mediator)
p_Y = 0.05 + 0.05 * A + 0.10 * M
Y = np.random.binomial(1, p_Y, n)

df = pd.DataFrame({'A': A, 'M': M, 'Y': Y})

# Total effect: E[Y|A=1] - E[Y|A=0]
TE = df[df.A == 1].Y.mean() - df[df.A == 0].Y.mean()
print(f"Total Effect: {TE:.4f}")

# Mediation Formula: sum_m E[Y|A=1, M=m] * P(M=m|A=0)
PDE_estimate = 0.0
for m in [0, 1]:
    EY_a1_m = df[(df.A == 1) & (df.M == m)].Y.mean()
    PM_a0 = (df[df.A == 0].M == m).mean()
    PDE_estimate += EY_a1_m * PM_a0

# E[Y|A=0] = E[Y^{a=0, M^{a=0}}]
EY_a0 = df[df.A == 0].Y.mean()
PDE = PDE_estimate - EY_a0
TIE = TE - PDE

print(f"Pure Direct Effect (mediation formula): {PDE:.4f}")
print(f"Total Indirect Effect: {TIE:.4f}")
print(f"PDE + TIE = {PDE + TIE:.4f} (should equal TE)")

결과 해석: 시뮬레이션 진실값은 PDE = 0.05 (A 의 직접 효과), TIE = 0.02 (= 0.20 차이 × 0.10 매개 효과). Mediation formula 는 잘 회복. 단, 시뮬레이션 모형이 NPSEM-IE 의 cross- world 독립성을 만족 하기 때문 — 실제 데이터에서는 검증 불가.

10 한 줄 요약

매개 분석은 처치 효과를 직접 과 간접 으로 분해. Robins-Greenland 의 PDE/TIE 는 cross- world counterfactual 에 의존 — 영원히 검증 불가한 가정. Mediation formula 는 NPSEM-IE 가정 하의 식별식. 개입주의 framework (Robins-Richardson 2010) 는 separable component \(N\)/\(O\) 로 treatment 를 분해 — 검증 가능한 효과 정의. 매개 분석은 가정 부담이 비-매개 분석보다 매우 크다 — heroic assumptions. 본문은 FFRCISTG + 개입주의 framework 를 권장.

11 관련 주제

선행 (Phase D 내): - G-methods for Time-Varying — Ch.21 개관 — 매개 는 시간 변동 치료의 특수 사례 - Treatment-Confounder Feedback — Ch.20 개관 — \(L_M\) 이 \(A\) 와 \(Y\) 의 매개자이자 confounder 인 경우 - Propensity Score Overview — Ch.15 — 매개 분석에서도 \(M\) 모형의 specification 중요

후속 (다른 카테고리): - Statistics (FDA): SNP - 단백질 - 질병 mediation - Engineering: A/B 테스트 funnel 분석의 인과 해석

보충 자료: - Pearl (2001) “Direct and Indirect Effects” — natural direct/indirect effect 도입 - Robins & Greenland (1992) “Identifiability and Exchangeability” — PDE/TIE 원형 - Robins & Richardson (2010) “Alternative Graphical Causal Models” — 개입주의 framework - VanderWeele (2015) “Explanation in Causal Inference” — 매개 분석 실무 교과서 - Hernán & Taubman (2008) “Does obesity shorten life?” — 매개의 ill-defined intervention 비판