개요
Part III (Ch.19~Ch.22) 는 시간 변동 치료 의 인과효과를 다뤘다. 목표는 결과 분포가 어떻게 변화하는가 — 다른 처치 전략 하에서. 어떻게 (how) 효과가 발생하는지는 묻지 않았다. Ch.23 은 그 질문에 답한다 — 처치가 결과로 가는 경로 를 분해.
핵심 아이디어: 매개 분석은 시간 변동 인과추론의 특수 사례. 단일 처치 \(A\) 와 매개자 \(M\) 가 서로 다른 시점에 측정된 두 변수. Ch.19~Ch.22 의 g-method 들이 그대로 적용. 단, 매개의 정의가 cross-world 반사실을 포함한다는 점이 추가 도전.
직관 — 매개의 비유: 약 \(A\) 가 심장병 \(Y\) 위험을 낮춘다. 그런데 어떻게? 혈압 \(M\) 을 통해서? 아니면 다른 경로 (염증, 콜레스테롤)? 매개 분석은 효과의 분해. Total = Direct + Indirect.
Pure Direct Effect (PDE): \(A\) 가 \(Y\) 에 미치는 효과 중 \(M\) 을 거치지 않는 부분.
\[\text{PDE} = \mathrm{E}[Y^{a=1, M^{a=0}}] - \mathrm{E}[Y^{a=0, M^{a=0}}]\]
Total Indirect Effect (TIE): \(A\) 가 \(Y\) 에 미치는 효과 중 \(M\) 을 거치는 부분.
\[\text{TIE} = \mathrm{E}[Y^{a=1, M^{a=1}}] - \mathrm{E}[Y^{a=1, M^{a=0}}]\]
합산 정리: PDE + TIE = \(\mathrm{E}[Y^{a=1}] - \mathrm{E}[Y^{a=0}]\) = Total Effect.
Pearl (2001) 의 natural direct/indirect effect 와 동일 개념.
직관 — Cross-World 반사실의 기괴함: \(Y^{a=1, M^{a=0}}\) 는 “\(A=1\) 처치를 받았으나 매개자 \(M\) 은 \(A=0\) 일 때의 값으로 고정” 한 결과. 한 사람이 동시에 두 세계에 존재 — 흡연을 계속하면서 (한 세계) 동시에 금연했을 때의 혈압을 가짐 (다른 세계). 물리적으로 불가능.
매개 분석의 핵심 의문 3개
의문 1: Cross-world counterfactual 을 어떻게 식별하는가?
Hernán & Robins (2020, Ch.23.1) 는 mediation formula 를 도입.
\[\sum_m \mathrm{E}[Y \mid A = 1, M = m] \Pr[M = m \mid A = 0]\]
이 식은 cross-world quantity \(\mathrm{E}[Y^{a=1, M^{a=0}}]\) 와 같다 — 단, NPSEM-IE 모형 가 정 하에서만. FFRCISTG 모형 하에서는 부분적으로만 식별 가능.
직관 — Mediation Formula 의 모양: \(A=1\) 일 때의 결과 \(Y\) 의 평균 (각 \(M=m\) 별로)에 \(A=0\) 일 때의 매개자 \(M\) 분포 를 곱해 평균. “한 세계의 결과 분포 + 다른 세계의 매개자 분포 = 합쳐서 평균.”
의문 2: Mediation formula 는 정말로 cross-world quantity 를 식별하는가?
Mediation formula 는 관찰 가능 한 양 — \(A\), \(M\), \(Y\) 의 결합 분포만 사용. 하지만 cross- world counterfactual 은 결코 관측 불가. 그러므로 mediation formula 가 cross-world 양을 식별한다는 주장은 검증 불가능한 가정 에 의존.
이 가정은 NPSEM-IE 모형이 가정하는 cross-world independencies — \(Y^{a=1, m} \perp\!\!\!\perp
M^{a=0}\). 두 다른 세계의 반사실 변수가 독립.
직관 — 검증 불가능한 가정의 위험: 어떤 무작위 실험도 동일 사람에게 동시에 두 세계의 값 을 주지 못한다. 따라서 NPSEM-IE 의 cross-world 독립성은 원리적으로 실험으로 증명 불가. 어떤 가정의 진실 을 영원히 모른 채 분석 결과를 받아들여야 함.
의문 3: 그래서 어떡할 것인가?
Ch.23 은 두 갈래를 제시.
- NPSEM-IE 옹호 (23.2): Pearl 등이 매개 분석의 정책적 가치를 옹호. Separable effects \(N\)/ \(O\) 의 이야기를 통해 PDE 가 의미를 가진다 — 단, 가정이 옳다는 전제 하.
- 개입주의 framework (23.3-23.4): Robins & Richardson (2010) 이 도입. Cross-world counterfactual 을 사용하지 않고도 매개와 유사한 효과를 정의 — separable component effect. 이 효과는 미래 무작위 실험에서 검증 가능.
직관 — 두 가지 입장: NPSEM-IE 입장은 “가정이 옳으면 PDE 는 의미 있다.” 개입주의 입장은 “우리는 검증 가능한 효과만 다룬다 — separable effect \(N\)/\(O\) 가 진짜 의미.” 이 책은 후자 를 선호 (FFRCISTG 일관성).
NPSEM-IE vs FFRCISTG
NPSEM-IE (Non-Parametric Structural Equation Model with Independent Errors): Pearl 의 SCM 모형. Cross-world independencies 를 가정 — 두 세계의 반사실 변수가 독립.
FFRCISTG (Finest Fully Randomized Causally Interpretable Structured Tree Graph): Robins 의 모형. Single-world counterfactual 만 다룸. Cross-world independencies 는 가정하지 않음. 이 책 전체가 채택한 모형.
| NPSEM-IE |
가정 |
점 식별 (mediation formula) |
불가 (cross-world 독립성 검증 불가) |
| FFRCISTG |
가정 안 함 |
부분 식별 (sharp bounds; Robins-Richardson 2010) |
일부 가능 |
직관 — 왜 FFRCISTG 를 선호하는가?: 과학의 핵심은 검증 가능성. 어떤 가정이 영원히 검증 불가능하다면, 그 가정에 의존한 결론은 과학적이라기보다 형이상학적. FFRCISTG 는 검증 가능한 가정만 사용 — “single world 의 가설은 single world 의 실험으로 검증.”
매개 분석이 어렵다 는 결론
Ch.23.4 의 결론:
- 매개 분석은 비-매개 분석보다 더 heroic 한 가정을 요구.
- 본문의 단순 DAG (Figure 23.1) 는 교육 도구 — 실제 매개 연구는 더 복잡한 confounding 구조.
- 모든 매개 분석은 확장된 exchangeability 가 필요 — \(A \to Y\) 교란 + \(M \to Y\) 교란 모두.
- 개입주의 framework 에서도 가정 (i)+(ii)+exchangeability 가 동시에 필요.
직관 — 왜 매개가 더 어려운가?: ATE 추정에는 한 세트의 confounder \(L_A\) 만 다루면 됨. 매개 추정에는 두 세트 — \(L_A\) (\(A\) 와 \(Y\)) + \(L_M\) (\(M\) 과 \(Y\)) — 동시 처리 + cross-world 가정. 이론적으로도 가정 부담이 기하급수 증가.
매개 분석의 도구 box
본문에서 다룬 도구들:
- Mediation formula — cross-world identification (NPSEM-IE 가정).
- Sharp bounds (Robins-Richardson 2010) — FFRCISTG 하의 부분 식별.
- Separable effect g-formula — 개입주의 framework 의 식별식 (mediation formula 와 같음).
- Front-door formula — Pearl 의 매개 우회 식별 (Ch.7.5 와 연결).
- Sensitivity analysis — cross-world 가정의 위반에 대한 robustness 점검.
매개의 응용 영역
매개 분석의 실무 적용:
- 임상 시험: 약물의 작용 mechanism 분해 (총 효과 vs mediator 경유).
- 유전학: SNP \(\to\) 단백질 발현 \(\to\) 질병 (mediation by gene expression).
- 사회과학: 교육 \(\to\) 직업 \(\to\) 임금 (Wright 의 path analysis 의 후예).
- HIV 연구: 항레트로바이러스 약물 \(\to\) CD4 count \(\to\) 사망 (Ch.20 의 HIV 사례 확장).
- A/B 테스트: UI 변경 \(\to\) 클릭 \(\to\) 구매 (마케팅 funnel 분석의 인과 버전).
Ch.23 의 4 소챕터 흐름
| 23.1 Mediation analysis under attack |
PDE 정의 + cross-world 비판 |
mediation formula 는 검증 불가 가정 의존 |
| 23.2 A defense of mediation analysis |
NPSEM-IE 옹호 + separable effect 도입 |
“니코틴-free 담배” 이야기로 PDE 의 정책 의미 옹호 |
| 23.3 Empirically verifiable mediation |
3-arm 미래 실험 |
가정 (i)+(ii) 의 경험적 검증 절차 |
| 23.4 An interventionist theory |
통합 framework |
Cross-world 없이도 매개 효과 정의·식별·검증 가능 |
한 줄 요약
매개 분석은 처치 효과를 직접 과 간접 으로 분해. Robins-Greenland 의 PDE/TIE 는 cross- world counterfactual 에 의존 — 영원히 검증 불가한 가정. Mediation formula 는 NPSEM-IE 가정 하의 식별식. 개입주의 framework (Robins-Richardson 2010) 는 separable component \(N\)/\(O\) 로 treatment 를 분해 — 검증 가능한 효과 정의. 매개 분석은 가정 부담이 비-매개 분석보다 매우 크다 — heroic assumptions. 본문은 FFRCISTG + 개입주의 framework 를 권장.
관련 주제
선행 (Phase D 내): - G-methods for Time-Varying — Ch.21 개관 — 매개 는 시간 변동 치료의 특수 사례 - Treatment-Confounder Feedback — Ch.20 개관 — \(L_M\) 이 \(A\) 와 \(Y\) 의 매개자이자 confounder 인 경우 - Propensity Score Overview — Ch.15 — 매개 분석에서도 \(M\) 모형의 specification 중요
후속 (다른 카테고리): - Statistics (FDA): SNP - 단백질 - 질병 mediation - Engineering: A/B 테스트 funnel 분석의 인과 해석
보충 자료: - Pearl (2001) “Direct and Indirect Effects” — natural direct/indirect effect 도입 - Robins & Greenland (1992) “Identifiability and Exchangeability” — PDE/TIE 원형 - Robins & Richardson (2010) “Alternative Graphical Causal Models” — 개입주의 framework - VanderWeele (2015) “Explanation in Causal Inference” — 매개 분석 실무 교과서 - Hernán & Taubman (2008) “Does obesity shorten life?” — 매개의 ill-defined intervention 비판