Kwangmin Kim - What-If 질문에 대한 통합 접근

1 정의

정의: Unified Causal Inference Framework

Target Trial Emulation 이 모든 인과 분석을 통합 표현하는 framework:

What-If 질문: 인과 질문 = “만약 X 가 Y 였다면 Z 는 어떻게?”.
Target Trial: 답하기 위한 가상 무작위 시험 protocol.
Emulation: 가용 데이터 (RCT, 관찰, EHR, big data) 로 target trial 모방.
Analysis Tools: g-methods, IV, DiD, RDD, DR ML 등 — 도구 box.
Sensitivity: E-value, bound, multiple analysis 의 robust 검증.

→ 모든 인과 분석이 이 framework 의 instance.

직관 — Framework 의 강력함: 의학자, 통계학자, 컴퓨터 과학자, 정책 결정자 모두 같은 언어. 인과 분석의 lingua franca. Hernán & Robins 의 framework 가 21 세기 인과 분석의 표준이 된 진짜 이유.

2 22.5 What-If 질문의 통합

2.1 모든 인과 질문이 Target Trial 로 표현 가능

인과 질문의 다양한 형태와 Target Trial 매핑

(1) 단일 시점 처치 (Part I-II): “약 A 가 효과 있나?” - Target trial: Baseline 에 약 A vs 위약 무작위 → outcome 비교. - Emulation: 관찰 데이터의 baseline 처치 → outcome.

(2) 시간변동 처치 (Part III): “약 A 의 sustained 효과?” - Target trial: Baseline 에 sustained strategy 무작위. - Emulation: 시간변동 g-method.

(3) Mediation (Ch.23): “약 A 의 효과가 매개자 M 통과하나?” - Target trial: A 와 M 의 결합 무작위 시험. - Emulation: g-method + 매개자 분석.

(4) Comparative Effectiveness (CER): “약 A vs 약 B?” - Target trial: A vs B head-to-head 무작위 시험. - Emulation: IPW MSM 또는 g-formula.

(5) Heterogeneous Treatment Effects (HTE): “어느 환자에게 효과 큼?” - Target trial: Stratified 무작위 시험. - Emulation: Effect modification 모형.

(6) Optimal Dynamic Strategy: “어떤 strategy 가 최선?” - Target trial: SMART 무작위 시험. - Emulation: Q-learning, A-learning (RL 결합).

직관 — 통합 표현의 강점: 6 가지 다른 분석을 같은 framework 로. 협업 + 검토 + 교육의 표준 도구. Lingua franca 의 가치.

직관 — Framework 부재 시의 혼란: 1990 년대 이전 의학 분석 — 분석자마다 다른 frame, 결과 비교 어려움. Target Trial framework 의 통일성이 cumulative scientific progress 가능하게.

2.2 도구 Box 의 Framework 적용

다양한 도구의 Target Trial 표현

도구	Target Trial Emulation 의 의미
RCT	가장 직접적 — protocol = trial 자체
G-formula	결과 모형 + 가상 시뮬레이션
IPW MSM	가중 가상 모집단
G-estimation	Sequential SNMM
IV (Wald, 2SLS)	도구 변수 = baseline 무작위 (가상)
Difference-in-Differences (DiD)	처치 시점 전후 비교
Regression Discontinuity (RDD)	임계값 근처 비교
Synthetic Control Method	가상 대조 그룹 구성
Doubly Robust ML	결과 + 처치 모형 결합

→ 모든 도구가 target trial 의 emulation 도구.

직관 — 도구의 본질적 통일: 다른 가정 + 다른 절차이지만 모두 target trial 의 효과 추정 도구. 가정의 robustness 따라 도구 선택. 단일 도구 의존 X — 다중 도구 + sensitivity.

직관 — DiD, RDD 의 자연스러운 매핑: 시간 차이 또는 임계값을 natural experiment 로 활용. Target trial 의 무작위 배정 모방. Quasi-experimental design 도 framework 의 instance.

3 21 세기 인과 분석의 표준화

3.1 의학 분야의 표준

Medical Journal 의 Framework 채택

NEJM, Lancet, JAMA, BMJ 등 주요 의학 저널: - Target Trial framework 권장. - Reporting standard: STROBE-RECORD, RECORD-PE. - Time zero 명시 강제. - Treatment strategy 정확 정의.

FDA, EMA 의 Real-World Evidence (RWE) 가이드라인: - “사용자가 emulated target trial 의 protocol 명시 필요”. - ICH-E9 (Statistical Principles) 의 estimand framework 와 연계.

Cochrane Reviews, GRADE Guidelines: - Target trial framework 로 evidence 평가.

직관 — Regulatory 영향: FDA 의 RWE 가이드라인 (2021) 이 target trial framework 명시 인용. 의약품 승인 과정에 프레임워크 표준 도구. Hernán 의 framework 의 정책적 영향력.

직관 — 학술지 표준화: 2020 년 이후 의학 저널 논문에 “Target Trial Specification” 섹션 표준 등장. 분석 결과 검증 가능성 향상. Reproducibility crisis 해결의 한 도구.

3.2 통계학·데이터 사이언스의 표준

학술 + 산업 표준

학술 Causal Inference 교재: - Hernan & Robins “Causal Inference: What If” (2020) 의 핵심. - Pearl “Causality” (2009), Imbens & Rubin “Causal Inference for Statistics, Social, and Biomedical Sciences” (2015) 와 함께 표준.

Industry 활용: - Microsoft EconML, IBM CausalNex, Uber CausalML. - 대형 tech 회사의 인과 분석 표준 도구로 target trial framework 채택.

Software 패키지: - Python: causal_target_trial (개발 중), gfoRmula Python port. - R: gfoRmula, target_trial.

직관 — Framework 의 산업 채택: Big Tech 의 A/B 테스트 + 관찰 분석 결합. Target Trial frame 으로 분석 표준화. Hernan 의 framework 의 산업 영향.

직관 — 향후 표준화: 2025 년 이후 ML 패키지의 target trial 자동 검토 기능 통합 전망. Code + protocol 동시 작성. DevOps 의 인과 분석 형태.

4 ML + Target Trial 의 결합

Causal ML + Target Trial 의 미래

(1) Doubly Robust ML (Chernozhukov 2018): - DDML + target trial protocol = 표준 분석. - EconML, DoubleML 의 target trial 지원.

(2) Targeted Learning (van der Laan): - TMLE (Targeted Maximum Likelihood Estimation) + target trial. - Roadmap of Targeted Learning 이 framework 와 일치.

(3) Reinforcement Learning + Target Trial: - Optimal dynamic treatment regime 의 target trial 표현. - SMART trial framework 와 RL 결합.

(4) LLM + Causal Inference: - LLM 으로 target trial protocol 자동 작성. - Code generation + 분석 자동화. - 2025 년 이후 활발한 연구.

직관 — ML 결합의 본질: ML 이 “어떤 도구 사용?” 의 답. Target Trial framework 가 “무엇 답하나?” 의 답. 두 layer 의 결합 — ML alone 부족, Framework alone 부족, 결합이 정점.

직관 — LLM 의 인과 분석 도구화: GPT-4, Claude 등 LLM 이 분석가의 protocol 작성 도우미. “이 데이터로 ATE 추정” → LLM 이 8 components 자동 작성 + g-method 코드 생성. 인과 분석의 자동화 향후.

5 Hernán & Robins 의 30+ 년 발전사

Causal Inference Framework 의 진화

1986: Robins 의 g-formula — TC feedback deadlock 해결.

1992-1994: Robins 의 IPW MSM, SNMM g-estimation — 시간변동 도구 확장.

1995-2000: 이중 강건 추정량 (Robins, Rotnitzky, Zhao 1994), TMLE (van der Laan 2006).

2000-2010: Pearl 의 do-calculus, SCM. SUTVA, exchangeability 정밀화.

2008: Hernán et al. statin target trial — framework 첫 응용.

2016: Hernán & Robins “Specifying a target trial…” — framework 정식 정의.

2018: Chernozhukov et al. Double/Debiased ML — Causal ML 의 통계 이론.

2020: Hernán & Robins “Causal Inference: What If” — 통합 textbook.

2025+: ML 결합 + LLM 자동화의 활발한 연구.

직관 — 30+ 년의 progressive science: 1986 년 Robins 의 단일 발명에서 시작 → 점진적 확장 → 2016 년 framework 통합 → 2020 년 textbook → 2025 년 ML 결합. 인과 분석의 paradigm shift 의 정확한 사례.

6 결론 — Hernan & Robins 의 책의 정점

“Causal Inference: What If” 의 종합 메시지

Part I (Causal Inference without Models): - 인과 효과의 정의, 식별 가정, DAG. - 단일 시점 처치 + 비모수 도구.

Part II (Causal Inference with Models): - 회귀, IPW, 표준화, g-estimation, PS. - 단일 시점 처치 + 모수 도구.

Part III (Causal Inference for Time-Varying Treatments): - 시간변동 처치, TC feedback, g-methods. - Target Trial Framework + ML 결합.

Mediation (Ch.23): - 직접·간접 효과 분해. - Target Trial 로 mediation 표현.

핵심 메시지: - 인과 추론 ≠ 통계. - 도메인 지식 + 가정 + 도구의 결합. - Target Trial framework 가 모든 인과 분석의 lingua franca. - ML 결합이 21 세기 발전 방향.

직관 — 책의 통합 가치: 30+ 년 발전사의 단일 textbook. 단일 시점 → 시간변동 → mediation 의 자연스러운 흐름. 인과 분석 학습의 표준 책.

직관 — 향후 발전: ML + Causal Inference 의 통합 (Chernozhukov, van der Laan), Quantum Causal Inference, Causal Foundation Models. Hernan 의 framework 가 미래 발전의 base.

7 What-If 질문의 의학적·정책적 의미

인과 질문의 의사결정 가치

의학: - “이 약이 환자에게 효과 있나?” → PP effect. - “이 정책이 인구 평균에게 효과?” → ITT effect. - “어느 환자에게 가장 효과?” → HTE. - “최적 dose 는?” → Dose-response curve.

정책: - “이 정책의 평균 효과?” → ATE. - “정책 적용 시 비용 효과?” → Welfare analysis. - “정책 적용 안 한 비교 그룹은?” → Counterfactual analysis.

기업: - “이 캠페인의 매출 효과?” → Marketing attribution. - “이 기능의 user retention?” → A/B testing. - “사용자별 어떤 추천?” → Personalization (HTE).

모든 결정이 What-If 질문. Target Trial framework 가 표준 도구.

직관 — 결정 과학의 표준: 의학·정책·기업의 모든 결정이 What-If 형태. Causal Inference 가 결정 과학 의 통계 도구. 인과 분석의 보편성.

직관 — Hernan 의 강조: “Causal inference is not statistics. It is decision-making.” 분석가가 결정 과학자 라는 인식. 단순 통계 도구 미만의 분석은 결정 도구 안 됨.

8 NHEFS 의 Target Trial 종합 정리

NHEFS 의 Final Target Trial Statement

Research Question: 1971-75 baseline 흡연자의 1982 까지 금연 결정의 체중 변화 효과 + 사망 효과 의 평균 인과 효과.

Target Trial Protocol (Chapter 22 framework):

Eligibility: 1971-75 baseline cigarette smokers (cig/day > 0), age 25-74.
Strategies:
- \(g_1\): 1971-1982 sustained quit.
- \(g_0\): 1971-1982 continue smoke.
Assignment: Random (target); self-selection (NHEFS).
Time Zero: 1971-75 baseline visit.
Outcomes:
- Primary: 1982 weight change kg.
- Secondary: 1982-1992 mortality.
Causal Contrast: PP ATE.
Analysis:
- Weight: IPW MSM (3.4 kg), 표준화 (3.5), DR (3.5), g-estimation (3.4), PS (3.6).
- Mortality: IPW MSM (+0.2%), g-formula (+0.3%).
Adherence: Sustained quit/smoke 1971-82.

Sensitivity: - 다중 도구 일치 → robust. - E-value ~ 2.2 (체중), ~ 1.1 (사망). - Selection bias (Fine Point 12.1) 인지. - Single time point — ITT/PP 구별 무의미.

Conclusion: 흡연 중단이 약 +3.5kg 체중 증가 효과, 10 년 사망 영향 거의 0.

→ Target Trial framework 가 NHEFS 분석의 정밀 표현.

직관 — Framework 적용의 정직성: 단순 회귀 결과 보고가 아닌 완전한 protocol + 다중 도구 결과 + sensitivity. 인과 분석의 황금 표준.

9 응용 분야

Medical Decision Making: 약물 처방의 인과 분석
Public Health Policy: 백신·정책 효과의 인과 분석
Comparative Effectiveness Research: 약물 head-to-head 비교
Pharmacoepidemiology: 약물 안전성 + 효과 분석
Marketing Attribution: 캠페인 인과 효과
Personalized Medicine: HTE 분석
AI/ML Decision Systems: Causal RL, Counterfactual reasoning

10 Part III + Target Trial Framework 의 종합

인과 분석의 21 세기 표준

DAG 분석 (Ch.6, 19) — 도메인 지식 + 인과 그래프.
Target Trial Specification (Ch.22) — 8 components 명시.
G-method 적용 (Ch.21) — 시간변동 처치 분석.
Doubly Robust ML (Ch.18, 21) — 고차원 + 큰 표본의 robust 분석.
Multiple Tools + Sensitivity (Ch.13.5, 18.5) — 다중 분석의 일치성.
Reporting Standard — 가정 명시 + 한계 인식.

→ Hernan & Robins 의 framework 가 21 세기 인과 분석의 표준 워크플로우.

직관 — Workflow 의 통합: 모든 단계가 명시적. 분석가의 직관이 아닌 체계적 절차. 인과 분석의 표준화 + Reproducibility.

11 코드 — Target Trial 자동 검토 도구 (개념)

# === Target Trial Protocol Validator (개념) ===

def validate_target_trial(protocol: dict, data: pd.DataFrame) -> dict:
    """Target trial protocol 의 8 components 자동 검토"""
    issues = []

    # 1. Eligibility
    if "eligibility" not in protocol:
        issues.append("Eligibility criteria not specified")

    # 2. Treatment strategies
    if "strategies" not in protocol or len(protocol["strategies"]) < 2:
        issues.append("At least 2 treatment strategies must be defined")

    # 3-4. Time zero alignment
    if "time_zero" not in protocol:
        issues.append("Time zero must be explicitly defined")
    elif "eligibility_at_time_zero" not in protocol.get("alignment", {}):
        issues.append("WARNING: eligibility_at_time_zero not verified — "
                       "immortal time bias risk")

    # 5. Outcomes
    if "outcomes" not in protocol:
        issues.append("Outcome definition missing")

    # 6. Causal contrast
    valid_contrasts = ["ITT", "PP", "ATE", "ATT", "ATC", "LATE"]
    if protocol.get("contrast") not in valid_contrasts:
        issues.append(f"Causal contrast must be one of {valid_contrasts}")

    # 7. Analysis plan
    if "analysis" not in protocol:
        issues.append("Analysis plan missing")
    elif "method" not in protocol["analysis"]:
        issues.append("Analysis method not specified")

    # 8. Adherence
    if "adherence" not in protocol:
        issues.append("Adherence definition missing — needed for PP analysis")

    return {
        "valid": len(issues) == 0,
        "issues": issues,
        "n_eligible": len(data) if "eligibility" in protocol else None,
    }

# === 사용 예시 ===
nhefs_protocol = {
    "eligibility": "1971-75 cigarette smokers, age 25-74",
    "strategies": {
        "g1": "Quit by 1982",
        "g0": "Continue through 1982"
    },
    "time_zero": "1971-75 baseline",
    "alignment": {
        "eligibility_at_time_zero": True,
        "treatment_at_time_zero": True
    },
    "outcomes": {"primary": "1982 weight change"},
    "contrast": "PP",
    "analysis": {
        "method": "IPW MSM + g-formula + DR ML",
        "covariates": "9 baseline variables",
        "sensitivity": "E-value, multiple specs"
    },
    "adherence": "Sustained quit/smoke 1971-82"
}

# (data 변수는 NHEFS 데이터)
# validation = validate_target_trial(nhefs_protocol, data)
# print(json.dumps(validation, indent=2, ensure_ascii=False))

print("=== Target Trial Protocol Checklist ===")
for k, v in nhefs_protocol.items():
    print(f"{k}: {v}")

12 한 줄 요약

Target Trial Framework 가 모든 인과 질문 (단일 시점, 시간변동, mediation, comparative effectiveness) 의 통합 표현. 다양한 도구 (g-method, IV, DiD, RDD, DR ML) 가 framework 의 emulation 도구. 21 세기 의학·통계학·산업의 인과 분석 lingua franca — NEJM, FDA, Cochrane 등이 표준 채택. Hernan & Robins (2016) 의 framework 가 1986 년 Robins 의 g-formula 부터 30+ 년 발전 의 정점. ML + Causal Inference 결합 (DDML, TMLE, RL+Target Trial) 이 향후 발전. What-If 질문 은 모든 의사결정의 본질 — Causal Inference 가 결정 과학의 표준 도구.

13 관련 주제

선행 지식

후속 주제

Causal Mediation — Ch.23 (마지막 챕터)

다른 카테고리 연결