1 개요
Ch.21 까지의 모든 도구는 분석 도구 — IPW, g-formula, g-estimation. Ch.22 는 프레임워크 — 관찰 분석의 설계 자체를 명확히 하는 방법.
Target Trial Emulation (Hernán & Robins 2016) 은 관찰 데이터 분석을 가상 무작위 시험 으로 번역하는 framework. 이 가상 시험의 protocol 을 명시적으로 작성하고, 관찰 데이터의 분석을 그 protocol 에 align. 흔한 분석 오류 (immortal time bias, prevalent user bias, time zero 미정의) 를 자동 회피.
직관 — Framework 의 가치: 도구 (g-method) 가 어떻게 분석할지 결정. Framework 가 무엇 분석할지 명시. Target trial 을 명시 안 한 분석은 답이 모호 — 같은 데이터에서 다른 인과 질문 가능.
Target Trial: 답하고 싶은 인과 질문에 대한 가상 무작위 시험. 명시적 protocol 작성.
Emulation: 관찰 데이터의 분석을 target trial 의 protocol 에 최대한 align. 가능한 모든 component (eligibility, time zero, treatment strategies, outcomes, causal contrast) 명시.
핵심 8 components: 1. Eligibility criteria. 2. Treatment strategies (정의). 3. Treatment assignment 절차. 4. Time zero (start of follow-up). 5. Outcome 정의. 6. Causal contrast (ITT, per-protocol, etc.). 7. 분석 계획 (g-method 등). 8. Adherence 정의.
직관 — 8 components 의 의미: 무작위 시험의 protocol document 를 작성하듯이 명시적. “이 데이터로 ATT 를 추정합니다” 같은 모호한 진술 → “Target trial 은 X 인구에 대해 baseline 에 strategy Y 무작위 배정 후 5 년 사망 추적, intention-to-treat effect 추정” 같은 완전한 protocol.
2 5 개 소챕터의 흐름
| 소챕터 | 핵심 질문 | 답 |
|---|---|---|
| 22.1 | ITT vs Per-protocol? | 두 인과량 + RCT 의 적용 |
| 22.2 | Sustained strategy 의 target trial? | 시점 sequence 의 protocol |
| 22.3 | 관찰 데이터 emulation? | Hernán & Robins 의 framework |
| 22.4 | Time zero 의 중요성? | Immortal time bias 회피 |
| 22.5 | What-If 질문의 통합 접근? | Target trial = unified frame |
3 핵심 개념 5 가지
3.1 1. ITT vs Per-Protocol Effect (22.1)
Intention-to-Treat (ITT): 무작위 배정 의 효과. - \(\mathrm{E}[Y^{Z=1}] - \mathrm{E}[Y^{Z=0}]\). - \(Z\) = 배정 indicator. - 비순응 무관 — 배정 자체가 처치.
Per-Protocol: 무작위 처치 의 효과 (모두 순응 시). - \(\mathrm{E}[Y^{a=1}] - \mathrm{E}[Y^{a=0}]\) 또는 \(\mathrm{E}[Y^{Z=1, a=1}] - \mathrm{E}[Y^{Z=0, a=0}]\). - 비순응 보정 — observational analysis 필요. - 일반적으로 미관측 confounder 위험.
→ ITT 가 RCT 의 표준 분석, per-protocol 은 추가 분석.
직관 — ITT 의 강점: 무작위 배정 → confounding 자동 보장. 분석 단순. Conservative — 비순응 으로 인한 attenuation.
직관 — Per-protocol 의 가치: “약 먹으면 효과 얼마?” 는 의사·환자에게 더 의미. ITT 는 “약 먹어보라고 권하면 효과 얼마?” — 정책 효과. 결정자에 따라 도구 선택.
3.2 2. ITT 의 흔한 오해 (22.1, Fine Point 22.4)
오해: “ITT 효과는 항상 per-protocol 보다 0 방향 (보수적).”
진실: 다음 경우 반대 가능: - Head-to-head trial (활성 처치 vs 활성 처치) 에서 한쪽 비순응 더 크면 ITT 가 더 강한 효과 로 나옴. - 비단조 효과 (일부에 음·일부에 양) + 높은 비순응.
예시 (Hernan): 새 약 vs 이부프로펜 비교. 두 약 모두 효과 같음. 그러나 새 약은 부작용 적어 순응 높음 → ITT 가 새 약 더 좋다 잘못 결론. 실제 per-protocol 효과 같음.
직관 — Head-to-head 의 함정: 제약 회사가 자사 약물의 작은 advantage 를 ITT 로 과장 가능. 비순응 차이가 진짜 효과 차이 모방. Conservative 가정이 거짓 — 분석가의 인식 필수.
직관 — Effectiveness vs Efficacy: 흔히 ITT = “real-world effectiveness”, per-protocol = “perfect adherence efficacy”. 그러나 Hernan 비판: ITT 도 그 시험의 비순응 패턴에만 의존, 실제 적용 환경의 효과 아님.
3.3 3. Sustained Treatment Strategies (22.2)
ITT for sustained strategy: - \(\mathrm{E}[Y^{z=1, \bar{c}=\bar{0}}] - \mathrm{E}[Y^{z=0, \bar{c}=\bar{0}}]\). - \(z\) = baseline 배정 (\(g_1\) vs \(g_0\)). - 매 시점 비순응 가능 — \(A_k \neq z\).
Per-Protocol for sustained: - \(\mathrm{E}[Y^{g_1, \bar{c}=\bar{0}}] - \mathrm{E}[Y^{g_0, \bar{c}=\bar{0}}]\). - 모든 시점 strategy 따름 가정. - G-method 필요 (Ch.21 의 도구).
직관 — Sustained 의 비순응 누적: \(K=60\) 시점에서 매 시점 비순응 5% → 60 시점 모두 순응할 확률 \(0.95^{60} \approx 5\%\). ITT 는 비순응 환자 모두 포함 → 효과 심하게 희석. Per- protocol 이 결정자에게 의미 있을 때 많음.
직관 — G-method 의 결정적 역할: Per-protocol 추정 시 매 시점 비순응 확률 모형 필요 → IPW. 결과 모형 → g-formula. Ch.21 의 도구 없으면 per-protocol 추정 불가.
3.4 4. Eligibility, Time Zero, Treatment Strategies (22.2-22.3)
Time Zero = follow-up 시작 시점. 매 환자에 대해 명확히 정의.
흔한 오류: - Eligibility met 시점 ≠ time zero (시점 정의 모호). - Time zero 후 처치 결정이 immortal time bias 만듬. - 처치 시작 전 사망한 환자 자동 비처치 그룹에 → 처치 그룹이 불공정 advantage.
Hernán & Robins 의 권장: - Time zero 명확 정의 (eligibility met + 처치 결정 + outcome 추적 시작 모두 동시). - 만약 동시 안 되면 treatment-confounder feedback 의 일종 — g-method 필요.
직관 — Immortal Time Bias 의 의학 사례: 1980 년대 폐 이식 환자 분석. 이식 받은 그룹의 생존율 더 높음. 이유: 이식까지 살아 있어야 받을 수 있음 — 살아 있음의 면역성 (immortal time). 처치 시작 시점을 time zero 로 정의하지 않으면 자동 편향. Target trial framework 의 eligibility = time zero 원칙이 이 오류 회피.
직관 — Hernan 의 강조: “Bad analyses are typically those that fail to align eligibility, treatment assignment, and start of follow-up.” Target trial framework 의 8 components 가 이 alignment 강제.
3.5 5. What-If 질문의 Unified 접근 (22.5)
거의 모든 인과 분석을 target trial 로 표현 가능:
- 단일 시점 처치 (Part I-II): \(K = 0\) 의 target trial.
- 시간변동 처치 (Part III): \(K \geq 1\) 의 target trial.
- Mediation 분석 (Ch.23): 매개자 + 처치의 결합 target trial.
- Comparative effectiveness research: 두 처치의 head-to-head target trial.
→ Target trial framework 가 모든 인과 질문의 표준 표현.
→ Hernán & Robins (2016) 의 framework 가 21 세기 인과 분석의 표준이 됨.
직관 — Framework 의 통합력: 다양한 분석을 같은 언어 로 표현. 의학자, 통계학자, 데이터 사이언티스트 모두 같은 framework — 협업 + 검토 표준. 인과 분석의 lingua franca.
직관 — 향후 표준화: 의학 저널의 RECORD-PE 같은 보고 표준이 target trial framework 따름. 2020 년 이후 임상 역학 연구의 표준 도구. Hernan, Hernández-Díaz 의 강력한 영향.
4 NHEFS 사례에 Target Trial 적용
Target Trial (Ch.12-13 의 NHEFS 분석을 명시화):
- Eligibility: 1971-75 baseline 흡연자 (cigarette/day > 0), 25-74 세, 9 변수 측정 가능.
- Treatment strategies:
- \(g_1\): 1971-75 baseline 부터 1982 까지 흡연 중단 유지.
- \(g_0\): 1971-75 부터 1982 까지 흡연 계속.
- Treatment assignment: 무작위 배정 (가상). 실제는 환자 자기 선택.
- Time zero: 1971-75 baseline 측정 시점.
- Outcome: 1982 체중 변화 (체중\(_{1982}\) - 체중\(_{1971-75}\)).
- Causal contrast: ATE = \(\mathrm{E}[Y^{g_1}] - \mathrm{E}[Y^{g_0}]\).
- 분석 계획: g-formula 또는 IPW MSM.
- Adherence: 1982 까지 strategy 유지.
관찰 분석의 align: - Eligibility = time zero = treatment assignment (baseline 흡연자가 baseline 에 정의). - Treatment 정의: “1971-1982 사이 금연” (이항 단순화). - Per-protocol effect 추정 (실제로는 단일 시점이라 ITT vs PP 차이 없음).
직관 — NHEFS 의 단순화: 단일 시점 처치라 target trial 의 복잡성 적음. 진짜 시간변동 처치 (시점별 흡연 행동 추적) 의 NHEFS 분석은 target trial framework 가 더 본질적. Hernan 의 책 사례는 단순화된 시연.
5 Immortal Time Bias 의 정확한 메커니즘
시나리오: 약물 X 의 사망 효과 분석.
Bad Design: “약물 X 받은 환자 vs 안 받은 환자” 비교. - 처치 환자 정의: 시험 기간 어느 시점이라도 X 받음. - 비처치 환자 정의: 그 외.
문제: - 처치 시작 전 사망한 환자 → 자동 비처치 그룹. - 처치 그룹은 처치 시작까지 생존 한 환자만 — immortal time.
결과: 처치 그룹의 생존율 부풀려짐 — 처치가 효과 있는 듯 보임.
Target Trial 적용: Time zero = 처치 결정 시점. 매 환자의 처치 결정 시점부터 추적 시작. \(\to\) Immortal time bias 자동 회피.
직관 — 의학 분석의 흔한 오류: 1990-2000 년대 의학 저널 논문의 흔한 분석 오류. EHR 데이터 의 retrospective 분석에서 발생. Target trial framework 도입 후 체계적 회피.
직관 — Survival bias 의 한 형태: “처치 받았던 환자 = 처치까지 살아 있던 환자”. Selection on survival → bias. Target trial 의 prospective frame 이 이 selection 회피.
6 ITT vs Per-Protocol 의 도구 비교
| 분석 | RCT | 관찰 데이터 |
|---|---|---|
| ITT | 단순 비교 (무작위 보장) | 거의 불가능 (배정 미관측) |
| Per-Protocol | g-method 필요 | g-method 필요 |
| Modified ITT (assigned + initiated) | 부분 — selection bias 위험 | Initiator analysis (Ch.20.5 의 new-user) |
| As-treated | g-method 필요 | g-method 필요 |
| On-treatment | 부분 — selection on adherence | g-method 필요 |
직관 — 관찰 데이터의 ITT 한계: 관찰 연구에는 배정 자체가 없음. 환자가 자기 결정. ITT 의 RCT 강점 (무작위) 이 관찰에서 없음. 관찰 분석은 본질적으로 per-protocol 비슷.
직관 — Modified ITT 의 위험: “Initiator only” 분석. Time zero 까지 비처치 → 처치 시작 → 추적. New-user design (Ch.20.5) 와 같음. Strict ITT 보다 selection 편향 위험.
7 응용 분야
- 임상 약물 효과 분석 (Comparative Effectiveness Research): EHR 데이터의 target trial emulation
- HIV/AIDS Cohort 분석: ART 시작 전략 비교
- 종양학: 항암제 sequence 의 efficacy 분석
- 공중보건 정책 평가: 정책 효과의 target trial framework
- 마케팅 attribution: 캠페인 효과의 target trial 명시
- A/B 테스트 보정 분석: 비순응 처리의 ITT vs PP
8 후속 글로 이어지는 다리
| 글 | 다루는 내용 |
|---|---|
| 21-1 | 22.1 + 22.2 — ITT vs PP 정의 + Sustained strategies |
| 21-2 | 22.3 + 22.4 — Emulation 절차 + Time zero (immortal time bias) |
| 21-3 | 22.5 — What-If 질문의 통합 |
9 코드 미리보기 — Target Trial Protocol 작성
# Target Trial Protocol Document Template
target_trial_protocol = {
"eligibility": {
"criteria": "1971-75 baseline cigarette smokers, age 25-74, "
"complete data on 9 covariates",
"exclusion": "Prior cancer diagnosis, missing baseline weight"
},
"treatment_strategies": {
"g1": "Quit smoking by 1982 (sustained quit)",
"g0": "Continue smoking until 1982"
},
"assignment": "Random (target trial); self-selection (observational)",
"time_zero": "1971-75 baseline visit",
"outcomes": {
"primary": "Weight change kg (1982 - baseline)",
"secondary": "All-cause mortality 1982-1992"
},
"causal_contrast": "Per-protocol ATE: E[Y^g1] - E[Y^g0]",
"analysis_plan": {
"method": "Multiple g-methods (IPW, g-formula, DR)",
"covariates": "9 baseline variables (Hernan Ch.12)",
"sensitivity": "E-value, multiple specifications"
},
"adherence": "Sustained quit/smoke status from 1971-75 to 1982"
}
# Observational data alignment
observational_alignment = {
"eligibility_time_zero": "1971-75 baseline = eligibility check + time zero",
"treatment_definition": "1971-1982 quit indicator",
"missing_data": "Excluded 63 with missing 1982 weight",
"g_method": "IPW logistic with stabilization, bootstrap CI"
}
# Print as protocol document
import json
print(json.dumps(target_trial_protocol, indent=2, ensure_ascii=False))10 한 줄 요약
Target Trial Emulation (Hernán & Robins 2016) 은 관찰 분석을 가상 무작위 시험 으로 명시 표현 하는 framework — 8 components 의 protocol 작성 + 관찰 데이터 align. ITT (배정 효과) vs Per- Protocol (처치 효과) 의 정확한 정의 — 비순응 처리에서 결정적 차이. Sustained strategy 의 ITT 는 시간변동 비순응 누적으로 noninformative. Time zero 의 명확 정의로 immortal time bias 회피. Hernán & Robins (2016) 의 framework 가 21 세기 인과 분석의 표준 — 의학·정책·마케팅의 인과 분석 공통 언어.
11 관련 주제
선행 지식
후속 주제
- ITT vs PP + Sustained Strategy — Ch.22.1-22.2
- Emulation 절차 + Time Zero — Ch.22.3-22.4
- What-If 통합 — Ch.22.5
- Causal Mediation — Ch.23
다른 카테고리 연결