Kwangmin Kim - Target Trial Emulation

1 개요

Ch.21 까지의 모든 도구는 분석 도구 — IPW, g-formula, g-estimation. Ch.22 는 프레임워크 — 관찰 분석의 설계 자체를 명확히 하는 방법.

Target Trial Emulation (Hernán & Robins 2016) 은 관찰 데이터 분석을 가상 무작위 시험 으로 번역하는 framework. 이 가상 시험의 protocol 을 명시적으로 작성하고, 관찰 데이터의 분석을 그 protocol 에 align. 흔한 분석 오류 (immortal time bias, prevalent user bias, time zero 미정의) 를 자동 회피.

직관 — Framework 의 가치: 도구 (g-method) 가 어떻게 분석할지 결정. Framework 가 무엇 분석할지 명시. Target trial 을 명시 안 한 분석은 답이 모호 — 같은 데이터에서 다른 인과 질문 가능.

정의: Target Trial Emulation

Target Trial: 답하고 싶은 인과 질문에 대한 가상 무작위 시험. 명시적 protocol 작성.

Emulation: 관찰 데이터의 분석을 target trial 의 protocol 에 최대한 align. 가능한 모든 component (eligibility, time zero, treatment strategies, outcomes, causal contrast) 명시.

핵심 8 components: 1. Eligibility criteria. 2. Treatment strategies (정의). 3. Treatment assignment 절차. 4. Time zero (start of follow-up). 5. Outcome 정의. 6. Causal contrast (ITT, per-protocol, etc.). 7. 분석 계획 (g-method 등). 8. Adherence 정의.

직관 — 8 components 의 의미: 무작위 시험의 protocol document 를 작성하듯이 명시적. “이 데이터로 ATT 를 추정합니다” 같은 모호한 진술 → “Target trial 은 X 인구에 대해 baseline 에 strategy Y 무작위 배정 후 5 년 사망 추적, intention-to-treat effect 추정” 같은 완전한 protocol.

2 5 개 소챕터의 흐름

소챕터	핵심 질문	답
22.1	ITT vs Per-protocol?	두 인과량 + RCT 의 적용
22.2	Sustained strategy 의 target trial?	시점 sequence 의 protocol
22.3	관찰 데이터 emulation?	Hernán & Robins 의 framework
22.4	Time zero 의 중요성?	Immortal time bias 회피
22.5	What-If 질문의 통합 접근?	Target trial = unified frame

3 핵심 개념 5 가지

3.1 1. ITT vs Per-Protocol Effect (22.1)

두 인과 effect

Intention-to-Treat (ITT): 무작위 배정 의 효과. - \(\mathrm{E}[Y^{Z=1}] - \mathrm{E}[Y^{Z=0}]\). - \(Z\) = 배정 indicator. - 비순응 무관 — 배정 자체가 처치.

Per-Protocol: 무작위 처치 의 효과 (모두 순응 시). - \(\mathrm{E}[Y^{a=1}] - \mathrm{E}[Y^{a=0}]\) 또는 \(\mathrm{E}[Y^{Z=1, a=1}] - \mathrm{E}[Y^{Z=0, a=0}]\). - 비순응 보정 — observational analysis 필요. - 일반적으로 미관측 confounder 위험.

→ ITT 가 RCT 의 표준 분석, per-protocol 은 추가 분석.

직관 — ITT 의 강점: 무작위 배정 → confounding 자동 보장. 분석 단순. Conservative — 비순응 으로 인한 attenuation.

직관 — Per-protocol 의 가치: “약 먹으면 효과 얼마?” 는 의사·환자에게 더 의미. ITT 는 “약 먹어보라고 권하면 효과 얼마?” — 정책 효과. 결정자에 따라 도구 선택.

3.2 2. ITT 의 흔한 오해 (22.1, Fine Point 22.4)

ITT 가 보수적이지 않은 사례

오해: “ITT 효과는 항상 per-protocol 보다 0 방향 (보수적).”

진실: 다음 경우 반대 가능: - Head-to-head trial (활성 처치 vs 활성 처치) 에서 한쪽 비순응 더 크면 ITT 가 더 강한 효과 로 나옴. - 비단조 효과 (일부에 음·일부에 양) + 높은 비순응.

예시 (Hernan): 새 약 vs 이부프로펜 비교. 두 약 모두 효과 같음. 그러나 새 약은 부작용 적어 순응 높음 → ITT 가 새 약 더 좋다 잘못 결론. 실제 per-protocol 효과 같음.

직관 — Head-to-head 의 함정: 제약 회사가 자사 약물의 작은 advantage 를 ITT 로 과장 가능. 비순응 차이가 진짜 효과 차이 모방. Conservative 가정이 거짓 — 분석가의 인식 필수.

직관 — Effectiveness vs Efficacy: 흔히 ITT = “real-world effectiveness”, per-protocol = “perfect adherence efficacy”. 그러나 Hernan 비판: ITT 도 그 시험의 비순응 패턴에만 의존, 실제 적용 환경의 효과 아님.

3.3 3. Sustained Treatment Strategies (22.2)

Time-Varying Strategy 의 ITT vs Per-Protocol

ITT for sustained strategy: - \(\mathrm{E}[Y^{z=1, \bar{c}=\bar{0}}] - \mathrm{E}[Y^{z=0, \bar{c}=\bar{0}}]\). - \(z\) = baseline 배정 (\(g_1\) vs \(g_0\)). - 매 시점 비순응 가능 — \(A_k \neq z\).

Per-Protocol for sustained: - \(\mathrm{E}[Y^{g_1, \bar{c}=\bar{0}}] - \mathrm{E}[Y^{g_0, \bar{c}=\bar{0}}]\). - 모든 시점 strategy 따름 가정. - G-method 필요 (Ch.21 의 도구).

직관 — Sustained 의 비순응 누적: \(K=60\) 시점에서 매 시점 비순응 5% → 60 시점 모두 순응할 확률 \(0.95^{60} \approx 5\%\). ITT 는 비순응 환자 모두 포함 → 효과 심하게 희석. Per- protocol 이 결정자에게 의미 있을 때 많음.

직관 — G-method 의 결정적 역할: Per-protocol 추정 시 매 시점 비순응 확률 모형 필요 → IPW. 결과 모형 → g-formula. Ch.21 의 도구 없으면 per-protocol 추정 불가.

3.4 4. Eligibility, Time Zero, Treatment Strategies (22.2-22.3)

Time Zero 의 결정적 중요성

Time Zero = follow-up 시작 시점. 매 환자에 대해 명확히 정의.

흔한 오류: - Eligibility met 시점 ≠ time zero (시점 정의 모호). - Time zero 후 처치 결정이 immortal time bias 만듬. - 처치 시작 전 사망한 환자 자동 비처치 그룹에 → 처치 그룹이 불공정 advantage.

Hernán & Robins 의 권장: - Time zero 명확 정의 (eligibility met + 처치 결정 + outcome 추적 시작 모두 동시). - 만약 동시 안 되면 treatment-confounder feedback 의 일종 — g-method 필요.

직관 — Immortal Time Bias 의 의학 사례: 1980 년대 폐 이식 환자 분석. 이식 받은 그룹의 생존율 더 높음. 이유: 이식까지 살아 있어야 받을 수 있음 — 살아 있음의 면역성 (immortal time). 처치 시작 시점을 time zero 로 정의하지 않으면 자동 편향. Target trial framework 의 eligibility = time zero 원칙이 이 오류 회피.

직관 — Hernan 의 강조: “Bad analyses are typically those that fail to align eligibility, treatment assignment, and start of follow-up.” Target trial framework 의 8 components 가 이 alignment 강제.

3.5 5. What-If 질문의 Unified 접근 (22.5)

Target Trial Framework 의 통합

거의 모든 인과 분석을 target trial 로 표현 가능:

단일 시점 처치 (Part I-II): \(K = 0\) 의 target trial.
시간변동 처치 (Part III): \(K \geq 1\) 의 target trial.
Mediation 분석 (Ch.23): 매개자 + 처치의 결합 target trial.
Comparative effectiveness research: 두 처치의 head-to-head target trial.

→ Target trial framework 가 모든 인과 질문의 표준 표현.

→ Hernán & Robins (2016) 의 framework 가 21 세기 인과 분석의 표준이 됨.

직관 — Framework 의 통합력: 다양한 분석을 같은 언어 로 표현. 의학자, 통계학자, 데이터 사이언티스트 모두 같은 framework — 협업 + 검토 표준. 인과 분석의 lingua franca.

직관 — 향후 표준화: 의학 저널의 RECORD-PE 같은 보고 표준이 target trial framework 따름. 2020 년 이후 임상 역학 연구의 표준 도구. Hernan, Hernández-Díaz 의 강력한 영향.

4 NHEFS 사례에 Target Trial 적용

NHEFS 의 Target Trial 명시

Target Trial (Ch.12-13 의 NHEFS 분석을 명시화):

Eligibility: 1971-75 baseline 흡연자 (cigarette/day > 0), 25-74 세, 9 변수 측정 가능.
Treatment strategies:
- \(g_1\): 1971-75 baseline 부터 1982 까지 흡연 중단 유지.
- \(g_0\): 1971-75 부터 1982 까지 흡연 계속.
Treatment assignment: 무작위 배정 (가상). 실제는 환자 자기 선택.
Time zero: 1971-75 baseline 측정 시점.
Outcome: 1982 체중 변화 (체중\(_{1982}\) - 체중\(_{1971-75}\)).
Causal contrast: ATE = \(\mathrm{E}[Y^{g_1}] - \mathrm{E}[Y^{g_0}]\).
분석 계획: g-formula 또는 IPW MSM.
Adherence: 1982 까지 strategy 유지.

관찰 분석의 align: - Eligibility = time zero = treatment assignment (baseline 흡연자가 baseline 에 정의). - Treatment 정의: “1971-1982 사이 금연” (이항 단순화). - Per-protocol effect 추정 (실제로는 단일 시점이라 ITT vs PP 차이 없음).

직관 — NHEFS 의 단순화: 단일 시점 처치라 target trial 의 복잡성 적음. 진짜 시간변동 처치 (시점별 흡연 행동 추적) 의 NHEFS 분석은 target trial framework 가 더 본질적. Hernan 의 책 사례는 단순화된 시연.

5 Immortal Time Bias 의 정확한 메커니즘

Immortal Time Bias 사례 분석

시나리오: 약물 X 의 사망 효과 분석.

Bad Design: “약물 X 받은 환자 vs 안 받은 환자” 비교. - 처치 환자 정의: 시험 기간 어느 시점이라도 X 받음. - 비처치 환자 정의: 그 외.

문제: - 처치 시작 전 사망한 환자 → 자동 비처치 그룹. - 처치 그룹은 처치 시작까지 생존 한 환자만 — immortal time.

결과: 처치 그룹의 생존율 부풀려짐 — 처치가 효과 있는 듯 보임.

Target Trial 적용: Time zero = 처치 결정 시점. 매 환자의 처치 결정 시점부터 추적 시작. \(\to\) Immortal time bias 자동 회피.

직관 — 의학 분석의 흔한 오류: 1990-2000 년대 의학 저널 논문의 흔한 분석 오류. EHR 데이터 의 retrospective 분석에서 발생. Target trial framework 도입 후 체계적 회피.

직관 — Survival bias 의 한 형태: “처치 받았던 환자 = 처치까지 살아 있던 환자”. Selection on survival → bias. Target trial 의 prospective frame 이 이 selection 회피.

6 ITT vs Per-Protocol 의 도구 비교

분석	RCT	관찰 데이터
ITT	단순 비교 (무작위 보장)	거의 불가능 (배정 미관측)
Per-Protocol	g-method 필요	g-method 필요
Modified ITT (assigned + initiated)	부분 — selection bias 위험	Initiator analysis (Ch.20.5 의 new-user)
As-treated	g-method 필요	g-method 필요
On-treatment	부분 — selection on adherence	g-method 필요

직관 — 관찰 데이터의 ITT 한계: 관찰 연구에는 배정 자체가 없음. 환자가 자기 결정. ITT 의 RCT 강점 (무작위) 이 관찰에서 없음. 관찰 분석은 본질적으로 per-protocol 비슷.

직관 — Modified ITT 의 위험: “Initiator only” 분석. Time zero 까지 비처치 → 처치 시작 → 추적. New-user design (Ch.20.5) 와 같음. Strict ITT 보다 selection 편향 위험.

7 응용 분야

임상 약물 효과 분석 (Comparative Effectiveness Research): EHR 데이터의 target trial emulation
HIV/AIDS Cohort 분석: ART 시작 전략 비교
종양학: 항암제 sequence 의 efficacy 분석
공중보건 정책 평가: 정책 효과의 target trial framework
마케팅 attribution: 캠페인 효과의 target trial 명시
A/B 테스트 보정 분석: 비순응 처리의 ITT vs PP

8 후속 글로 이어지는 다리

글	다루는 내용
21-1	22.1 + 22.2 — ITT vs PP 정의 + Sustained strategies
21-2	22.3 + 22.4 — Emulation 절차 + Time zero (immortal time bias)
21-3	22.5 — What-If 질문의 통합

9 코드 미리보기 — Target Trial Protocol 작성

# Target Trial Protocol Document Template

target_trial_protocol = {
    "eligibility": {
        "criteria": "1971-75 baseline cigarette smokers, age 25-74, "
                    "complete data on 9 covariates",
        "exclusion": "Prior cancer diagnosis, missing baseline weight"
    },
    "treatment_strategies": {
        "g1": "Quit smoking by 1982 (sustained quit)",
        "g0": "Continue smoking until 1982"
    },
    "assignment": "Random (target trial); self-selection (observational)",
    "time_zero": "1971-75 baseline visit",
    "outcomes": {
        "primary": "Weight change kg (1982 - baseline)",
        "secondary": "All-cause mortality 1982-1992"
    },
    "causal_contrast": "Per-protocol ATE: E[Y^g1] - E[Y^g0]",
    "analysis_plan": {
        "method": "Multiple g-methods (IPW, g-formula, DR)",
        "covariates": "9 baseline variables (Hernan Ch.12)",
        "sensitivity": "E-value, multiple specifications"
    },
    "adherence": "Sustained quit/smoke status from 1971-75 to 1982"
}

# Observational data alignment
observational_alignment = {
    "eligibility_time_zero": "1971-75 baseline = eligibility check + time zero",
    "treatment_definition": "1971-1982 quit indicator",
    "missing_data": "Excluded 63 with missing 1982 weight",
    "g_method": "IPW logistic with stabilization, bootstrap CI"
}

# Print as protocol document
import json
print(json.dumps(target_trial_protocol, indent=2, ensure_ascii=False))

10 한 줄 요약

Target Trial Emulation (Hernán & Robins 2016) 은 관찰 분석을 가상 무작위 시험 으로 명시 표현 하는 framework — 8 components 의 protocol 작성 + 관찰 데이터 align. ITT (배정 효과) vs Per- Protocol (처치 효과) 의 정확한 정의 — 비순응 처리에서 결정적 차이. Sustained strategy 의 ITT 는 시간변동 비순응 누적으로 noninformative. Time zero 의 명확 정의로 immortal time bias 회피. Hernán & Robins (2016) 의 framework 가 21 세기 인과 분석의 표준 — 의학·정책·마케팅의 인과 분석 공통 언어.

11 관련 주제

선행 지식

후속 주제

다른 카테고리 연결