1 정의
무작위 배정 \(Z\) 의 효과 — 배정 이후 환자 결정 무관:
\[\mathrm{ATE}_\text{ITT} = \mathrm{E}[Y^{Z=1}] - \mathrm{E}[Y^{Z=0}]\]
또는 위험비: \[\text{ITT RR} = \frac{\Pr(Y=1 | Z=1)}{\Pr(Y=1 | Z=0)}\]
RCT 에서는 무작위 배정 → confounding 자동 보정 → 단순 비교가 ITT.
무작위 처치 \(A\) 의 효과 — 모두 배정대로 처치 받았을 때:
\[\mathrm{ATE}_\text{PP} = \mathrm{E}[Y^{a=1}] - \mathrm{E}[Y^{a=0}]\]
또는 sustained strategy 의 경우: \[\mathrm{ATE}_\text{PP} = \mathrm{E}[Y^{g_1}] - \mathrm{E}[Y^{g_0}]\]
비순응 보정 필요 — observational analysis 의 도구 (IPW, g-formula, IV).
직관 — ITT 의 핵심: “이 처치를 권하면 효과 얼마?” 의 답. 배정 이후 환자가 안 따라도 ITT 는 변하지 않음. 정책 결정자에게 의미 — 정책 적용 시 비순응 포함된 효과.
직관 — PP 의 핵심: “이 처치를 받으면 효과 얼마?” 의 답. 의사·환자에게 의미 — “약 먹을지 결정”. 비순응자 데이터에서는 추정 어려움 → IV 또는 g-method 필요.
2 22.1 ITT vs Per-Protocol — 자세히
2.1 RCT 의 ITT 의 강점
No confounding: \(Z\) 가 무작위 배정 → \(Y^z \perp\!\!\!\perp Z\). 단순 비교 = ITT 효과.
Conservative under null: 진짜 처치 효과 0 일 때 ITT 도 0 (sharp null preservation under exclusion restriction).
Real-world reflection: 비순응 패턴이 실제 임상 의 비순응 패턴과 비슷하면 ITT = real- world effectiveness.
분석 단순: 배정 indicator 만 사용 → 표준 통계 도구로 충분.
→ FDA, EMA 등 규제 기관이 ITT 를 주 분석으로 요구.
직관 — Regulatory 의 ITT 우선: 의약품 승인 의사결정자가 “이 약을 시장에 내놓으면 평균 효과 얼마?” 알고 싶음 — ITT 가 답. PP 는 “이상적 환경” 의 효과 — 정책 결정에 부적합.
직관 — Conservative 의 직관: 비순응으로 인한 attenuation — 처치 그룹 일부가 실제로 처치 안 받음 → 평균 효과 희석. ITT 는 진짜 처치 효과보다 0 방향 으로. 반대 방향 (overestimate) 위험 작음.
2.2 ITT 의 보수성 가정 실패 (Fine Point 22.4)
Hernan 의 사례 (Robins 1998b):
새 약 vs 이부프로펜 비교 무작위 시험. 두 약 진짜 효과 동일. 그러나: - 새 약: 부작용 적음 → 95% 순응. - 이부프로펜: 가벼운 부작용 → 70% 순응.
ITT 결과: - 새 약 그룹: 95% 가 처치 받음 → 평균 효과 0.95 × (진짜 효과). - 이부프로펜 그룹: 70% 가 처치 받음 → 평균 효과 0.70 × (진짜 효과). - ITT RR: 0.95 / 0.70 > 1 → “새 약이 이부프로펜보다 효과 큼” 잘못 결론.
진짜 PP RR = 1.0 — 두 약 동일.
→ Head-to-head trial + 다른 비순응 패턴 = ITT 의 비보수적 결과.
직관 — Head-to-head 의 함정: Placebo vs 활성 처치는 ITT 의 보수성 비교적 견고. 두 활성 처치 비교는 비순응 차이 가 효과 차이 모방 위험. 제약 회사의 marketing trick 으로 활용 가능.
직관 — Non-monotonic 처치 효과: 일부 환자에게 + 효과, 일부에 - 효과. 비순응 패턴이 부정적 효과 환자에 집중 되면 ITT 의 양 효과가 과대 추정. Effect modification 의 ITT 영향.
2.3 Naive Per-Protocol Analyses (Fine Point 22.3)
(1) As-Treated 분석: - “받은 처치 (\(A\)) 별 결과 비교” — 배정 (\(Z\)) 무시. - 만약 비순응이 환자 prognosis 의존이면 confounding. - 일반적으로 편향.
(2) On-Treatment (Conventional Per-Protocol) 분석: - “Per-protocol population” (\(A = Z\) 인 환자만) 에서 비교. - Selection on \(A = Z\) → selection bias. - DAG: \(Z \to A \leftarrow L\) 의 collider \(A\) 보정 효과. - 일반적으로 편향.
→ 두 분석 모두 적절한 confounder 보정 + g-method 없이 PP 효과 추정 불가.
→ Hernán & Hernández-Díaz (2012) 의 강력한 비판.
직관 — Naive PP 의 흔함: 의학 저널 논문의 흔한 분석. “Per-protocol analysis 결과: …” 라고 보고하지만 실제로는 naive on-treatment. 분석가의 인식 부족 + 도구 misuse.
직관 — 정확한 PP 분석: Confounder \(L\) 측정 + IPW 또는 g-formula 적용. 단일 시점 처치는 Ch.12-15 도구. 시간변동은 Ch.21 도구. 단순 비교 X — 본격 g-method.
2.4 Pseudo-ITT 와 Modified ITT (Fine Point 22.2)
Pseudo-ITT: - Loss to follow-up 으로 outcome 미관측 환자 제외 → uncensored 환자만 분석. - \(\Pr(Y=1 | Z=1, C=0) / \Pr(Y=1 | Z=0, C=0)\). - Censoring 이 informative 면 selection bias. - 진짜 ITT 추정 안 됨.
Modified ITT: - 처치 시작 한 환자만 분석 (예: at least one pill). - 단일 시점 처치는 OK (모든 baseline 환자 시작). - 시간변동 처치는 selection 위험 — initiator 가 prognosis 다름.
직관 — Pseudo-ITT 의 흔한 함정: Loss to follow-up 가 처치 의존 이면 (예: 부작용으로 처치 그룹 dropout 더 많음) 분석에 systematic bias. IPW for censoring + ITT 가 정확한 절차.
직관 — Modified ITT 의 의미: “Initiator analysis” 와 동일. New-user design (Ch.20.5) 의 형태. Single-time point 에서는 통상적, time-varying 에서는 first-time initiation 의 selection 위험.
3 22.2 Sustained Treatment Strategies 의 Target Trial
3.1 시간변동 처치의 ITT 정의
HIV 시험 사례: - \(K + 1 = 60\) 시점 추적. - \(g_1\): continuous ART. - \(g_0\): no ART. - \(Z = 1\) if assigned \(g_1\), \(Z = 0\) if \(g_0\).
ITT 효과 (시점 \(k\) 의 사망 위험): \[\Pr(D_k^{z=1, \bar{c}=\bar{0}} = 1) - \Pr(D_k^{z=0, \bar{c}=\bar{0}} = 1)\]
= “\(g_1\) 배정받고 + 모든 시점 censoring 안 됐다면 사망 위험” - “\(g_0\) 배정 + 비순응” 차이.
→ 비순응 무관, 배정 자체의 효과.
직관 — Time-varying ITT 의 noninformativeness: 60 시점 비순응 누적되면 처치 그룹의 실제 처치율 매우 낮음. ITT 효과 = 희석된 진짜 효과의 작은 부분. 정책 결정에 과소 추정.
3.2 시간변동 처치의 Per-Protocol 정의
PP 효과: \[\Pr(D_k^{g_1, \bar{c}=\bar{0}} = 1) - \Pr(D_k^{g_0, \bar{c}=\bar{0}} = 1)\]
= “모든 환자가 \(g_1\) 따랐다면” - “\(g_0\) 따랐다면” 차이.
Dynamic strategies 의 자연성: - \(g_1\) = “ART 받음, but 부작용 발생 시 중단”. - 정적 strategy “무조건 ART 받음” 은 비현실적. - Per-protocol 정의 시 dynamic strategy 가 임상 자연.
→ Per-protocol effect 추정에 g-method 필수.
직관 — Dynamic Per-Protocol 의 의미: 의학 가이드라인은 “약 먹어, but 부작용 시 중단” 식의 dynamic strategy. PP effect 가 의미 있으려면 dynamic strategy 명시. Static “always treat” 은 비현실적 + 임상 가이드라인과 무관.
직관 — 60 시점 PP 추정의 어려움: 매 시점 strategy 따른 환자만 순응자. 60 시점 후 모두 순응할 확률 매우 낮음. G-method 가 가상 모집단 (모두 순응) 의 결과 추정. g-formula·IPW MSM 의 진가.
3.3 Target Trial Protocol — 8 Components
HIV ART 시험 protocol:
- Eligibility: HIV 감염자, 18 세+, AIDS 안 진단, 이전 ART 미사용.
- Treatment strategies:
- \(g_1\): 60 개월 동안 continuous ART (부작용 시 중단).
- \(g_0\): 60 개월 동안 no ART.
- Treatment assignment: Baseline 1:1 무작위 배정.
- Time zero: Baseline 무작위 시점.
- Outcomes: 60 개월 사망 (primary), CD4 추이 (secondary).
- Causal contrast: ITT + Per-Protocol.
- 분석 계획: ITT (단순 비교), PP (IPW MSM + g-formula).
- Adherence: 매 시점 ART 처방 + 복용 확인.
Observational emulation 의 align: - Eligibility: HIV 코호트의 ART naive 환자. - Time zero: 첫 진료 시점. - Strategy: 측정된 ART 처방 history 와 비교. - Causal contrast: PP only (배정 미관측).
직관 — Protocol document 의 가치: 모든 분석 결정을 명시. 분석 변경 시 protocol 도 수정. Reproducibility + transparency 의 표준 도구. 인과 분석의 pre-registration.
4 Per-Protocol 의 도구 (Ch.21 의 적용)
(1) IPW MSM: - 매 시점 비순응 가중치 곱. - 가중 logistic hazard 모형. - Counterfactual survival 도출.
(2) Parametric G-Formula: - 시점별 covariate 분포 모형. - 모든 환자가 strategy 따른 가상 시뮬레이션. - Monte Carlo 평균.
(3) G-Estimation (SNMM): - Sequential structural nested model. - Semiparametric — covariate effect nuisance. - 시점별 g-test.
Doubly Robust 결합으로 robust 추정.
직관 — Ch.21 도구가 곧 PP 도구: Target Trial framework + Ch.21 g-method = sustained PP 분석. Hernan 의 framework 가 도구를 통합.
직관 — RCT 의 PP 도 g-method: 무작위 시험에서도 비순응 → PP 추정에 g-method. RCT 가 ITT 만 보장, PP 는 관찰 분석과 같은 도구 필요. Hernán & Robins (2017) 의 강조.
5 RCT vs Observational 의 ITT vs PP
| 분석 | RCT | Observational |
|---|---|---|
| ITT | 단순 비교 (단일 점추정) | 거의 불가능 (배정 미관측) |
| Modified ITT (initiator) | 단순 + g-method (censoring) | g-method (PS, IPW) |
| As-treated | g-method | g-method |
| On-treatment | g-method | g-method |
| Per-Protocol (g-method) | g-method | g-method |
직관 — 관찰 분석 = 항상 PP-like: 관찰 데이터에는 배정 자체가 없음. 분석은 항상 처치 기반. ITT 의 RCT 강점이 적용 안 됨. 관찰 분석은 본질적으로 confounder 보정 필요.
6 Per-Protocol 추정의 NHEFS 사례
NHEFS 의 흡연 중단 효과: - Target Trial: “1971-75 baseline 흡연자 → 1982 까지 금연 vs 흡연 계속 의 체중 효과”. - Eligibility = Time Zero = Treatment assignment (baseline 동시). - 단일 시점 처치 (1971-1982 사이 금연 여부, 이항). - ITT vs PP 차이 무관 (assignment = treatment in single-point study).
Ch.12-15 의 분석이 본질적으로 PP analysis: - IPW MSM: 3.4 kg. - 표준화: 3.5 kg. - G-estimation: 3.4 kg. - 다섯 도구의 일치 → robust per-protocol estimate.
→ NHEFS 의 단일 시점 처치는 ITT/PP 구별 무의미. Time-varying 데이터에서 본질적.
직관 — NHEFS 가 단일 시점 PP 의 표준 사례: Hernan 책의 NHEFS 분석이 단순화된 per-protocol 분석. 진짜 시간변동 PP (HIV 코호트의 ART) 분석은 더 복잡한 g-method 적용. NHEFS 가 도구 학습용, 진짜 응용은 시간변동 코호트.
7 응용 분야
- 임상 시험 비순응 처리: ITT primary + PP sensitivity
- 종양학 SMART trial: 시간변동 strategy 의 PP 분석
- HIV/AIDS Cohort: 관찰 데이터의 ART per-protocol 효과
- 약물 안전성 (PV): 비순응 보정의 부작용 효과
- 마케팅 attribution: 캠페인 sequence 의 PP 효과
8 코드 — RCT 의 ITT vs PP 시뮬레이션
import pandas as pd
import numpy as np
import statsmodels.formula.api as smf
# === RCT 시뮬레이션 with non-adherence ===
np.random.seed(42)
n = 5000
# 무작위 배정
Z = np.random.binomial(1, 0.5, n)
# 비순응 — Z=0 그룹 일부가 처치 받음 (15%), Z=1 일부 안 받음 (10%)
A = np.where(Z == 1, np.random.binomial(1, 0.9, n), np.random.binomial(1, 0.15, n))
# 진짜 처치 효과 = -2 (사망 위험 감소)
Y = 0.5 - 0.2 * A + np.random.normal(0, 1, n)
df = pd.DataFrame({"Z": Z, "A": A, "Y": Y})
# === ITT 분석 ===
itt = df[df.Z==1].Y.mean() - df[df.Z==0].Y.mean()
print(f"=== ITT Analysis ===")
print(f"ITT effect: {itt:.3f} (진짜 처치 효과 -0.20, ITT 가 attenuated)")
# === Naive As-Treated ===
at = df[df.A==1].Y.mean() - df[df.A==0].Y.mean()
print(f"\n=== As-Treated (naive) ===")
print(f"As-treated: {at:.3f} — 만약 비순응 confounded 면 편향")
# === Conventional Per-Protocol (per-protocol population) ===
pp_pop = df[df.Z == df.A]
pp_naive = pp_pop[pp_pop.Z==1].Y.mean() - pp_pop[pp_pop.Z==0].Y.mean()
print(f"\n=== Naive Per-Protocol ===")
print(f"Naive PP: {pp_naive:.3f} — selection bias 위험")
# === IV (PP estimate via Wald) ===
itt_num = df[df.Z==1].Y.mean() - df[df.Z==0].Y.mean()
itt_denom = df[df.Z==1].A.mean() - df[df.Z==0].A.mean()
iv_pp = itt_num / itt_denom
print(f"\n=== IV-based Per-Protocol ===")
print(f"Wald IV (PP): {iv_pp:.3f} (진짜 처치 효과 -0.20)")
# === Modified ITT (initiator only) ===
init_only = df[df.A == df.Z] # 배정대로 시작한 환자만
mitt = init_only[init_only.Z==1].Y.mean() - init_only[init_only.Z==0].Y.mean()
print(f"\n=== Modified ITT (initiator only) ===")
print(f"Modified ITT: {mitt:.3f}")
print("\n--- 비교 ---")
print(f"진짜 처치 효과: -0.20")
print(f"ITT (보수적): {itt:.3f}")
print(f"As-Treated (편향): {at:.3f}")
print(f"Naive PP (편향): {pp_naive:.3f}")
print(f"IV PP (정확): {iv_pp:.3f}")9 한 줄 요약
ITT (배정 효과) vs Per-Protocol (처치 효과) 의 정확한 정의 — 비순응 처리에서 결정적 차이. RCT 의 ITT 가 표준 (no confounding) 이지만 head-to-head trial + 다른 비순응 패턴에서 비보수적 결과 가능. Naive PP (as-treated, on-treatment) 분석은 selection bias — g-method 또는 IV 필요. Sustained strategy 의 ITT 는 시간변동 비순응 누적으로 noninformative — PP + g-method 필수. Hernan & Robins 의 강조: PP effect 가 의사·환자에게 의미, ITT 가 정책 결정자에게 의미. NHEFS 는 단일 시점이라 ITT/PP 구별 무의미 — 진짜 응용은 시간변동 코호트.
10 관련 주제
선행 지식
후속 주제
다른 카테고리 연결