ITT vs Per-Protocol Effect와 Sustained Strategies

Hernan Ch.22.1~22.2 — 두 인과량의 정확한 정의 + 시간변동 처치의 target trial

Hernan & Robins (2020) Ch.22.1~22.2 를 다룬다. Intention-to-Treat (ITT) 와 Per-Protocol (PP) effect 의 정확한 정의, RCT 에서 두 도구의 강점·약점, ITT 의 흔한 오해 (보수성 가정의 실패), Sustained treatment strategies 의 target trial protocol, 시간변동 비순응의 누적 효과, pseudo-ITT, modified ITT, naive per-protocol 분석의 함정을 정리한다.

Experimentation
Causal Inference
저자

Kwangmin Kim

공개

2026년 05월 08일

1 정의

정의: Intention-to-Treat (ITT) Effect

무작위 배정 \(Z\) 의 효과 — 배정 이후 환자 결정 무관:

\[\mathrm{ATE}_\text{ITT} = \mathrm{E}[Y^{Z=1}] - \mathrm{E}[Y^{Z=0}]\]

또는 위험비: \[\text{ITT RR} = \frac{\Pr(Y=1 | Z=1)}{\Pr(Y=1 | Z=0)}\]

RCT 에서는 무작위 배정 → confounding 자동 보정 → 단순 비교가 ITT.

정의: Per-Protocol (PP) Effect

무작위 처치 \(A\) 의 효과 — 모두 배정대로 처치 받았을 때:

\[\mathrm{ATE}_\text{PP} = \mathrm{E}[Y^{a=1}] - \mathrm{E}[Y^{a=0}]\]

또는 sustained strategy 의 경우: \[\mathrm{ATE}_\text{PP} = \mathrm{E}[Y^{g_1}] - \mathrm{E}[Y^{g_0}]\]

비순응 보정 필요 — observational analysis 의 도구 (IPW, g-formula, IV).

직관 — ITT 의 핵심: “이 처치를 권하면 효과 얼마?” 의 답. 배정 이후 환자가 안 따라도 ITT 는 변하지 않음. 정책 결정자에게 의미 — 정책 적용 시 비순응 포함된 효과.

직관 — PP 의 핵심: “이 처치를 받으면 효과 얼마?” 의 답. 의사·환자에게 의미 — “약 먹을지 결정”. 비순응자 데이터에서는 추정 어려움 → IV 또는 g-method 필요.

2 22.1 ITT vs Per-Protocol — 자세히

2.1 RCT 의 ITT 의 강점

ITT 가 RCT 의 표준 분석인 이유
  1. No confounding: \(Z\) 가 무작위 배정 → \(Y^z \perp\!\!\!\perp Z\). 단순 비교 = ITT 효과.

  2. Conservative under null: 진짜 처치 효과 0 일 때 ITT 도 0 (sharp null preservation under exclusion restriction).

  3. Real-world reflection: 비순응 패턴이 실제 임상 의 비순응 패턴과 비슷하면 ITT = real- world effectiveness.

  4. 분석 단순: 배정 indicator 만 사용 → 표준 통계 도구로 충분.

FDA, EMA 등 규제 기관이 ITT 를 주 분석으로 요구.

직관 — Regulatory 의 ITT 우선: 의약품 승인 의사결정자가 “이 약을 시장에 내놓으면 평균 효과 얼마?” 알고 싶음 — ITT 가 답. PP 는 “이상적 환경” 의 효과 — 정책 결정에 부적합.

직관 — Conservative 의 직관: 비순응으로 인한 attenuation — 처치 그룹 일부가 실제로 처치 안 받음 → 평균 효과 희석. ITT 는 진짜 처치 효과보다 0 방향 으로. 반대 방향 (overestimate) 위험 작음.

2.2 ITT 의 보수성 가정 실패 (Fine Point 22.4)

ITT 가 보수적이지 않은 시나리오

Hernan 의 사례 (Robins 1998b):

새 약 vs 이부프로펜 비교 무작위 시험. 두 약 진짜 효과 동일. 그러나: - 새 약: 부작용 적음 → 95% 순응. - 이부프로펜: 가벼운 부작용 → 70% 순응.

ITT 결과: - 새 약 그룹: 95% 가 처치 받음 → 평균 효과 0.95 × (진짜 효과). - 이부프로펜 그룹: 70% 가 처치 받음 → 평균 효과 0.70 × (진짜 효과). - ITT RR: 0.95 / 0.70 > 1 → “새 약이 이부프로펜보다 효과 큼” 잘못 결론.

진짜 PP RR = 1.0 — 두 약 동일.

→ Head-to-head trial + 다른 비순응 패턴 = ITT 의 비보수적 결과.

직관 — Head-to-head 의 함정: Placebo vs 활성 처치는 ITT 의 보수성 비교적 견고. 두 활성 처치 비교는 비순응 차이 가 효과 차이 모방 위험. 제약 회사의 marketing trick 으로 활용 가능.

직관 — Non-monotonic 처치 효과: 일부 환자에게 + 효과, 일부에 - 효과. 비순응 패턴이 부정적 효과 환자에 집중 되면 ITT 의 양 효과가 과대 추정. Effect modification 의 ITT 영향.

2.3 Naive Per-Protocol Analyses (Fine Point 22.3)

Naive PP 분석의 두 가지 함정

(1) As-Treated 분석: - “받은 처치 (\(A\)) 별 결과 비교” — 배정 (\(Z\)) 무시. - 만약 비순응이 환자 prognosis 의존이면 confounding. - 일반적으로 편향.

(2) On-Treatment (Conventional Per-Protocol) 분석: - “Per-protocol population” (\(A = Z\) 인 환자만) 에서 비교. - Selection on \(A = Z\) → selection bias. - DAG: \(Z \to A \leftarrow L\) 의 collider \(A\) 보정 효과. - 일반적으로 편향.

→ 두 분석 모두 적절한 confounder 보정 + g-method 없이 PP 효과 추정 불가.

→ Hernán & Hernández-Díaz (2012) 의 강력한 비판.

직관 — Naive PP 의 흔함: 의학 저널 논문의 흔한 분석. “Per-protocol analysis 결과: …” 라고 보고하지만 실제로는 naive on-treatment. 분석가의 인식 부족 + 도구 misuse.

직관 — 정확한 PP 분석: Confounder \(L\) 측정 + IPW 또는 g-formula 적용. 단일 시점 처치는 Ch.12-15 도구. 시간변동은 Ch.21 도구. 단순 비교 X — 본격 g-method.

2.4 Pseudo-ITT 와 Modified ITT (Fine Point 22.2)

ITT 의 변형 분석

Pseudo-ITT: - Loss to follow-up 으로 outcome 미관측 환자 제외 → uncensored 환자만 분석. - \(\Pr(Y=1 | Z=1, C=0) / \Pr(Y=1 | Z=0, C=0)\). - Censoring 이 informative 면 selection bias. - 진짜 ITT 추정 안 됨.

Modified ITT: - 처치 시작 한 환자만 분석 (예: at least one pill). - 단일 시점 처치는 OK (모든 baseline 환자 시작). - 시간변동 처치는 selection 위험 — initiator 가 prognosis 다름.

직관 — Pseudo-ITT 의 흔한 함정: Loss to follow-up 가 처치 의존 이면 (예: 부작용으로 처치 그룹 dropout 더 많음) 분석에 systematic bias. IPW for censoring + ITT 가 정확한 절차.

직관 — Modified ITT 의 의미: “Initiator analysis” 와 동일. New-user design (Ch.20.5) 의 형태. Single-time point 에서는 통상적, time-varying 에서는 first-time initiation 의 selection 위험.

3 22.2 Sustained Treatment Strategies 의 Target Trial

3.1 시간변동 처치의 ITT 정의

ITT for Sustained Strategies (Hernan Ch.22.2)

HIV 시험 사례: - \(K + 1 = 60\) 시점 추적. - \(g_1\): continuous ART. - \(g_0\): no ART. - \(Z = 1\) if assigned \(g_1\), \(Z = 0\) if \(g_0\).

ITT 효과 (시점 \(k\) 의 사망 위험): \[\Pr(D_k^{z=1, \bar{c}=\bar{0}} = 1) - \Pr(D_k^{z=0, \bar{c}=\bar{0}} = 1)\]

= “\(g_1\) 배정받고 + 모든 시점 censoring 안 됐다면 사망 위험” - “\(g_0\) 배정 + 비순응” 차이.

→ 비순응 무관, 배정 자체의 효과.

직관 — Time-varying ITT 의 noninformativeness: 60 시점 비순응 누적되면 처치 그룹의 실제 처치율 매우 낮음. ITT 효과 = 희석된 진짜 효과의 작은 부분. 정책 결정에 과소 추정.

3.2 시간변동 처치의 Per-Protocol 정의

PP for Sustained Strategies

PP 효과: \[\Pr(D_k^{g_1, \bar{c}=\bar{0}} = 1) - \Pr(D_k^{g_0, \bar{c}=\bar{0}} = 1)\]

= “모든 환자가 \(g_1\) 따랐다면” - “\(g_0\) 따랐다면” 차이.

Dynamic strategies 의 자연성: - \(g_1\) = “ART 받음, but 부작용 발생 시 중단”. - 정적 strategy “무조건 ART 받음” 은 비현실적. - Per-protocol 정의 시 dynamic strategy 가 임상 자연.

Per-protocol effect 추정에 g-method 필수.

직관 — Dynamic Per-Protocol 의 의미: 의학 가이드라인은 “약 먹어, but 부작용 시 중단” 식의 dynamic strategy. PP effect 가 의미 있으려면 dynamic strategy 명시. Static “always treat” 은 비현실적 + 임상 가이드라인과 무관.

직관 — 60 시점 PP 추정의 어려움: 매 시점 strategy 따른 환자만 순응자. 60 시점 후 모두 순응할 확률 매우 낮음. G-method 가 가상 모집단 (모두 순응) 의 결과 추정. g-formula·IPW MSM 의 진가.

3.3 Target Trial Protocol — 8 Components

NHEFS-like Target Trial 작성 (가상)

HIV ART 시험 protocol:

  1. Eligibility: HIV 감염자, 18 세+, AIDS 안 진단, 이전 ART 미사용.
  2. Treatment strategies:
    • \(g_1\): 60 개월 동안 continuous ART (부작용 시 중단).
    • \(g_0\): 60 개월 동안 no ART.
  3. Treatment assignment: Baseline 1:1 무작위 배정.
  4. Time zero: Baseline 무작위 시점.
  5. Outcomes: 60 개월 사망 (primary), CD4 추이 (secondary).
  6. Causal contrast: ITT + Per-Protocol.
  7. 분석 계획: ITT (단순 비교), PP (IPW MSM + g-formula).
  8. Adherence: 매 시점 ART 처방 + 복용 확인.

Observational emulation 의 align: - Eligibility: HIV 코호트의 ART naive 환자. - Time zero: 첫 진료 시점. - Strategy: 측정된 ART 처방 history 와 비교. - Causal contrast: PP only (배정 미관측).

직관 — Protocol document 의 가치: 모든 분석 결정을 명시. 분석 변경 시 protocol 도 수정. Reproducibility + transparency 의 표준 도구. 인과 분석의 pre-registration.

4 Per-Protocol 의 도구 (Ch.21 의 적용)

Sustained PP Effect 추정 — 3 도구

(1) IPW MSM: - 매 시점 비순응 가중치 곱. - 가중 logistic hazard 모형. - Counterfactual survival 도출.

(2) Parametric G-Formula: - 시점별 covariate 분포 모형. - 모든 환자가 strategy 따른 가상 시뮬레이션. - Monte Carlo 평균.

(3) G-Estimation (SNMM): - Sequential structural nested model. - Semiparametric — covariate effect nuisance. - 시점별 g-test.

Doubly Robust 결합으로 robust 추정.

직관 — Ch.21 도구가 곧 PP 도구: Target Trial framework + Ch.21 g-method = sustained PP 분석. Hernan 의 framework 가 도구를 통합.

직관 — RCT 의 PP 도 g-method: 무작위 시험에서도 비순응 → PP 추정에 g-method. RCT 가 ITT 만 보장, PP 는 관찰 분석과 같은 도구 필요. Hernán & Robins (2017) 의 강조.

5 RCT vs Observational 의 ITT vs PP

분석 RCT Observational
ITT 단순 비교 (단일 점추정) 거의 불가능 (배정 미관측)
Modified ITT (initiator) 단순 + g-method (censoring) g-method (PS, IPW)
As-treated g-method g-method
On-treatment g-method g-method
Per-Protocol (g-method) g-method g-method

직관 — 관찰 분석 = 항상 PP-like: 관찰 데이터에는 배정 자체가 없음. 분석은 항상 처치 기반. ITT 의 RCT 강점이 적용 안 됨. 관찰 분석은 본질적으로 confounder 보정 필요.

6 Per-Protocol 추정의 NHEFS 사례

NHEFS 의 PP Effect 추정

NHEFS 의 흡연 중단 효과: - Target Trial: “1971-75 baseline 흡연자 → 1982 까지 금연 vs 흡연 계속 의 체중 효과”. - Eligibility = Time Zero = Treatment assignment (baseline 동시). - 단일 시점 처치 (1971-1982 사이 금연 여부, 이항). - ITT vs PP 차이 무관 (assignment = treatment in single-point study).

Ch.12-15 의 분석이 본질적으로 PP analysis: - IPW MSM: 3.4 kg. - 표준화: 3.5 kg. - G-estimation: 3.4 kg. - 다섯 도구의 일치 → robust per-protocol estimate.

→ NHEFS 의 단일 시점 처치는 ITT/PP 구별 무의미. Time-varying 데이터에서 본질적.

직관 — NHEFS 가 단일 시점 PP 의 표준 사례: Hernan 책의 NHEFS 분석이 단순화된 per-protocol 분석. 진짜 시간변동 PP (HIV 코호트의 ART) 분석은 더 복잡한 g-method 적용. NHEFS 가 도구 학습용, 진짜 응용은 시간변동 코호트.

7 응용 분야

  • 임상 시험 비순응 처리: ITT primary + PP sensitivity
  • 종양학 SMART trial: 시간변동 strategy 의 PP 분석
  • HIV/AIDS Cohort: 관찰 데이터의 ART per-protocol 효과
  • 약물 안전성 (PV): 비순응 보정의 부작용 효과
  • 마케팅 attribution: 캠페인 sequence 의 PP 효과

8 코드 — RCT 의 ITT vs PP 시뮬레이션

import pandas as pd
import numpy as np
import statsmodels.formula.api as smf

# === RCT 시뮬레이션 with non-adherence ===
np.random.seed(42)
n = 5000

# 무작위 배정
Z = np.random.binomial(1, 0.5, n)

# 비순응 — Z=0 그룹 일부가 처치 받음 (15%), Z=1 일부 안 받음 (10%)
A = np.where(Z == 1, np.random.binomial(1, 0.9, n), np.random.binomial(1, 0.15, n))

# 진짜 처치 효과 = -2 (사망 위험 감소)
Y = 0.5 - 0.2 * A + np.random.normal(0, 1, n)

df = pd.DataFrame({"Z": Z, "A": A, "Y": Y})

# === ITT 분석 ===
itt = df[df.Z==1].Y.mean() - df[df.Z==0].Y.mean()
print(f"=== ITT Analysis ===")
print(f"ITT effect: {itt:.3f} (진짜 처치 효과 -0.20, ITT 가 attenuated)")

# === Naive As-Treated ===
at = df[df.A==1].Y.mean() - df[df.A==0].Y.mean()
print(f"\n=== As-Treated (naive) ===")
print(f"As-treated: {at:.3f} — 만약 비순응 confounded 면 편향")

# === Conventional Per-Protocol (per-protocol population) ===
pp_pop = df[df.Z == df.A]
pp_naive = pp_pop[pp_pop.Z==1].Y.mean() - pp_pop[pp_pop.Z==0].Y.mean()
print(f"\n=== Naive Per-Protocol ===")
print(f"Naive PP: {pp_naive:.3f} — selection bias 위험")

# === IV (PP estimate via Wald) ===
itt_num = df[df.Z==1].Y.mean() - df[df.Z==0].Y.mean()
itt_denom = df[df.Z==1].A.mean() - df[df.Z==0].A.mean()
iv_pp = itt_num / itt_denom
print(f"\n=== IV-based Per-Protocol ===")
print(f"Wald IV (PP): {iv_pp:.3f} (진짜 처치 효과 -0.20)")

# === Modified ITT (initiator only) ===
init_only = df[df.A == df.Z]   # 배정대로 시작한 환자만
mitt = init_only[init_only.Z==1].Y.mean() - init_only[init_only.Z==0].Y.mean()
print(f"\n=== Modified ITT (initiator only) ===")
print(f"Modified ITT: {mitt:.3f}")

print("\n--- 비교 ---")
print(f"진짜 처치 효과:        -0.20")
print(f"ITT (보수적):         {itt:.3f}")
print(f"As-Treated (편향):    {at:.3f}")
print(f"Naive PP (편향):      {pp_naive:.3f}")
print(f"IV PP (정확):         {iv_pp:.3f}")

9 한 줄 요약

ITT (배정 효과) vs Per-Protocol (처치 효과) 의 정확한 정의 — 비순응 처리에서 결정적 차이. RCT 의 ITT 가 표준 (no confounding) 이지만 head-to-head trial + 다른 비순응 패턴에서 비보수적 결과 가능. Naive PP (as-treated, on-treatment) 분석은 selection bias — g-method 또는 IV 필요. Sustained strategy 의 ITT 는 시간변동 비순응 누적으로 noninformative — PP + g-method 필수. Hernan & Robins 의 강조: PP effect 가 의사·환자에게 의미, ITT 가 정책 결정자에게 의미. NHEFS 는 단일 시점이라 ITT/PP 구별 무의미 — 진짜 응용은 시간변동 코호트.

10 관련 주제

선행 지식

후속 주제

다른 카테고리 연결

Subscribe

Enjoy this blog? Get notified of new posts by email: