Surrogate 정의와 장단점 — Ch.18.1

효율의 매력과 임상적 함정의 9 가지 사례

Schulz Ch.18.1 — Surrogate endpoint 의 정의·장점·단점 깊이. (1) Surrogate 의 효율적 매력 (sample size·기간·비용 감소), (2) 9 가지 surrogate 실패 사례 — 항부정맥제, fluoride, DMPA, rosiglitazone, bedaquiline, (3) “임상적 직관 (clinical hunch) 의 fallibility” Schulz 의 강한 입장, (4) Surrogate ≠ True endpoint 의 메커니즘 — 평행 trajectory, 측정 불가능한 부작용, downstream effects.

Experimentation
Epidemiology
저자

Kwangmin Kim

공개

2026년 05월 08일

이 글은 Schulz Ch.18 시리즈의 두 번째 글이다. Surrogate 의 정의·장점·위험 사례 를 깊이 다룬다.

1 Surrogate Endpoint 의 정의 — 더 깊이

정의: Surrogate Endpoint

임상적으로 중요한 결과 (true endpoint)대체 측정. 보통 생물학적 과정 의 측정 — 혈액·영상 등.

1.1 동의어

  • Intermediate measures
  • Surrogate markers
  • Biomarkers (broader)

1.2 가정

Surrogate 가 인과 경로 상에 있어 surrogate 변화가 true endpoint 변화로 이어진다.

그러나 흔한 현실: Surrogate 는 parallel track — 인과 경로에 직접 관여 안 함.

비유: 자동차의 속도계 (speedometer)속도 를 측정. 속도계 표시 = 진짜 속도. 그러나 surrogate 는 주유계 (gas gauge) 같은 것 — 연료 잔량. 연료가 많아도 엔진이 망가졌으면 차는 안 움직인다. 주유계 호전 = 운행 가능 의 가정이 틀린 경우 surrogate 함정.

2 Surrogate 의 매력 — 5 가지 동기

2.1 동기 1: Sample Size 감소

메커니즘: True endpoint 가 드물면 (사망 1%/년) sample size 거대해짐. Surrogate (콜레스테롤) 는 연속 변수 또는 높은 빈도 — sample size 작아짐.

: 콜레스테롤 시험. 심근경색 추적 (5 년, 사망 5%) 시험은 8000+ 명 필요. LDL 측정 (3 개월) 은 100~200 명으로 충분.

2.2 동기 2: 기간 단축

메커니즘: True endpoint (사망·골절) 는 발생까지 수년수십년. Surrogate (혈액 검사) 는 수주수개월 측정 가능.

2.3 동기 3: 비용 감소

메커니즘: 짧은 기간 + 작은 sample → 비용 수십 배 감소.

2.4 동기 4: 추적 손실 최소화

메커니즘: 짧은 기간 → loss to follow-up 덜 심각. 시험 무결성 보존.

2.5 동기 5: 임상의 친숙성

메커니즘: 임상에서 routine 으로 사용 하는 검사 (HbA1c, 혈압) → 의사가 익숙. 진짜 결과 (당뇨 합병증) 는 측정·이해 어려움.

반사실: 만약 surrogate 가 true endpoint 를 완벽히 예측 한다면 위 5 가지 매력 모두 정당. 그러나 완벽 예측은 거의 없다.

3 Surrogate 의 위험 — 9 가지 약물 실패 사례

3.1 사례 1: Encainide & Flecainide (1980s)

상황: 심근경색 후 조기 심실 수축 (PVC) 가 사망 위험 인자. 가설: PVC 억제 → 사망 감소.

시험: Encainide·Flecainide 가 PVC 훌륭히 억제. FDA 승인.

CAST (Cardiac Arrhythmia Suppression Trial): True endpoint (사망) 측정. 결과: 사망 3 배 증가.

메커니즘: 알 수 없음 (probable proarrhythmic effects). PVC 억제가 다른 부정맥 야기 가능성.

결과: 미국에서 200,000+ 환자 처방, 수천 명 예방 가능한 사망.

Schulz 의 평가: “Most notorious example. 가장 강력한 surrogate 위험 증거.”

3.2 사례 2: Fluoride for Osteoporosis

상황: 골절 위험 = 골밀도 감소. 가설: 골밀도 증가 → 골절 감소.

시험: Fluoride 가 골밀도 35% 증가. 매우 강한 surrogate 효과.

결과: 척추·비척추 골절 모두 증가. Bones became denser but more brittle.

메커니즘: 골밀도 (bone quantity) ≠ 골 건강 (bone quality — living biomatrix).

3.3 사례 3: DMPA Black Box Warning (2004)

상황: DMPA (피임 주사) 가 골밀도 일시 감소 (수유 중 변화 정도).

FDA 결정: Black Box Warning (가장 심각). 2 년 이상 사용 제한.

문제: Fluoride 사례에서 이미 골밀도 ≠ 골절 위험 입증. FDA 가 invalid surrogate 로 결정.

WHO 입장 (정반대): DMPA 사용 제한 권장 안 함. 18~45 세 여성 무제한.

Schulz 의 비판: “Not evidence-based.” Surrogate 함정의 규제 차원.

3.4 사례 4: Erythropoietin for Anemia

상황: 만성 신부전 빈혈. 헤모글로빈 증가가 삶의 질·생존 향상 가설.

시험: Erythropoietin 이 헤모글로빈 훌륭히 증가. FDA 승인.

후속 시험: 정상 헤모글로빈 (>13) 목표 시 심혈관 사건·사망 증가. 낮은 목표 (10~11) 가 더 안전.

3.5 사례 5: Rosiglitazone for Diabetes

상황: HbA1c 가 당뇨 합병증 위험 인자. Rosiglitazone 이 HbA1c 감소.

FDA 승인: HbA1c 효과 기반.

Nissen & Wolski (2007): 메타분석 결과 심근경색·심혈관 사망 모두 증가.

결과: FDA Black Box Warning 추가. 처방 급감.

3.6 사례 6: Bedaquiline for Multidrug-Resistant TB (2012)

상황: 다제내성 결핵. 새 약 절실. 작은 시험 (47 + 161 명).

Surrogate: 객담 배양 양성 → 음성 전환.

시험 결과: Surrogate 효과 적당. 진짜 결과 (사망) 5 배 증가.

FDA 결정: 어찌되었든 승인.

Schulz 의 비판: “Surrogate trumps true endpoint for unknown reasons. 가장 최근의 충격적 사례.”

3.7 사례 7: Aprotinin for Cardiac Surgery

Surrogate: 수혈 필요량 감소. 결과: 사망 증가. 시장 회수.

3.8 사례 8: Clofibrate for Hypercholesterolemia

Surrogate: 혈청 콜레스테롤 감소. 결과: WHO Trial 에서 총 사망률 25% 증가.

3.9 사례 9: Flosequinan, Ibopamine, Milrinone (Heart Failure)

Surrogate: 심실 기능, 운동 내성, 심수축력. 결과: 모두 사망 증가.

4 공통 패턴 — 모든 9 사례의 메시지

패턴 설명
Surrogate 호전 약이 원하는 생물학적 변화 만들었음
FDA 승인 Surrogate 만으로
임상 사용 수만~수십만 환자
진짜 결과 (사망) 악화 True endpoint 측정 후에야 발견
시장 회수·경고 너무 늦음

Schulz 의 결론: “Poor-quality research is unethical. Surrogate 의존 결정이 수만 명의 예방 가능한 사망 야기.”

5 Surrogate 가 True Endpoint 와 다른 메커니즘

5.1 메커니즘 1: Off-Target Effects (부작용)

: Encainide 는 PVC 억제 (target effect) + 다른 부정맥 야기 (off-target). True endpoint (사망) 는 두 효과의 결과.

5.2 메커니즘 2: Surrogate ≠ Pathway (평행 trajectory)

: Fluoride 는 골밀도 증가하지만 bone quality (matrix) 와 무관. 진짜 결과 (골절) 는 quality 가 결정.

5.3 메커니즘 3: Downstream Effects 무시

: HbA1c 강하 자체는 좋지만, 너무 강한 강하저혈당 위험 증가. Net effect 는 측정 안 됨.

5.4 메커니즘 4: 다른 인구에 다른 효과

: 한 약이 surrogate 호전 + true endpoint 영향 없음. 그러나 위험 인구 (고령자) 에서는 사망 증가. 평균은 효과 없음, sub-group 은 해로움.

6 “Clinical Hunch” 의 Fallibility

Schulz 의 통찰: “Clinical hunches without check of formal scientific controls have proven to be a highly fallible compass.”

번역: 임상적 직관은 공식 과학적 통제 없이는 매우 불완전한 나침반.

6.1 왜 임상적 직관이 함정인가

이유 설명
대규모 데이터 부족 의사 한 명이 평생 보는 환자 수 제한
다른 요인의 누락 Confounding, side effects 무시
Outcome heterogeneity Mean effect 만 봄, 분산 무시
Time lag Long-term effect 측정 어려움
Cognitive bias Confirmation bias, anchor 등

반사실: 만약 의사가 “이 약이 PVC 잘 억제하니 사망도 줄일 것” 이라는 직관을 그대로 신뢰 했다면 → CAST 같은 시험 시도조차 안 했을 것 → 3 배 사망 증가 영구 비밀.

so what: RCT 의 가치는 임상적 직관에 대한 회의주의진짜 결과로 직접 검증.

7 결론 — Ch.18.1 의 한 줄 요약

Surrogate 는 효율의 매력임상적 함정 의 trade-off. 9 가지 약 사례가 함정의 정량적 비용 증명.

핵심 메시지:

  1. 5 가지 매력 — sample, 기간, 비용, 추적, 친숙성
  2. 9 가지 실패 — Encainide·Fluoride·DMPA·Rosiglitazone·Bedaquiline 등
  3. 공통 패턴 — Surrogate 호전 → FDA 승인 → 진짜 결과 악화
  4. Off-target / 평행 trajectory / Downstream / Sub-group — 4 메커니즘
  5. Clinical hunch fallibility — 직관 신뢰 위험

다음 글: Surrogate 의 validation 과 evidence levels.

8 관련 주제

9 참고문헌

  • Schulz, K. F. & Grimes, D. A. (2019). Essential Concepts in Clinical Research (2nd ed.), Ch.18. Elsevier.
  • Grimes, D. A. & Schulz, K. F. (2005). Surrogate end points in clinical research: hazardous to your health. Obstet. Gynecol. 105, 1114-1118.
  • Echt, D. S., Liebson, P. R., Mitchell, L. B., et al. (1991). Mortality and morbidity in patients receiving encainide, flecainide, or placebo. The Cardiac Arrhythmia Suppression Trial. N. Engl. J. Med. 324, 781-788.
  • Cefalu, C. A. (2004). Is bone mineral density predictive of fracture risk reduction? Curr. Med. Res. Opin. 20, 341-349.
  • Nissen, S. E. & Wolski, K. (2007). Effect of rosiglitazone on the risk of myocardial infarction and death. N. Engl. J. Med. 356, 2457-2471.
  • Avorn, J. (2013). Approval of a tuberculosis drug based on a paradoxical surrogate measure. JAMA 309, 1349-1350.

Subscribe

Enjoy this blog? Get notified of new posts by email: