이 글은 Schulz Ch.18 시리즈의 두 번째 글이다. Surrogate 의 정의·장점·위험 사례 를 깊이 다룬다.
1 Surrogate Endpoint 의 정의 — 더 깊이
임상적으로 중요한 결과 (true endpoint) 의 대체 측정. 보통 생물학적 과정 의 측정 — 혈액·영상 등.
1.1 동의어
- Intermediate measures
- Surrogate markers
- Biomarkers (broader)
1.2 가정
Surrogate 가 인과 경로 상에 있어 surrogate 변화가 true endpoint 변화로 이어진다.
그러나 흔한 현실: Surrogate 는 parallel track — 인과 경로에 직접 관여 안 함.
비유: 자동차의 속도계 (speedometer) 는 속도 를 측정. 속도계 표시 = 진짜 속도. 그러나 surrogate 는 주유계 (gas gauge) 같은 것 — 연료 잔량. 연료가 많아도 엔진이 망가졌으면 차는 안 움직인다. 주유계 호전 = 운행 가능 의 가정이 틀린 경우 surrogate 함정.
2 Surrogate 의 매력 — 5 가지 동기
2.1 동기 1: Sample Size 감소
메커니즘: True endpoint 가 드물면 (사망 1%/년) sample size 거대해짐. Surrogate (콜레스테롤) 는 연속 변수 또는 높은 빈도 — sample size 작아짐.
예: 콜레스테롤 시험. 심근경색 추적 (5 년, 사망 5%) 시험은 8000+ 명 필요. LDL 측정 (3 개월) 은 100~200 명으로 충분.
2.2 동기 2: 기간 단축
메커니즘: True endpoint (사망·골절) 는 발생까지 수년수십년. Surrogate (혈액 검사) 는 수주수개월 측정 가능.
2.3 동기 3: 비용 감소
메커니즘: 짧은 기간 + 작은 sample → 비용 수십 배 감소.
2.4 동기 4: 추적 손실 최소화
메커니즘: 짧은 기간 → loss to follow-up 덜 심각. 시험 무결성 보존.
2.5 동기 5: 임상의 친숙성
메커니즘: 임상에서 routine 으로 사용 하는 검사 (HbA1c, 혈압) → 의사가 익숙. 진짜 결과 (당뇨 합병증) 는 측정·이해 어려움.
반사실: 만약 surrogate 가 true endpoint 를 완벽히 예측 한다면 위 5 가지 매력 모두 정당. 그러나 완벽 예측은 거의 없다.
3 Surrogate 의 위험 — 9 가지 약물 실패 사례
3.1 사례 1: Encainide & Flecainide (1980s)
상황: 심근경색 후 조기 심실 수축 (PVC) 가 사망 위험 인자. 가설: PVC 억제 → 사망 감소.
시험: Encainide·Flecainide 가 PVC 훌륭히 억제. FDA 승인.
CAST (Cardiac Arrhythmia Suppression Trial): True endpoint (사망) 측정. 결과: 사망 3 배 증가.
메커니즘: 알 수 없음 (probable proarrhythmic effects). PVC 억제가 다른 부정맥 야기 가능성.
결과: 미국에서 200,000+ 환자 처방, 수천 명 예방 가능한 사망.
Schulz 의 평가: “Most notorious example. 가장 강력한 surrogate 위험 증거.”
3.2 사례 2: Fluoride for Osteoporosis
상황: 골절 위험 = 골밀도 감소. 가설: 골밀도 증가 → 골절 감소.
시험: Fluoride 가 골밀도 35% 증가. 매우 강한 surrogate 효과.
결과: 척추·비척추 골절 모두 증가. Bones became denser but more brittle.
메커니즘: 골밀도 (bone quantity) ≠ 골 건강 (bone quality — living biomatrix).
3.3 사례 3: DMPA Black Box Warning (2004)
상황: DMPA (피임 주사) 가 골밀도 일시 감소 (수유 중 변화 정도).
FDA 결정: Black Box Warning (가장 심각). 2 년 이상 사용 제한.
문제: Fluoride 사례에서 이미 골밀도 ≠ 골절 위험 입증. FDA 가 invalid surrogate 로 결정.
WHO 입장 (정반대): DMPA 사용 제한 권장 안 함. 18~45 세 여성 무제한.
Schulz 의 비판: “Not evidence-based.” Surrogate 함정의 규제 차원.
3.4 사례 4: Erythropoietin for Anemia
상황: 만성 신부전 빈혈. 헤모글로빈 증가가 삶의 질·생존 향상 가설.
시험: Erythropoietin 이 헤모글로빈 훌륭히 증가. FDA 승인.
후속 시험: 정상 헤모글로빈 (>13) 목표 시 심혈관 사건·사망 증가. 낮은 목표 (10~11) 가 더 안전.
3.5 사례 5: Rosiglitazone for Diabetes
상황: HbA1c 가 당뇨 합병증 위험 인자. Rosiglitazone 이 HbA1c 감소.
FDA 승인: HbA1c 효과 기반.
Nissen & Wolski (2007): 메타분석 결과 심근경색·심혈관 사망 모두 증가.
결과: FDA Black Box Warning 추가. 처방 급감.
3.6 사례 6: Bedaquiline for Multidrug-Resistant TB (2012)
상황: 다제내성 결핵. 새 약 절실. 작은 시험 (47 + 161 명).
Surrogate: 객담 배양 양성 → 음성 전환.
시험 결과: Surrogate 효과 적당. 진짜 결과 (사망) 5 배 증가.
FDA 결정: 어찌되었든 승인.
Schulz 의 비판: “Surrogate trumps true endpoint for unknown reasons. 가장 최근의 충격적 사례.”
3.7 사례 7: Aprotinin for Cardiac Surgery
Surrogate: 수혈 필요량 감소. 결과: 사망 증가. 시장 회수.
3.8 사례 8: Clofibrate for Hypercholesterolemia
Surrogate: 혈청 콜레스테롤 감소. 결과: WHO Trial 에서 총 사망률 25% 증가.
3.9 사례 9: Flosequinan, Ibopamine, Milrinone (Heart Failure)
Surrogate: 심실 기능, 운동 내성, 심수축력. 결과: 모두 사망 증가.
4 공통 패턴 — 모든 9 사례의 메시지
| 패턴 | 설명 |
|---|---|
| Surrogate 호전 | 약이 원하는 생물학적 변화 만들었음 |
| FDA 승인 | Surrogate 만으로 |
| 임상 사용 | 수만~수십만 환자 |
| 진짜 결과 (사망) 악화 | True endpoint 측정 후에야 발견 |
| 시장 회수·경고 | 너무 늦음 |
Schulz 의 결론: “Poor-quality research is unethical. Surrogate 의존 결정이 수만 명의 예방 가능한 사망 야기.”
5 Surrogate 가 True Endpoint 와 다른 메커니즘
5.1 메커니즘 1: Off-Target Effects (부작용)
예: Encainide 는 PVC 억제 (target effect) + 다른 부정맥 야기 (off-target). True endpoint (사망) 는 두 효과의 순 결과.
5.2 메커니즘 2: Surrogate ≠ Pathway (평행 trajectory)
예: Fluoride 는 골밀도 증가하지만 bone quality (matrix) 와 무관. 진짜 결과 (골절) 는 quality 가 결정.
5.3 메커니즘 3: Downstream Effects 무시
예: HbA1c 강하 자체는 좋지만, 너무 강한 강하 가 저혈당 위험 증가. Net effect 는 측정 안 됨.
5.4 메커니즘 4: 다른 인구에 다른 효과
예: 한 약이 surrogate 호전 + true endpoint 영향 없음. 그러나 위험 인구 (고령자) 에서는 사망 증가. 평균은 효과 없음, sub-group 은 해로움.
6 “Clinical Hunch” 의 Fallibility
Schulz 의 통찰: “Clinical hunches without check of formal scientific controls have proven to be a highly fallible compass.”
번역: 임상적 직관은 공식 과학적 통제 없이는 매우 불완전한 나침반.
6.1 왜 임상적 직관이 함정인가
| 이유 | 설명 |
|---|---|
| 대규모 데이터 부족 | 의사 한 명이 평생 보는 환자 수 제한 |
| 다른 요인의 누락 | Confounding, side effects 무시 |
| Outcome heterogeneity | Mean effect 만 봄, 분산 무시 |
| Time lag | Long-term effect 측정 어려움 |
| Cognitive bias | Confirmation bias, anchor 등 |
반사실: 만약 의사가 “이 약이 PVC 잘 억제하니 사망도 줄일 것” 이라는 직관을 그대로 신뢰 했다면 → CAST 같은 시험 시도조차 안 했을 것 → 3 배 사망 증가 영구 비밀.
so what: RCT 의 가치는 임상적 직관에 대한 회의주의 — 진짜 결과로 직접 검증.
7 결론 — Ch.18.1 의 한 줄 요약
Surrogate 는 효율의 매력 과 임상적 함정 의 trade-off. 9 가지 약 사례가 함정의 정량적 비용 증명.
핵심 메시지:
- 5 가지 매력 — sample, 기간, 비용, 추적, 친숙성
- 9 가지 실패 — Encainide·Fluoride·DMPA·Rosiglitazone·Bedaquiline 등
- 공통 패턴 — Surrogate 호전 → FDA 승인 → 진짜 결과 악화
- Off-target / 평행 trajectory / Downstream / Sub-group — 4 메커니즘
- Clinical hunch fallibility — 직관 신뢰 위험
다음 글: Surrogate 의 validation 과 evidence levels.
8 관련 주제
9 참고문헌
- Schulz, K. F. & Grimes, D. A. (2019). Essential Concepts in Clinical Research (2nd ed.), Ch.18. Elsevier.
- Grimes, D. A. & Schulz, K. F. (2005). Surrogate end points in clinical research: hazardous to your health. Obstet. Gynecol. 105, 1114-1118.
- Echt, D. S., Liebson, P. R., Mitchell, L. B., et al. (1991). Mortality and morbidity in patients receiving encainide, flecainide, or placebo. The Cardiac Arrhythmia Suppression Trial. N. Engl. J. Med. 324, 781-788.
- Cefalu, C. A. (2004). Is bone mineral density predictive of fracture risk reduction? Curr. Med. Res. Opin. 20, 341-349.
- Nissen, S. E. & Wolski, K. (2007). Effect of rosiglitazone on the risk of myocardial infarction and death. N. Engl. J. Med. 356, 2457-2471.
- Avorn, J. (2013). Approval of a tuberculosis drug based on a paradoxical surrogate measure. JAMA 309, 1349-1350.