이 글은 Schulz Ch.18 시리즈의 네 번째 글이다. 결과 변수 용어와 미래 방향 을 다룬다.
1 진입 직관 — 용어의 혼란
Surrogate, biomarker, intermediate measure, clinical endpoint… 결과 변수 관련 용어가 매우 혼란. 같은 시험에서 다른 용어 사용 시 같은 endpoint 가 다르게 분류 가능.
Schulz 의 동기: “용어 혼란이 invalid surrogate 사용을 가린다. NIH·FDA 가 표준화 시도, 그러나 완벽 안 됨.”
2 표준화 시도 — 3 단계 진화
2.1 시도 1: NIH (2001)
“Biomarkers and Surrogate Endpoints: Preferred Definitions and Conceptual Framework.”
결과: 부분적 채택, 그러나 clinical practice 와 분리.
2.2 시도 2: Institute of Medicine (2010)
Evaluation of Biomarkers and Surrogate Endpoints in Chronic Disease — 300+ 페이지 보고서.
결과: 학문적 깊이는 있으나 FDA 규제 통합 약함.
2.3 시도 3: BEST Resource (FDA-NIH 2016)
Biomarkers EndpointS, and other Tools — 규제 초점.
3 BEST Resource — 6 가지 Endpoint 분류 (Panel 18.2)
3.1 1: Endpoint
통계적으로 분석되는 정밀 정의된 변수. 측정 시점·도구·조합 방법 명시.
예: “치료 시작 후 4 주째 측정한 평균 수축기 혈압”.
3.2 2: Clinical Endpoint
환자가 어떻게 느끼는지·기능하는지·생존하는지 반영.
예: 사망, 심근경색, 통증, 삶의 질.
3.3 3: Intermediate Clinical Endpoint
Irreversible morbidity/mortality (IMM) 보다 빨리 측정 가능한 임상 결과. IMM 또는 다른 임상적 이익 합리적 예측.
사례: - 심부전 시험에서 운동 내성 - 조산 시험에서 분만 지연
사용: Full approval 또는 accelerated approval 가능. 단 후속 시험 필요.
3.4 4: Surrogate Endpoint
환자 기능·생존의 직접 측정 대체. 임상 이익 예측 기대.
3.5 Surrogate 의 3 단계 분류 (FDA 규제 관점)
3.5.1 4a. Validated Surrogate Endpoint
명확한 mechanistic rationale + 강한 임상 데이터로 입증. Traditional approval 지원 가능.
| 사례 | 분야 |
|---|---|
| HbA1c 감소 | 당뇨 미세혈관 합병증 |
| HIV-RNA 감소 | HIV 임상 진행 |
| LDL 콜레스테롤 감소 | 스타틴 → 심혈관 사건 |
| 혈압 감소 | 항고혈압제 → 뇌졸중·MI·사망 |
3.5.2 4b. Reasonably Likely Surrogate Endpoint
Mechanistic·epidemiological rationale 있지만 임상 데이터 불충분. Accelerated approval 가능. 후속 시험 필수.
| 사례 | 분야 |
|---|---|
| 6 개월 객담 배양 + 재발률 | 폐결핵 |
3.5.3 4c. Candidate Surrogate Endpoint
예측력 평가 중. 효능 시험에 피해야.
4 Schulz 의 BEST 비판
Schulz 의 우려: “BEST guidelines 가 self-serving 으로 보일 수 있음. ‘Reasonably likely’ 카테고리 하에 bedaquiline 같은 약 승인 — 사망률 5 배 증가에도.”
4.1 사례 분석
Bedaquiline (2012 FDA 승인). Surrogate: 객담 배양 + 재발률. 결과: 사망 5 배.
그러나 BEST 분류로는 “reasonably likely”. 즉 분류 자체가 위험한 약 승인 정당화 도구가 될 수 있음.
Schulz 의 결론: “Approval remains puzzling. 분류 framework 가 좋더라도 적용의 무결성 이 핵심.”
5 Way Forward — Schulz 의 권고
5.1 권고 1 — Outcomes that Matter
“Most circumstances, trials should focus on outcomes that matter.”
5.2 예외 — Surrogate 사용이 정당한 경우
| 예외 | 정당화 |
|---|---|
| 매우 천천히 진행하는 치명 질환 (예: ALS) | True endpoint 측정에 너무 오래 |
| 희귀 질환 | Sample size 부족 |
| 검증된 surrogate (Level 2) | 위험 작음 |
5.3 권고 2 — Validation 의 strict 적용
“Validated 라벨은 큰 prospective 시험 + 다양한 처치 클래스 검증 후에만.”
5.4 권고 3 — 자원 배분의 윤리
Schulz 의 통찰:
“임상 연구 자원은 유한. Invalid surrogate 시험 1800+ 편 (oral contraception + coagulation 사례). 모두 coagulation test 가 venous thromboembolism 예측 못함 결론. 자원 낭비 = 다른 가치 있는 시험 못함 = 환자 손해.”
5.5 권고 4 — Researchers’ Fiduciary Responsibility
“Research has a fiduciary responsibility to society. Invalid surrogate 시험은 연구비·시간·환자 자원 낭비.”
6 미래 방향 — Sophisticated Approaches
6.1 Meta-Analysis 기반 Validation
여러 시험의 surrogate 효과 + true endpoint 효과 메타분석. 두 효과 일관 하면 validation 가능.
한계 (Schulz 의 비판): “Aggregation of incomplete information cannot plug the gaps. Empirical evidence of validity still needed.”
6.2 Causal Mediation Analysis
Surrogate 가 처치-결과 경로의 mediator 인지 검증. 통계적으로 direct vs indirect effect 분리.
6.3 Multi-Trial Surrogate Trial
Surrogate 와 true endpoint 모두 측정 한 큰 시험. 그러나 비용 폭증.
7 Researcher 의 책임
7.1 Ethical Imperatives
Schulz 의 강한 입장:
“Poor-quality research is unethical.” (Altman 1994, von Elm & Egger 2004)
이유:
- 환자가 동의한 시험 위험 학문적 기여 없이 소멸
- 연구비 자원 의 기회비용
- 잘못된 결과 가 임상 결정 왜곡 → 환자 해
- 향후 시험에 대한 신뢰 약화
7.2 Schulz 의 결론
“Researchers have a fiduciary responsibility to society. Invalid surrogate 사용 시험은 환자에게 해로움.”
8 결론 — Ch.18.3 의 한 줄 요약
용어 표준화는 진보지만 분류만으로는 위험 약 차단 못함. Validation 의 무결성이 핵심.
핵심 메시지:
- BEST Resource (2016) — 6 가지 endpoint 분류
- Validated > Reasonably Likely > Candidate — 3 단계 surrogate
- Schulz 의 비판 — Bedaquiline 의 ‘reasonably likely’ 분류 우려
- Way Forward — Validated surrogate 만 사용, 그 외는 true endpoint
- Fiduciary responsibility — 연구자의 사회적 책임
다음 글: Composite outcomes 의 함정.
9 관련 주제
10 참고문헌
- Schulz, K. F. & Grimes, D. A. (2019). Essential Concepts in Clinical Research (2nd ed.), Ch.18. Elsevier.
- Robb, M. A., McInnes, P. M., Califf, R. M. (2016). Biomarkers and surrogate endpoints. JAMA 315, 1107-1108.
- FDA-NIH Biomarker Working Group. (2016). BEST (Biomarkers, EndpointS, and other Tools) Resource.
- IOM (Institute of Medicine). (2010). Evaluation of Biomarkers and Surrogate Endpoints in Chronic Disease. National Academies Press.
- Altman, D. G. (1994). The scandal of poor medical research. BMJ 308, 283-284.
- von Elm, E. & Egger, M. (2004). The scandal of poor epidemiological research. BMJ 329, 868-869.
- Stanczyk, F. Z. & Grimes, D. A. (2008). Sex hormone-binding globulin: not a surrogate marker. Contraception 78, 201-203.