결과 변수 용어 정리 — Ch.18.3

BEST Resource 의 6 가지 endpoint 분류와 Way Forward

Schulz Ch.18.3 — Surrogate 와 endpoint 의 용어 혼란을 해결하는 BEST Resource (FDA-NIH 2016) 의 6 가지 분류. (1) Endpoint, Clinical Endpoint, Intermediate Clinical Endpoint, Surrogate Endpoint, Validated · Reasonably Likely · Candidate Surrogate, (2) Schulz 의 BEST 비판 (bedaquiline 사례), (3) Way Forward — 언제 surrogate 사용 정당, 연구 자원 배분의 윤리.

Experimentation
Epidemiology
저자

Kwangmin Kim

공개

2026년 05월 08일

이 글은 Schulz Ch.18 시리즈의 네 번째 글이다. 결과 변수 용어와 미래 방향 을 다룬다.

1 진입 직관 — 용어의 혼란

Surrogate, biomarker, intermediate measure, clinical endpoint… 결과 변수 관련 용어가 매우 혼란. 같은 시험에서 다른 용어 사용 시 같은 endpoint 가 다르게 분류 가능.

Schulz 의 동기: “용어 혼란이 invalid surrogate 사용을 가린다. NIH·FDA 가 표준화 시도, 그러나 완벽 안 됨.”

2 표준화 시도 — 3 단계 진화

2.1 시도 1: NIH (2001)

“Biomarkers and Surrogate Endpoints: Preferred Definitions and Conceptual Framework.”

결과: 부분적 채택, 그러나 clinical practice 와 분리.

2.2 시도 2: Institute of Medicine (2010)

Evaluation of Biomarkers and Surrogate Endpoints in Chronic Disease — 300+ 페이지 보고서.

결과: 학문적 깊이는 있으나 FDA 규제 통합 약함.

2.3 시도 3: BEST Resource (FDA-NIH 2016)

Biomarkers EndpointS, and other Tools — 규제 초점.

3 BEST Resource — 6 가지 Endpoint 분류 (Panel 18.2)

3.1 1: Endpoint

통계적으로 분석되는 정밀 정의된 변수. 측정 시점·도구·조합 방법 명시.

: “치료 시작 후 4 주째 측정한 평균 수축기 혈압”.

3.2 2: Clinical Endpoint

환자가 어떻게 느끼는지·기능하는지·생존하는지 반영.

: 사망, 심근경색, 통증, 삶의 질.

3.3 3: Intermediate Clinical Endpoint

Irreversible morbidity/mortality (IMM) 보다 빨리 측정 가능한 임상 결과. IMM 또는 다른 임상적 이익 합리적 예측.

사례: - 심부전 시험에서 운동 내성 - 조산 시험에서 분만 지연

사용: Full approval 또는 accelerated approval 가능. 단 후속 시험 필요.

3.4 4: Surrogate Endpoint

환자 기능·생존의 직접 측정 대체. 임상 이익 예측 기대.

3.5 Surrogate 의 3 단계 분류 (FDA 규제 관점)

3.5.1 4a. Validated Surrogate Endpoint

명확한 mechanistic rationale + 강한 임상 데이터로 입증. Traditional approval 지원 가능.

사례 분야
HbA1c 감소 당뇨 미세혈관 합병증
HIV-RNA 감소 HIV 임상 진행
LDL 콜레스테롤 감소 스타틴 → 심혈관 사건
혈압 감소 항고혈압제 → 뇌졸중·MI·사망

3.5.2 4b. Reasonably Likely Surrogate Endpoint

Mechanistic·epidemiological rationale 있지만 임상 데이터 불충분. Accelerated approval 가능. 후속 시험 필수.

사례 분야
6 개월 객담 배양 + 재발률 폐결핵

3.5.3 4c. Candidate Surrogate Endpoint

예측력 평가 중. 효능 시험에 피해야.

4 Schulz 의 BEST 비판

Schulz 의 우려: “BEST guidelines 가 self-serving 으로 보일 수 있음. ‘Reasonably likely’ 카테고리 하에 bedaquiline 같은 약 승인 — 사망률 5 배 증가에도.”

4.1 사례 분석

Bedaquiline (2012 FDA 승인). Surrogate: 객담 배양 + 재발률. 결과: 사망 5 배.

그러나 BEST 분류로는 “reasonably likely”. 즉 분류 자체가 위험한 약 승인 정당화 도구가 될 수 있음.

Schulz 의 결론: “Approval remains puzzling. 분류 framework 가 좋더라도 적용의 무결성 이 핵심.”

5 Way Forward — Schulz 의 권고

5.1 권고 1 — Outcomes that Matter

“Most circumstances, trials should focus on outcomes that matter.”

5.2 예외 — Surrogate 사용이 정당한 경우

예외 정당화
매우 천천히 진행하는 치명 질환 (예: ALS) True endpoint 측정에 너무 오래
희귀 질환 Sample size 부족
검증된 surrogate (Level 2) 위험 작음

5.3 권고 2 — Validation 의 strict 적용

Validated 라벨은 큰 prospective 시험 + 다양한 처치 클래스 검증 후에만.”

5.4 권고 3 — 자원 배분의 윤리

Schulz 의 통찰:

“임상 연구 자원은 유한. Invalid surrogate 시험 1800+ 편 (oral contraception + coagulation 사례). 모두 coagulation test 가 venous thromboembolism 예측 못함 결론. 자원 낭비 = 다른 가치 있는 시험 못함 = 환자 손해.”

5.5 권고 4 — Researchers’ Fiduciary Responsibility

Research has a fiduciary responsibility to society. Invalid surrogate 시험은 연구비·시간·환자 자원 낭비.”

6 미래 방향 — Sophisticated Approaches

6.1 Meta-Analysis 기반 Validation

여러 시험의 surrogate 효과 + true endpoint 효과 메타분석. 두 효과 일관 하면 validation 가능.

한계 (Schulz 의 비판): “Aggregation of incomplete information cannot plug the gaps. Empirical evidence of validity still needed.”

6.2 Causal Mediation Analysis

Surrogate 가 처치-결과 경로의 mediator 인지 검증. 통계적으로 direct vs indirect effect 분리.

6.3 Multi-Trial Surrogate Trial

Surrogate 와 true endpoint 모두 측정 한 큰 시험. 그러나 비용 폭증.

7 Researcher 의 책임

7.1 Ethical Imperatives

Schulz 의 강한 입장:

“Poor-quality research is unethical.” (Altman 1994, von Elm & Egger 2004)

이유:

  1. 환자가 동의한 시험 위험 학문적 기여 없이 소멸
  2. 연구비 자원기회비용
  3. 잘못된 결과 가 임상 결정 왜곡 → 환자 해
  4. 향후 시험에 대한 신뢰 약화

7.2 Schulz 의 결론

“Researchers have a fiduciary responsibility to society. Invalid surrogate 사용 시험은 환자에게 해로움.”

8 결론 — Ch.18.3 의 한 줄 요약

용어 표준화는 진보지만 분류만으로는 위험 약 차단 못함. Validation 의 무결성이 핵심.

핵심 메시지:

  1. BEST Resource (2016) — 6 가지 endpoint 분류
  2. Validated > Reasonably Likely > Candidate — 3 단계 surrogate
  3. Schulz 의 비판 — Bedaquiline 의 ‘reasonably likely’ 분류 우려
  4. Way Forward — Validated surrogate 만 사용, 그 외는 true endpoint
  5. Fiduciary responsibility — 연구자의 사회적 책임

다음 글: Composite outcomes 의 함정.

9 관련 주제

10 참고문헌

  • Schulz, K. F. & Grimes, D. A. (2019). Essential Concepts in Clinical Research (2nd ed.), Ch.18. Elsevier.
  • Robb, M. A., McInnes, P. M., Califf, R. M. (2016). Biomarkers and surrogate endpoints. JAMA 315, 1107-1108.
  • FDA-NIH Biomarker Working Group. (2016). BEST (Biomarkers, EndpointS, and other Tools) Resource.
  • IOM (Institute of Medicine). (2010). Evaluation of Biomarkers and Surrogate Endpoints in Chronic Disease. National Academies Press.
  • Altman, D. G. (1994). The scandal of poor medical research. BMJ 308, 283-284.
  • von Elm, E. & Egger, M. (2004). The scandal of poor epidemiological research. BMJ 329, 868-869.
  • Stanczyk, F. Z. & Grimes, D. A. (2008). Sex hormone-binding globulin: not a surrogate marker. Contraception 78, 201-203.

Subscribe

Enjoy this blog? Get notified of new posts by email: