선별 검사 (Screening) 개관

Schulz & Grimes Ch.8 — Screening Tests overview

선별 검사의 정의·5 가지 핵심 평가 차원 (validity, predictive value, combinations, lead-time/length bias, ethics) 을 한 번에 조망한다. 진단 검사와 선별 검사의 차이, WHO Wilson-Jungner 10 기준의 의미, 그리고 IT 분류기 평가 (precision/recall) 와의 직접 매핑을 추상 → 일상어 → 반사실 3 단계 직관으로 정리한다.

Experimentation
Epidemiology
저자

Kwangmin Kim

공개

2026년 05월 08일

1 진단 vs 선별 — 같은 도구, 다른 맥락

정의: 진단 검사 vs 선별 검사
  • 진단 검사 (Diagnostic test): 증상이 있는 환자에서 질병을 확진/배제.
  • 선별 검사 (Screening test): 증상이 없는 인구에서 질병을 조기 발견.

핵심 차이는 사전 확률 (pretest probability) — 진단 검사는 ↑, 선별 검사는 ↓ (Schulz & Grimes, 2019, Ch.8).

3 단계 직관:

  • 추상: \(P(D) \cdot \text{LR}^+ / [P(D) \cdot \text{LR}^+ + (1-P(D))]\) 가 사후 확률. P(D) 가 작으면 (선별), 같은 LR 이라도 PPV 작음.
  • 일상어 비유: 폐렴 의심 환자의 X-ray = 진단. 무증상 직장인의 결핵 X-ray = 선별. 같은 도구지만 결과 해석이 완전 다름.
  • 반사실: 선별과 진단을 혼동하면 “Why are you screening symptomatic patients?” 또는 “Why diagnose asymptomatic?” 같은 부적절성 발생.

2 Ch.8 의 5 차원 — 선별 검사 평가의 격자

선별 검사 5 차원
│
├── 1. Validity (타당도)         → Sensitivity, Specificity   [B35]
├── 2. Predictive Value          → PPV, NPV (prevalence 의존)  [B35]
├── 3. Combinations              → Sequential vs Parallel    [B36]
├── 4. Time-related Biases       → Lead-time, Length bias    [B37]
└── 5. Ethics + Wilson-Jungner   → 도입 기준 10 가지           [B34]

이 5 차원이 모두 충족되어야 선별 프로그램이 인구 단위 이익을 만든다.

3 Wilson & Jungner 10 기준 (1968)

정의: Wilson-Jungner 10 Criteria

WHO 가 1968 년 발표한 선별 프로그램 도입 기준 (Wilson & Jungner, 1968).

  1. Important health problem — 인구 단위 부담 ↑.
  2. Treatment available — 발견 후 치료 가능.
  3. Diagnosis & treatment facilities — 인프라 존재.
  4. Recognizable latent stage — 전증상 단계 식별 가능.
  5. Suitable test — 타당도 + 수용성.
  6. Test acceptable — 환자가 받아들임.
  7. Natural history understood — 질병 진행 알려져 있음.
  8. Policy on whom to treat — 양성자 처치 명확.
  9. Cost-benefit balance — 경제적 정당성.
  10. Continuing process — 일회성 아닌 지속.

(Schulz & Grimes, 2019, Ch.8.1).

3.1 직관 — 왜 10 기준인가

직관 3 단계: 10 기준의 인과 사슬
  • 추상: 선별 검사 → 조기 발견 → 조기 치료 → 결과 ↑. 이 사슬의 각 link 에 한 기준이 대응. 모든 link 가 작동해야 인구 효과.
  • 일상어 비유: 컨베이어 벨트의 각 단계 — 한 단계라도 멈추면 전체 멈춤. 10 기준이 컨베이어의 각 station.
  • 반사실: 만약 치료가 불가능 (#2 위반) 이라면 조기 발견의 가치 0. 또는 자연사가 미지 (#7 위반) 이라면 조기 발견의 의미 모호.

3.2 사례 — 위반 시 비용

위반 결과
#2 (치료 없음) 조기 발견의 환자 이익 0, 불안만 ↑
#4 (전증상 없음) 검사 자체가 너무 늦음
#5 (Sn/Sp 부족) 다수 false positive/negative
#9 (비용 ↑) 자원 낭비

이 기준의 모범적 적용 — 자궁경부암 검진 (Pap test) — 모든 10 기준 충족.

4 차원 1 — Validity (Sn/Sp)

핵심 통계는 다음 2x2 표.

질병 + 질병 -
검사 + TP FP
검사 - FN TN
정의: Sensitivity 와 Specificity

\[ \text{Sensitivity (Sn)} = \frac{TP}{TP + FN} = P(\text{Test+} \mid D+) \]

\[ \text{Specificity (Sp)} = \frac{TN}{TN + FP} = P(\text{Test-} \mid D-) \]

직관 3 단계: 두 측도의 직교성
  • 추상: Sn 은 양성 사례의 검사 양성률, Sp 는 음성 사례의 검사 음성률. 두 측도는 서로 독립.
  • 일상어 비유: 화재경보기. Sn = 진짜 화재 시 울리는 비율, Sp = 화재 없을 때 안 울리는 비율. 두 측도가 trade-off (예민한 경보기는 false alarm ↑).
  • 반사실: 한 측도만 보면 trade-off 못 봄. ROC 곡선이 모든 cut-point 의 (Sn, Sp) 쌍을 시각화.

5 차원 2 — Predictive Value

PPV / NPV 가 환자 의사 결정에 직접 사용되는 측도.

정의: PPV 와 NPV

\[ \text{PPV} = \frac{TP}{TP + FP} = P(D+ \mid \text{Test+}) \]

\[ \text{NPV} = \frac{TN}{TN + FN} = P(D- \mid \text{Test-}) \]

5.1 Bayes 변환 — Prevalence 와의 연결

\[ \text{PPV} = \frac{\text{Sn} \cdot P(D)}{\text{Sn} \cdot P(D) + (1 - \text{Sp})(1 - P(D))} \]

직관 3 단계: PPV 가 prevalence 에 의존하는 이유
  • 추상: PPV 는 사후 확률 — 사전 확률 P(D) 가 변하면 PPV 도 변함. Sn, Sp 일정.
  • 일상어 비유: 같은 진단 도구라도 흔한 병의 양성 검사는 진성 가능성 ↑, 희귀병의 양성 검사는 진성 가능성 ↓.
  • 반사실: P(D) = 1% 면 Sn=99%, Sp=99% 인 검사도 PPV = 50%. 99% 정확도 검사인데 양성 결과의 절반이 거짓.

상세는 B35 에서.

6 차원 3 — Tests in Combination

정의: Sequential vs Parallel Testing

Sequential: 첫 검사 양성자만 두 번째 검사. 둘 다 양성이면 진성. - Sn 감소, Sp 증가. - HIV: Sequential (ELISA → Western Blot).

Parallel: 두 검사 동시 수행. 한 검사라도 양성이면 양성. - Sn 증가, Sp 감소. - 응급 상황 (심근경색): troponin + CK-MB + EKG.

직관: 두 조합의 trade-off
  • 추상: Sequential 은 Sp 우선 (false positive 회피), Parallel 은 Sn 우선 (false negative 회피).
  • 일상어 비유: 시험에서 두 면접 모두 통과해야 합격 (sequential = 까다로움) vs 둘 중 하나만 통과해도 합격 (parallel = 너그러움).

8 차원 5 — Ethics

가정 위반: 선별 = 항상 좋다

Schulz 의 윤리 비판: - 무증상자에게 검사 권유 → 양성 시 불안 + 추가 검사·치료의 위험. - False positive → 불필요 침습적 시술. - Overdiagnosis → 의학적 무관 종양도 치료.

3 단계 직관:

  • 추상: 선별의 expected value = (true positive 이익) - (false positive 해) - (overdiagnosis 해) - (검사 자체의 해). 음수 가능.
  • 일상어 비유: 모든 사람에게 매년 종합 건강 검진 — 일부는 이익, 일부는 비용·불안·의료 사고.
  • 반사실: 위험군만 선별 (high-risk strategy) → 양성 사례 비율 ↑ → PPV ↑ → expected value 양수.

9 IT 대응 — 분류기 평가의 직접 매핑

의학 선별 IT 분류기
Sensitivity (Sn) Recall
Specificity (Sp) True Negative Rate
PPV Precision
NPV Negative Predictive Value
1 - Sp False Positive Rate
ROC 곡선 ROC 곡선 (직접 동일)
Lead-time bias A/B 테스트의 첫 노출 효과 (novelty)

이 매핑이 직접 — 선별 검사의 역학과 IT 분류기 평가가 같은 통계 프레임워크. 자세한 통합은 Diagnostic & Screening Measures: 진단·분류 평가 지표 종합 참조.

10 결론 — Ch.8 시리즈 길잡이

주제
B33 (이 글) Overview + Wilson-Jungner
B34 Ethics + Criteria 상세
B35 Validity (Sn/Sp) + PV (PPV/NPV) + Bayes
B36 Sequential + Parallel combinations
B37 Lead-time + Length bias + 가이드라인

각 글이 위 차원을 깊이 다룬다.

11 관련 주제

선행

Phase B SCH Ch.8 후속

다른 카테고리

Subscribe

Enjoy this blog? Get notified of new posts by email: