1 Pretest Probability — Bayes 의 출발점
검사 시행 전 환자가 질병을 가질 사전 확률 (Schulz & Grimes, 2019, Ch.9.5).
\[ P(D+) = \text{Pretest probability} \]
핵심: Bayes 의 모든 사후 확률은 사전 확률에 의존. 사전 추정이 정직해야.
1.1 사전 확률 추정의 3 단계
- 1 단계 (인구 baseline): Prevalence — 일반 인구에서의 질병 비율. 시작점.
- 2 단계 (임상 조정): 환자의 증상·병력·인구학적 특성에 따라 조정. 주관적이나 임상 경험 기반.
- 3 단계 (Clinical Decision Rule): PERC (Pulmonary Embolism Rule-out Criteria), Wells score, Geneva score 등 점수 → 카테고리별 사전 확률 직접 산출.
일상어 비유: 시험에서 합격할 확률 = (전체 합격률) → (이 학생의 평균 점수 조정) → (모의고사 점수로 정밀 추정).
1.2 사례 — PE 의 Pretest
| 단계 | 추정 |
|---|---|
| 인구 baseline | < 1% (응급실 일반 환자) |
| 임상 조정 (호흡곤란·흉통) | 5~10% |
| Wells score 결과 | low: 5%, moderate: 17%, high: 50% |
각 단계에서 사전 확률이 정밀화. 결국 검사 결정에 사용되는 것은 가장 정밀한 추정.
Schulz 의 우려: 임상 조정의 주관성. 같은 환자도 의사마다 사전 확률 추정이 5% ~ 30% 변동 가능.
3 단계 직관:
- 추상: \(E[\text{Pretest}_{\text{doctor 1}}] \neq E[\text{Pretest}_{\text{doctor 2}}]\). 의사 간 inter-rater reliability 낮음.
- 일상어 비유: 두 의사의 임상 추정이 다르면 같은 검사 결과도 다른 진단 결정.
- 반사실: Clinical Decision Rule (Wells, PERC 등) 사용 → 객관적 사전 확률. Inter-rater reliability ↑.
2 Test Threshold + Treatment Threshold (Pauker & Kassirer, 1980)
Test Threshold (검사 임계값): 검사할 가치가 있는 최소 사전 확률. Treatment Threshold (치료 임계값): 추가 검사 없이 치료할 사후 확률.
Pretest probability range:
0 ─── Test Threshold ─── Pretest ─── Treatment Threshold ─── 1
[0, Test Threshold) : 검사 안 함 (이미 충분히 낮음)
[Test, Treatment] : 검사 시행
[Treatment Threshold, 1] : 검사 없이 치료
(Pauker & Kassirer, 1980; Schulz & Grimes, 2019, Ch.9.6).
2.1 직관 3 단계 — 두 임계값의 의사 결정
- 추상: Test threshold 아래는 검사의 expected value < 검사 비용. Treatment threshold 위는 추가 검사의 정보 가치 < 치료 지연 비용.
- 일상어 비유: 자동차 점검 — 거의 새 차는 점검 안 함, 오래된 차는 그냥 수리. 중간 정도가 점검 가치.
- 반사실: 두 임계값을 무시하면 자원 낭비 (불필요 검사) 또는 환자 해 (지연 진단·치료).
2.2 임계값 산출 — 비용 분석
\[ \text{Test Threshold} = \frac{C_{\text{FP test}} \cdot (1 - \text{Sp})}{C_{\text{FP test}} \cdot (1 - \text{Sp}) + C_{\text{FN test}} \cdot \text{Sn}} \]
(단순화 형태). 비용·이익 비대칭이 임계값 결정.
- 추상: Test threshold 가 false positive 비용 / false negative 비용 의 함수.
- 일상어 비유: 매우 비싼 추가 시술 (false positive 부담 ↑) → test threshold ↑. 치료 지연 위험 ↑ (false negative 부담 ↑) → test threshold ↓.
- 반사실: 비용 분석 없이 단순 “양성/음성” 결정은 비용·이익 무시 → 자원 낭비.
2.3 사례 — PE 의 Test/Treatment Thresholds
가설: - PE 진단의 비용 (CT angio): low. - PE 치료의 비용 (heparin + 출혈 위험): moderate. - PE 미치료의 비용 (사망 + 합병증): very high.
Threshold: - Test threshold: 약 1~2% (낮음 — 검사 부담 작음). - Treatment threshold: 약 50~70% (높음 — 치료 부담 있음).
임상 활용: PERC 음성 + Wells low → 사전 확률 < 2% → test threshold 아래 → CT 검사 안 함. PERC 양성 또는 Wells high → 사전 ≥ 5% → 검사 시행. CT 양성 → 사후 ≥ 90% → 치료.
3 LR 의 본질적 한계
한계 1 — 환자 개별성 무시: LR 은 인구 평균 정보. 개별 환자의 unique 특성 (유전, 인종, 동반 질환) 미반영.
한계 2 — Spectrum Bias: LR 이 측정된 표본의 spectrum (mild ~ severe) 이 일반 인구와 다를 수 있음. Severe 만 표본 → LR+ 부풀려짐.
한계 3 — 측정 가변성: 같은 검사라도 lab·기기·시간에 따라 LR 변동. 표준화 부족.
한계 4 — 결과 해석의 인지 부담: 비대칭·multi-level LR 의 임상 적용은 인지 부담. 단순 binary 가 더 활용 ↑.
3 단계 직관:
- 추상: 통계 정보의 풍부함 vs 임상 활용성의 trade-off.
- 일상어 비유: 매우 정밀한 측정 도구라도 사용 어려우면 활용 ↓.
- 반사실: Bedside calculator + Decision Support 시스템 → LR 활용 ↑.
3.1 Spectrum Bias 의 사례
가설: Troponin 의 LR+ 가 ER 표본 (severe MI 포함) 에서 측정되었다. 외래 환자 (mild symptom) 에 적용하면 mild MI 의 troponin 분포가 다를 수 있어 LR+ 부정확.
- 추상: \(P(T \mid D)\) 가 표본의 disease severity 에 의존 → spectrum bias.
- 일상어 비유: 한 학교 학생들로 만든 시험을 다른 학교에 적용하면 정확도 ↓.
- 반사실: 외래·응급실·중환자실 등 spectrum 별 LR 따로 측정·보고.
4 SCH Ch.9 시리즈 마무리
SCH Ch.9 Likelihood Ratio 시리즈 (5 편 마무리)
│
├── B38: Overview
├── B39: 이분 검사 + Why Bother
├── B40: Cut-point + Fagan
├── B41: 다양한 형태 + Multi-level
└── B42: Pretest + Threshold + Limitations (이 글)
다음 묶음 (WOO Ch.4.5~4.6 — Standardisation + Mantel-Haenszel, B43~B46) 은 인구 비교의 표준화 도구 — direct/indirect standardisation, SMR, Mantel-Haenszel — 을 4 편으로.
5 관련 주제
SCH Ch.9 시리즈 (완성)
다음 묶음 (WOO Ch.4)
- 1111-11-11, Standardisation + MH overview
- Diagnostic & Screening Measures — 통합 정리