Kwangmin Kim - Pretest Probability + 진단 임계값 + LR 의 한계

1 Pretest Probability — Bayes 의 출발점

정의: Pretest Probability

검사 시행 전 환자가 질병을 가질 사전 확률 (Schulz & Grimes, 2019, Ch.9.5).

\[ P(D+) = \text{Pretest probability} \]

핵심: Bayes 의 모든 사후 확률은 사전 확률에 의존. 사전 추정이 정직해야.

1.1 사전 확률 추정의 3 단계

직관 3 단계: Pretest 추정의 도구

1 단계 (인구 baseline): Prevalence — 일반 인구에서의 질병 비율. 시작점.
2 단계 (임상 조정): 환자의 증상·병력·인구학적 특성에 따라 조정. 주관적이나 임상 경험 기반.
3 단계 (Clinical Decision Rule): PERC (Pulmonary Embolism Rule-out Criteria), Wells score, Geneva score 등 점수 → 카테고리별 사전 확률 직접 산출.

일상어 비유: 시험에서 합격할 확률 = (전체 합격률) → (이 학생의 평균 점수 조정) → (모의고사 점수로 정밀 추정).

1.2 사례 — PE 의 Pretest

단계	추정
인구 baseline	< 1% (응급실 일반 환자)
임상 조정 (호흡곤란·흉통)	5~10%
Wells score 결과	low: 5%, moderate: 17%, high: 50%

각 단계에서 사전 확률이 정밀화. 결국 검사 결정에 사용되는 것은 가장 정밀한 추정.

가정 위반: Subjective Pretest 의 의사 간 변동

Schulz 의 우려: 임상 조정의 주관성. 같은 환자도 의사마다 사전 확률 추정이 5% ~ 30% 변동 가능.

3 단계 직관:

추상: \(E[\text{Pretest}_{\text{doctor 1}}] \neq E[\text{Pretest}_{\text{doctor 2}}]\). 의사 간 inter-rater reliability 낮음.
일상어 비유: 두 의사의 임상 추정이 다르면 같은 검사 결과도 다른 진단 결정.
반사실: Clinical Decision Rule (Wells, PERC 등) 사용 → 객관적 사전 확률. Inter-rater reliability ↑.

2 Test Threshold + Treatment Threshold (Pauker & Kassirer, 1980)

정의: 두 임계값

Test Threshold (검사 임계값): 검사할 가치가 있는 최소 사전 확률. Treatment Threshold (치료 임계값): 추가 검사 없이 치료할 사후 확률.

Pretest probability range:
0 ─── Test Threshold ─── Pretest ─── Treatment Threshold ─── 1

[0, Test Threshold)            : 검사 안 함 (이미 충분히 낮음)
[Test, Treatment]              : 검사 시행
[Treatment Threshold, 1]       : 검사 없이 치료

(Pauker & Kassirer, 1980; Schulz & Grimes, 2019, Ch.9.6).

2.1 직관 3 단계 — 두 임계값의 의사 결정

추상: Test threshold 아래는 검사의 expected value < 검사 비용. Treatment threshold 위는 추가 검사의 정보 가치 < 치료 지연 비용.
일상어 비유: 자동차 점검 — 거의 새 차는 점검 안 함, 오래된 차는 그냥 수리. 중간 정도가 점검 가치.
반사실: 두 임계값을 무시하면 자원 낭비 (불필요 검사) 또는 환자 해 (지연 진단·치료).

2.2 임계값 산출 — 비용 분석

\[ \text{Test Threshold} = \frac{C_{\text{FP test}} \cdot (1 - \text{Sp})}{C_{\text{FP test}} \cdot (1 - \text{Sp}) + C_{\text{FN test}} \cdot \text{Sn}} \]

(단순화 형태). 비용·이익 비대칭이 임계값 결정.

직관: 임계값의 비용 의존

추상: Test threshold 가 false positive 비용 / false negative 비용 의 함수.
일상어 비유: 매우 비싼 추가 시술 (false positive 부담 ↑) → test threshold ↑. 치료 지연 위험 ↑ (false negative 부담 ↑) → test threshold ↓.
반사실: 비용 분석 없이 단순 “양성/음성” 결정은 비용·이익 무시 → 자원 낭비.

2.3 사례 — PE 의 Test/Treatment Thresholds

가설: - PE 진단의 비용 (CT angio): low. - PE 치료의 비용 (heparin + 출혈 위험): moderate. - PE 미치료의 비용 (사망 + 합병증): very high.

Threshold: - Test threshold: 약 1~2% (낮음 — 검사 부담 작음). - Treatment threshold: 약 50~70% (높음 — 치료 부담 있음).

임상 활용: PERC 음성 + Wells low → 사전 확률 < 2% → test threshold 아래 → CT 검사 안 함. PERC 양성 또는 Wells high → 사전 ≥ 5% → 검사 시행. CT 양성 → 사후 ≥ 90% → 치료.

3 LR 의 본질적 한계

가정 위반: LR 이 모든 답이 아니다

한계 1 — 환자 개별성 무시: LR 은 인구 평균 정보. 개별 환자의 unique 특성 (유전, 인종, 동반 질환) 미반영.

한계 2 — Spectrum Bias: LR 이 측정된 표본의 spectrum (mild ~ severe) 이 일반 인구와 다를 수 있음. Severe 만 표본 → LR+ 부풀려짐.

한계 3 — 측정 가변성: 같은 검사라도 lab·기기·시간에 따라 LR 변동. 표준화 부족.

한계 4 — 결과 해석의 인지 부담: 비대칭·multi-level LR 의 임상 적용은 인지 부담. 단순 binary 가 더 활용 ↑.

3 단계 직관:

추상: 통계 정보의 풍부함 vs 임상 활용성의 trade-off.
일상어 비유: 매우 정밀한 측정 도구라도 사용 어려우면 활용 ↓.
반사실: Bedside calculator + Decision Support 시스템 → LR 활용 ↑.

3.1 Spectrum Bias 의 사례

가설: Troponin 의 LR+ 가 ER 표본 (severe MI 포함) 에서 측정되었다. 외래 환자 (mild symptom) 에 적용하면 mild MI 의 troponin 분포가 다를 수 있어 LR+ 부정확.

직관: 표본 일반화의 한계

추상: \(P(T \mid D)\) 가 표본의 disease severity 에 의존 → spectrum bias.
일상어 비유: 한 학교 학생들로 만든 시험을 다른 학교에 적용하면 정확도 ↓.
반사실: 외래·응급실·중환자실 등 spectrum 별 LR 따로 측정·보고.

4 SCH Ch.9 시리즈 마무리

SCH Ch.9 Likelihood Ratio 시리즈 (5 편 마무리)
│
├── B38: Overview
├── B39: 이분 검사 + Why Bother
├── B40: Cut-point + Fagan
├── B41: 다양한 형태 + Multi-level
└── B42: Pretest + Threshold + Limitations (이 글)

다음 묶음 (WOO Ch.4.5~4.6 — Standardisation + Mantel-Haenszel, B43~B46) 은 인구 비교의 표준화 도구 — direct/indirect standardisation, SMR, Mantel-Haenszel — 을 4 편으로.

5 관련 주제

SCH Ch.9 시리즈 (완성)

다음 묶음 (WOO Ch.4)

1111-11-11, Standardisation + MH overview
Diagnostic & Screening Measures — 통합 정리