1 LR Between 0 and 1 — 음성 결과의 정보
LR < 1 인 결과는 사후 확률이 사전 확률보다 낮음. 즉 검사가 진단을 배제하는 방향.
\[ \text{Posttest odds} = \text{Pretest odds} \cdot \text{LR} \]
LR = 0.5 → posttest odds 가 pretest 의 절반. LR = 0.1 → posttest odds 가 pretest 의 1/10.
1.1 직관 3 단계 — 음성 결과의 해석
- 추상: LR < 1 은 진단을 향한 부정 정보. Bayes 변환에서 odds 를 ↓.
- 일상어 비유: 시험 한 문제 틀림 → 합격 가능성 ↓. 한 문제로 결정 안 되지만 누적 영향.
- 반사실: LR = 1 은 정보 0 — 양성·음성 결과가 같은 분포에서 나옴. LR ≠ 1 만 정보 가짐.
1.2 작은 LR 의 임상 의의
| LR | 임상 의의 |
|---|---|
| 0.5~1 | 무의미 |
| 0.2~0.5 | 약한 음성 |
| 0.1~0.2 | 의미 있는 음성 |
| < 0.1 | 강한 음성 (배제 도구) |
D-dimer LR- ≈ 0.03 같은 매우 작은 LR 이 강한 배제 도구.
2 Some Large LRs — 큰 LR 의 임상 활용
| 검사 | LR | 활용 |
|---|---|---|
| HIV ELISA + Western Blot | LR+ ≈ 1000+ | 진단 거의 확정 |
| 결핵 PCR (acid-fast bacilli +) | LR+ ≈ 100+ | 결핵 확정 |
| Troponin 정량 (10x normal) | LR+ ≈ 100+ | MI 확정 |
| 갑상선 결절 FNA cytology | 카테고리별 LR | 양성·악성 분류 |
LR > 100 이면 사전 확률 1% 도 사후 50% 로 변경 → 진단 결정.
2.1 직관 — 큰 LR 의 효과
- 추상: Pretest 1% (odds 1:99) × LR 100 → posttest odds 100:99 ≈ 50%. 즉 1% → 50% 큰 변화.
- 일상어 비유: 50 배 확대경 — 작은 차이도 명확히 보이게 함.
- 반사실: LR 1.5 같은 약한 검사는 100 회 반복해야 비슷한 효과. 하나의 강한 검사가 효율 ↑.
3 Multiple Outcomes — Multi-level Test
연속·순서 검사의 각 카테고리 \(k\) 에 대한 LR.
\[ \text{LR}_k = \frac{P(T = k \mid D+)}{P(T = k \mid D-)} \]
이분 검사는 multi-level 의 특수 경우 (k=2).
3.1 사례 — Wells Score 와 PE
(Wells et al., 2000):
| Wells Score | LR for PE | 사전 → 사후 (15% pretest) |
|---|---|---|
| < 2 (low) | 0.13 | 15% → 2% |
| 2~6 (moderate) | 1.82 | 15% → 24% |
| > 6 (high) | 6.75 | 15% → 54% |
3 단계 직관:
- 추상: 같은 검사값 (Wells score) 의 다른 카테고리가 다른 LR. 이분 분류는 정보 폐기.
- 일상어 비유: 시험 점수를 ABCDF 5 등급으로 — 합격/불합격 2 분류보다 풍부.
- 반사실: Wells score 를 0~6 / >6 로만 이분하면 카테고리 정보 손실. Multi-level 이 정보 효율 ↑.
3.2 Multi-level 의 분석
각 카테고리의 LR 을 산출하려면 더 큰 표본 필요 (각 카테고리에서 D+/D- 측정).
가설: 갑상선 결절 FNA cytology 6 카테고리 (정상, atypia, FN, FN-suspicious, malignant, …). 각 카테고리에서 충분한 D+/D- 표본 없음.
3 단계 직관:
- 추상: \(n_k \to 0\) 면 LR_k 분산 ↑. CI 매우 wide.
- 일상어 비유: 각 등급에 학생 1 명만 있으면 등급별 평균 신뢰성 0.
- 반사실: 카테고리 합치거나 (예: high vs low) 더 큰 표본 모음 → 신뢰성 ↑.
4 LR 의 결합 — 다중 검사
두 검사가 조건부 독립 가정 하에:
\[ \text{Posttest odds} = \text{Pretest odds} \cdot \text{LR}_1 \cdot \text{LR}_2 \]
조건부 독립 가정: \(T_1 \perp T_2 \mid D\) — 같은 disease state 에서 두 검사 결과가 독립.
가설: Troponin + CK-MB 두 검사. 둘 다 심근 손상 marker → 강한 양의 상관.
진성: 같은 환자에서 troponin ↑ 면 CK-MB 도 ↑ 가능성 ↑. 두 검사가 독립이 아님.
결과: 단순 곱셈은 LR 을 과대 평가. 조건부 독립 가정 깨짐.
3 단계 직관:
- 추상: \(\text{Cov}(T_1, T_2 \mid D) > 0\) → 결합 정보가 단순 곱셈보다 작음.
- 일상어 비유: 같은 책 두 페이지 읽기 — 두 번째 추가 정보가 첫보다 작음.
- 반사실: 다른 도메인 검사 (영상 + 혈액 + 임상) 가 더 독립 → 곱셈 가정 더 타당.
4.1 해법 — Joint LR
조건부 독립 가정 깨질 때 직접 결합 LR 측정.
\[ \text{LR}_{\text{joint}} = \frac{P(T_1, T_2 \mid D+)}{P(T_1, T_2 \mid D-)} \]
이는 표본의 결합 분포에서 직접 계산. 단순 곱셈 가정 회피.
5 ML 분류기와의 관계
- 추상: Naive Bayes Classifier = 조건부 독립 가정 + 다중 검사 LR 곱셈.
- 일상어 비유: 여러 증거 점수 합산하는 판정. 각 증거의 가중치가 LR.
- 반사실: 독립 가정 위반 시 GBM, Random Forest 같은 더 유연한 분류기. 그러나 LR 의 단순함이 임상 활용에 유리.
6 결론
LR 의 다양한 형태 — 작은 (배제), 큰 (확정), multi-level (정보 보존), joint (다중 검사 결합) — 모두 같은 Bayes 변환의 응용. 이분 검사의 단순화 비용이 multi-level 의 정보 보존으로 보상. 임상 활용에서는 검사의 LR 분포를 종합적으로 이해해야.
다음 글(B42)에서는 사전 확률 추정과 진단·치료 임계값을 본다.