Kwangmin Kim - LR 의 다양한 형태 — 0~1, 큰 LR, Multi-level

1 LR Between 0 and 1 — 음성 결과의 정보

정의: LR < 1 의 의미

LR < 1 인 결과는 사후 확률이 사전 확률보다 낮음. 즉 검사가 진단을 배제하는 방향.

\[ \text{Posttest odds} = \text{Pretest odds} \cdot \text{LR} \]

LR = 0.5 → posttest odds 가 pretest 의 절반. LR = 0.1 → posttest odds 가 pretest 의 1/10.

1.1 직관 3 단계 — 음성 결과의 해석

추상: LR < 1 은 진단을 향한 부정 정보. Bayes 변환에서 odds 를 ↓.
일상어 비유: 시험 한 문제 틀림 → 합격 가능성 ↓. 한 문제로 결정 안 되지만 누적 영향.
반사실: LR = 1 은 정보 0 — 양성·음성 결과가 같은 분포에서 나옴. LR ≠ 1 만 정보 가짐.

1.2 작은 LR 의 임상 의의

LR	임상 의의
0.5~1	무의미
0.2~0.5	약한 음성
0.1~0.2	의미 있는 음성
< 0.1	강한 음성 (배제 도구)

D-dimer LR- ≈ 0.03 같은 매우 작은 LR 이 강한 배제 도구.

2 Some Large LRs — 큰 LR 의 임상 활용

사례: 매우 큰 LR 의 검사

검사	LR	활용
HIV ELISA + Western Blot	LR+ ≈ 1000+	진단 거의 확정
결핵 PCR (acid-fast bacilli +)	LR+ ≈ 100+	결핵 확정
Troponin 정량 (10x normal)	LR+ ≈ 100+	MI 확정
갑상선 결절 FNA cytology	카테고리별 LR	양성·악성 분류

LR > 100 이면 사전 확률 1% 도 사후 50% 로 변경 → 진단 결정.

2.1 직관 — 큰 LR 의 효과

직관 3 단계: LR 100 의 효과

추상: Pretest 1% (odds 1:99) × LR 100 → posttest odds 100:99 ≈ 50%. 즉 1% → 50% 큰 변화.
일상어 비유: 50 배 확대경 — 작은 차이도 명확히 보이게 함.
반사실: LR 1.5 같은 약한 검사는 100 회 반복해야 비슷한 효과. 하나의 강한 검사가 효율 ↑.

3 Multiple Outcomes — Multi-level Test

정의: Multi-level Likelihood Ratio

연속·순서 검사의 각 카테고리 \(k\) 에 대한 LR.

\[ \text{LR}_k = \frac{P(T = k \mid D+)}{P(T = k \mid D-)} \]

이분 검사는 multi-level 의 특수 경우 (k=2).

3.1 사례 — Wells Score 와 PE

사례: Wells Score 의 multi-level

(Wells et al., 2000):

Wells Score	LR for PE	사전 → 사후 (15% pretest)
< 2 (low)	0.13	15% → 2%
2~6 (moderate)	1.82	15% → 24%
> 6 (high)	6.75	15% → 54%

3 단계 직관:

추상: 같은 검사값 (Wells score) 의 다른 카테고리가 다른 LR. 이분 분류는 정보 폐기.
일상어 비유: 시험 점수를 ABCDF 5 등급으로 — 합격/불합격 2 분류보다 풍부.
반사실: Wells score 를 0~6 / >6 로만 이분하면 카테고리 정보 손실. Multi-level 이 정보 효율 ↑.

3.2 Multi-level 의 분석

각 카테고리의 LR 을 산출하려면 더 큰 표본 필요 (각 카테고리에서 D+/D- 측정).

가정 위반: 카테고리 표본 부족

가설: 갑상선 결절 FNA cytology 6 카테고리 (정상, atypia, FN, FN-suspicious, malignant, …). 각 카테고리에서 충분한 D+/D- 표본 없음.

3 단계 직관:

추상: \(n_k \to 0\) 면 LR_k 분산 ↑. CI 매우 wide.
일상어 비유: 각 등급에 학생 1 명만 있으면 등급별 평균 신뢰성 0.
반사실: 카테고리 합치거나 (예: high vs low) 더 큰 표본 모음 → 신뢰성 ↑.

4 LR 의 결합 — 다중 검사

정의: 다중 검사의 LR 결합

두 검사가 조건부 독립 가정 하에:

\[ \text{Posttest odds} = \text{Pretest odds} \cdot \text{LR}_1 \cdot \text{LR}_2 \]

조건부 독립 가정: \(T_1 \perp T_2 \mid D\) — 같은 disease state 에서 두 검사 결과가 독립.

가정 위반: 두 검사가 강한 상관

가설: Troponin + CK-MB 두 검사. 둘 다 심근 손상 marker → 강한 양의 상관.

진성: 같은 환자에서 troponin ↑ 면 CK-MB 도 ↑ 가능성 ↑. 두 검사가 독립이 아님.

결과: 단순 곱셈은 LR 을 과대 평가. 조건부 독립 가정 깨짐.

3 단계 직관:

추상: \(\text{Cov}(T_1, T_2 \mid D) > 0\) → 결합 정보가 단순 곱셈보다 작음.
일상어 비유: 같은 책 두 페이지 읽기 — 두 번째 추가 정보가 첫보다 작음.
반사실: 다른 도메인 검사 (영상 + 혈액 + 임상) 가 더 독립 → 곱셈 가정 더 타당.

4.1 해법 — Joint LR

조건부 독립 가정 깨질 때 직접 결합 LR 측정.

\[ \text{LR}_{\text{joint}} = \frac{P(T_1, T_2 \mid D+)}{P(T_1, T_2 \mid D-)} \]

이는 표본의 결합 분포에서 직접 계산. 단순 곱셈 가정 회피.

5 ML 분류기와의 관계

직관: Naive Bayes 의 직접 매핑

추상: Naive Bayes Classifier = 조건부 독립 가정 + 다중 검사 LR 곱셈.
일상어 비유: 여러 증거 점수 합산하는 판정. 각 증거의 가중치가 LR.
반사실: 독립 가정 위반 시 GBM, Random Forest 같은 더 유연한 분류기. 그러나 LR 의 단순함이 임상 활용에 유리.

6 결론

LR 의 다양한 형태 — 작은 (배제), 큰 (확정), multi-level (정보 보존), joint (다중 검사 결합) — 모두 같은 Bayes 변환의 응용. 이분 검사의 단순화 비용이 multi-level 의 정보 보존으로 보상. 임상 활용에서는 검사의 LR 분포를 종합적으로 이해해야.

다음 글(B42)에서는 사전 확률 추정과 진단·치료 임계값을 본다.

7 관련 주제

LR overview
이분 검사 LR
Cut-point 와 Fagan nomogram
1111-11-11, Pretest + Threshold + Limitations