1 선별의 윤리적 함의
선별 검사는 무증상자에게 적용. 따라서 검사 자체와 후속 결과가 환자에게 해를 줄 수 있다 (Schulz & Grimes, 2019, Ch.8.1).
4 가지 잠재 해:
- False Positive 의 불안: 양성 결과가 나왔지만 진성 음성인 경우, 환자는 추가 검사·진단 과정에서 큰 불안 + 침습적 시술 위험.
- Overdiagnosis: 진성 양성이지만 평생 임상 의의 없는 종양 (예: 노년 전립선암의 일부) 도 발견·치료 → 부작용만.
- 검사 자체의 해: 방사선 노출 (mammography, CT), 침습 시술의 합병증.
- 자원 분산: 선별이 다른 의료 자원 사용을 줄임 — 옵트인 비용.
3 단계 직관:
- 추상: \(E[\text{net benefit}] = E[\text{ true positive 이익}] - \sum E[\text{harms}]\). 음수 가능.
- 일상어 비유: 매년 종합 건강 검진 — 진성 발견의 이익보다 검사 비용·불안·의료 사고가 더 클 수 있음.
- 반사실: High-risk strategy (위험군만) → 진성 양성 비율 ↑ → 평균 net benefit 양수.
2 Overdiagnosis — 가장 미묘한 함정
진성 양성 종양·질병 중 평생 임상 의의가 없을 사례를 발견·치료하는 것.
예시: - 전립선암: 80 대 남성의 다수가 사후 부검에서 잠재 전립선암 발견. 평생 증상 없을 사례 다수. - 갑상선암: 한국·일본·미국의 갑상선암 증가가 진성 발생 증가가 아닌 진단 증가 (overdiagnosis) 가 다수. - DCIS (유관상피내암): 일부는 침습 유방암으로 진행, 일부는 안 함.
(Welch et al., 2011 등).
- 추상: 발견 후 치료된 사례 — 그가 “치료 없으면 어떻게 됐을지” 알 수 없음. Counterfactual 미관측.
- 일상어 비유: 비행기에서 비상 착륙 후 “비상 착륙이 사고를 막았다” 라고 말하기 어려움 — 비상 착륙 안 했어도 무사할 가능성.
- 반사실: RCT 가 선별군 vs 비-선별군 비교로 진성 효과 측정 가능. 그러나 RCT 자체가 어렵고 윤리적 부담.
3 Wilson-Jungner 10 기준 상세
WHO 의 1968 권장. 각 기준이 선별 프로그램의 인과 사슬 한 link 에 대응 (Wilson & Jungner, 1968).
3.1 기준 1 — Important Health Problem
인구 단위에서 부담이 큰 질병만 선별 가치 ↑.
- Mortality: 사망률.
- Morbidity: 이환율 (장애 + QALY 손실).
- Cost: 의료·사회 비용.
희귀병의 선별은 인구 단위 이익이 작음 — 단, 발견 시 큰 임상 변화면 정당화 가능 (예: 신생아 PKU 검사).
3.2 기준 2 — Treatment Available
발견 후 효과적 치료가 있어야.
가설: Alzheimer 의 30 년 전 biomarker 가 발견되었으나 진성 치료 없음.
결과: 30 년의 불안 + 사회적 stigma. 이익 0.
3 단계 직관:
- 추상: 치료 가능성이 검사 가치의 multiplier. Multiplier = 0 면 검사 가치 0.
- 일상어 비유: 자동차 결함 발견했으나 수리 부품 없음 — 발견의 가치 작음.
- 반사실: 치료가 개발되면 (HIV 의 antiretroviral) 같은 검사가 큰 가치를 회복.
3.3 기준 3~4 — Infrastructure + Latent Stage
진단·치료 인프라 + 전증상 잠복기 식별 가능.
자궁경부암: HPV 감염 → CIN 1 → CIN 2/3 → 침습암. 각 전단계에서 Pap 또는 HPV 검사로 식별 + colposcopy/conization 으로 치료. 모든 link 작동.
3.4 기준 5~6 — Suitable + Acceptable Test
타당한 + 환자가 받아들이는 검사.
- 추상: \(\text{Yield} = \text{Sn} \cdot \text{Compliance}\). Compliance ↓ 하면 Sn 100% 도 무용.
- 일상어 비유: 가장 정확한 진단 도구라도 환자가 거부하면 사용 0.
- 반사실: 침습적 시술 (대장내시경) vs 비침습 (대변 잠혈) — 후자가 compliance ↑.
3.5 기준 7 — Natural History Understood
전증상 → 임상 → 결과의 진행이 알려져 있어야.
자연사가 미지면 “조기 발견의 의미” 자체가 모호. Schulz 의 사례 — 남성 전립선암의 자연사 (얼마나 진행할까?) 가 여전히 부분적 미지.
3.6 기준 8 — Treatment Policy Clear
양성자에게 무엇을 할지 명확.
이 기준이 한국 갑상선암 선별 논쟁의 핵심 — 작은 갑상선암 발견 후 수술? 관찰? 정책 미정 → 자원 낭비.
3.7 기준 9 — Cost-Benefit Balance
\[ \text{ICER} = \frac{\Delta \text{Cost}}{\Delta \text{QALY}} \]
선별 도입의 비용/QALY ratio. 임계값 (예: $50,000/QALY) 미만이면 비용 효과적.
(Drummond et al., 2015).
3 단계 직관:
- 추상: 한정 자원의 우선순위 결정 도구.
- 일상어 비유: 한 가족의 budget 에서 어디에 돈을 쓸지 결정.
- 반사실: ICER 가 너무 높으면 자원 다른 곳 (다른 질병 치료, 의료 인프라) 에 사용이 더 효율.
3.8 기준 10 — Continuing Process
일회성이 아닌 지속.
선별의 진성 효과는 시간이 지나야 측정 가능 (장기 mortality 변화). 일회성 캠페인은 효과 추정 어려움.
4 High-Risk Strategy — PPV 정당화
- 추상: \(\text{PPV}\) 가 \(P(D)\) 의 함수. 위험군 (\(P(D) ↑\)) 에서 선별하면 같은 Sn/Sp 라도 PPV ↑.
- 일상어 비유: 흡연자에게만 폐 CT — 비흡연자보다 폐암 prevalence ↑ → 양성 결과의 진성 양성 가능성 ↑.
- 반사실: Population-wide 선별은 PPV 가 낮아 false positive 부담 ↑. High-risk strategy 가 자원 효율 ↑.
4.1 위험군 정의의 도구
- 연령: 40+ 의 mammography.
- 유전: BRCA 양성자의 유방암 검진.
- 노출: 흡연자의 폐 CT.
- 가족력: 1 차 친척 대장암 환자 → 더 빠른 colonoscopy.
5 결론
선별 검사의 윤리는 “더 많이 검사” 가 아닌 “더 적합한 인구만 검사”. Wilson-Jungner 10 기준이 도입의 사전 점검 도구. False positive·overdiagnosis·자원 분산의 잠재 해를 항상 평가.
다음 글(B35)에서는 validity (Sn/Sp) 와 predictive value (PPV/NPV) 의 수식을 깊이 본다.
6 관련 주제
- 선별 검사 개관
- 1111-11-11, Validity 와 Predictive Value
- 1111-11-11, 검사 결합
- 1111-11-11, Lead-time / Length bias
- Diagnostic & Screening Measures