1 개요 — Ch.9 의 마무리 네 절
Ch.9 § 9.4~9.7 는 결정 분석의 종합·관점·문헌·연습.
| 절 | 역할 | 한 줄 |
|---|---|---|
| 9.4 | 완전 통합 사례 | 계층 회귀 + 확률적 결정 + 효용이 한 모형에서 만남 |
| 9.5 | 관점 | personal vs institutional — “누구의 효용을 최적화하는가” |
| 9.6 | 문헌 | Berger·DeGroot·Savage·Parmigiani·Gneiting 지도 |
| 9.7 | 연습 | widget 최적화, Oscar’s dog 다단계 VoI, bioassay 재구성 |
Overview (01-9-0), § 9.1~9.3 심화 (01-9-1) 의 연장선이자 Ch.9 심화 시리즈의 결말편.
2 § 9.4 — Home Radon 의 완전 통합 분석
2.1 문제 배경
라돈: 자연 발생 방사성 가스. 미국 폐암 사망의 유의한 원인. 분포:
- 전국 연평균 농도: 로그정규, 기하평균 0.67 pCi/L, 기하표준편차 3.1.
- 84% 가구 < 2 pCi/L, 90% < 3 pCi/L (대부분 안전).
- 5~10 만 가구 > 20 pCi/L — 광부 직업 노출 한계 수준.
측정 방법:
| 방법 | 비용 | GSD | 설치 |
|---|---|---|---|
| 단기 (2~7일) charcoal canister | \(\$15{-}20\) | 1.8 | 지하실 (편향) |
| 장기 (12개월) integrated | \(\$50\) | 1.2 | 거주 공간 |
완화 (sub-slab depressurization): \(\$2000\). 연간 2 pCi/L 로 감소. 원래 2 pCi/L 미만이면 효과 없음.
2.2 세 결정
가구주의 세 옵션:
- 무조건 완화 — 측정 없이 \(\$2000\) 지출.
- 방치 — 비용 0, 위험 수용.
- 장기 측정 후 결정 — \(\$50\) → 결과 기반 완화 여부.
단기 측정은 비용-효과 분석에서 불리 → 장기만 고려.
2.3 Certainty 하의 최적 결정 — 식 (9.4)
라돈 수치 \(R\) 을 정확히 안다고 가정. 세 양:
- \(D_d\): 폐암 사망 확률 \(10^{-6}\) 감소의 달러 가치 (“microlife”).
- \(D_r\): 라돈 1 pCi/L 감소의 30 년 달러 가치.
- \(R_{\mathrm{action}}\): 알려진 라돈이 이 값 이상이면 완화.
가구 구성에 따라 \(D_r\) 이 \(D_d\) 로부터 도출. 평균 미국 가구:
\[ D_r = 4800 \, D_d \]
\(R_{\mathrm{remed}} = 2\) pCi/L (완화 후 잔존). \(R_{\mathrm{action}}\) 은 편익 = 비용 지점:
\[ D_r (R_{\mathrm{action}} - R_{\mathrm{remed}}) = \$2000 \]
풀면:
\[ R_{\mathrm{action}} = \frac{\$2000}{D_r} + R_{\mathrm{remed}} \tag{9.4} \]
2.4 국가별 권고치의 암묵 \(D_d\)
네 나라의 \(R_{\mathrm{action}}\):
| 국가 | \(R_{\mathrm{action}}\) (pCi/L) | \(D_r\) ($/pCi/L) | \(D_d\) ($/microlife) |
|---|---|---|---|
| 미국 | 4 | 1000 | 0.21 |
| 영국 | 5 | 670 | 0.14 |
| 캐나다 | 20 | 111 | 0.02 |
| 스웨덴 | 10 | 250 | 0.05 |
의료 개입 문헌의 일반 \(D_d\): \(0.10{-}0.50\). 미국·영국이 이 구간. 캐나다·스웨덴은 라돈에 상대적으로 “관대” — 생명 가치 환산이 다른 공공 리스크보다 낮음.
같은 과학적 위험 데이터를 공유하는데 권고치가 5 배 차이. 이유: 암묵 효용 함수의 차이. \(R_{\mathrm{action}}\) 은 위험 데이터가 아니라 “위험 감소에 얼마를 지불할 것인가” 의 정책 결정.
Gelman 의 통찰: 이 표를 보면 정책이 과학에서 직접 나오지 않는다. 과학은 \(D_r\) 과 \(R_{\mathrm{remed}}\) 를 알려주고, 정책은 \(D_d\) 를 선택한다. Ch.9 의 핵심 메시지 — 결정은 확률 + 효용, 효용 선택이 투명해야 합의가 가능.
2.5 가구 이질성 — 한 숫자가 전부가 아닌 이유
평균 미국 가구 \(D_r = 4800 D_d\) 이지만 실제 가구별로 크게 다름.
- 남녀 비흡연자 한 쌍 (\(D_d = \$0.21\)): \(D_r \approx \$370\) → \(R_{\mathrm{action}} = 7.4\) pCi/L.
- 남녀 흡연자 한 쌍: \(D_r \approx \$1900\) → \(R_{\mathrm{action}} = 3.1\) pCi/L.
5 배 차이. 흡연이 라돈-암 상호작용을 증폭 — 흡연 가구는 더 엄격한 임계를 적용해야.
다른 이질성 원천:
- 위험 태도 (conservative vs risk-seeking).
- 라돈·완화 효과에 대한 개인 신념.
- 금전 여력.
분석은 \(R_{\mathrm{action}} = 4\) pCi/L 을 대표값으로 사용하되, 개별 결정은 조정 가능.
2.6 계층 베이즈 모형 — 3 층 구조
라돈 수준 자체가 미지. 모형으로 추정.
데이터:
- 장기 측정: 5000 가구, 125 카운티 cluster sample.
- 단기 측정: 80000 가구, 모든 카운티 SRS (편향·부정확).
“정확한 소량 + 부정확한 대량” 을 계층 모형으로 결합.
2.6.1 1층 — 가구 수준
\(y_i\) = 가구 \(i\) 의 로그 라돈 측정. \(X_i\) = 가구 예측자 (지하실 유무, 거주 여부, 측정 유형 지시자).
\[ y_i \sim \mathrm{N}(X_i \beta + \alpha_{j(i)}, \sigma_i^2), \quad i = 1, \ldots, n \]
\(\sigma_i\) 는 측정 유형에 따라 두 값 (장기: \(\log 1.2 \approx 0.18\), 단기: \(\log 1.8 \approx 0.59\)).
2.6.2 2층 — 카운티 수준
\(W_j\) = 카운티 예측자 (기후, 우라늄 농도). \(\delta_{k(j)}\) = 카운티 \(j\) 의 지질 유형 효과 (\(K = 19\)).
\[ \alpha_j \sim \mathrm{N}(W_j \gamma + \delta_{k(j)}, \tau^2), \quad j = 1, \ldots, J \]
2.6.3 3층 — 지질 유형
\[ \delta_k \sim \mathrm{N}(0, \kappa^2), \quad k = 1, \ldots, 19 \]
10 개 지역별로 별도 적합 — 지역 간 이질성 반영.
장기 5000 vs 단기 80000. 단기 데이터가 16 배 많지만 GSD 1.8 (장기 1.2 대비). 왜 둘 다 쓰나?
장기 데이터는 카운티 수준 모수를 정확히 고정. 단기 데이터는 카운티 별 분포의 공간 패턴 (예: 특정 카운티가 기저 vs 평균)을 보완. 편향은 측정 유형 지시자가 회귀에서 보정.
이것이 계층 모형이 실무 데이터에서 빛나는 지점 — 서로 다른 품질의 데이터를 한 모형으로 융합. 16 배 많은 “신호 + 편향” 데이터가 편향 보정 후 예측 불확실성을 크게 줄인다.
2.7 사후 예측 — 식 (9.5)
미측정 가구 \(i\) 의 로그 라돈 \(\theta_i\) 에 대한 예측:
\[ \theta_i \sim \mathrm{N}(M_i, S_i^2) \tag{9.5} \]
- \(M_i = X_i \hat{\beta} + \hat{\alpha}_{j(i)}\) — 예측 중심.
- \(S_i^2\) — 예측 분산. 회귀 계수, 카운티 효과, 분산 모수 모두의 불확실성 포함 (\(\sigma^2\) 는 측정 오차이므로 여기선 제외).
결과: \(e^{S_i}\) (geometric SD) 가 2.1~3.0. 대부분 2.1~2.5. 즉 “이 가구 라돈은 평균의 2~3 배 내” 수준의 예측 가능.
2.8 측정 후 갱신 — 식 (9.6)~(9.7)
측정치 \(y \sim \mathrm{N}(\theta, \sigma^2)\) (로그 스케일). 사후 예측 업데이트:
\[ \theta \mid M, y \sim \mathrm{N}(\Lambda, V) \tag{9.6} \]
\[ \Lambda = \frac{\frac{M}{S^2} + \frac{y}{\sigma^2}}{\frac{1}{S^2} + \frac{1}{\sigma^2}}, \quad V = \frac{1}{\frac{1}{S^2} + \frac{1}{\sigma^2}} \tag{9.7} \]
정밀도 가중 평균 — 사전 정밀도 \(1/S^2\) 와 측정 정밀도 \(1/\sigma^2\) 의 합이 사후 정밀도.
장기 측정: \(\sigma \approx 0.18\), 정밀도 \(1/\sigma^2 \approx 31\). 사전 정밀도 (GSD 2.3 = \(S \approx 0.83\)): \(1/S^2 \approx 1.45\). 측정이 사전 대비 20 배 정밀 — 사후가 측정값에 가깝게 수렴.
단기 측정: \(\sigma \approx 0.59\), 정밀도 \(\approx 2.9\). 사전 대비 2 배 정밀 — 사후가 사전과 측정의 절충.
이것이 “장기 \(\$50\) 가 단기 \(\$15\) 보다 비용-효과적” 의 수학적 이유. 정확도 차이가 크면 비용 차이 \(\$35\) 가 쉽게 정당화. Ch.9 의 교훈: 정보의 정확도 × 양을 비용과 비교, 단순히 “싼 게 좋다” 아님.
2.9 세 가지 기대 손실 — 식 (9.8)~(9.11)
완화·측정 비용을 포함한 기대 달러 손실. \(R = e^\theta\) (실제 라돈).
2.9.1 결정 1 — 무조건 완화
\[ \begin{aligned} L_1 &= \$2000 + D_r \mathbb{E}[\min(R, R_{\mathrm{remed}})] \\ &= \$2000 + D_r \left[ R_{\mathrm{remed}} \Phi\!\left(\tfrac{M - \log R_{\mathrm{remed}}}{S}\right) + e^{M + S^2/2} \left(1 - \Phi\!\left(\tfrac{M + S^2 - \log R_{\mathrm{remed}}}{S}\right)\right) \right] \end{aligned} \tag{9.8} \]
완화 비용 \(\$2000\) + 완화 후 라돈 노출 비용. 완화 후 라돈은 \(\min(R, R_{\mathrm{remed}})\) — 원래 낮은 집은 그대로, 높은 집은 2 로 내려감.
2.9.2 결정 2 — 방치
\[ L_2 = D_r \mathbb{E}[R] = D_r \cdot e^{M + S^2/2} \tag{9.9} \]
로그정규의 평균: \(e^{\mu + \sigma^2/2}\). 완화 없음 → 그대로 노출 비용.
2.9.3 결정 3 — 측정 후 결정
측정 자체의 비용 + 측정 연도의 노출 \((1/30) \cdot L_2\) + 후속 결정.
3(a) 측정 후 완화:
\[ \begin{aligned} L_{3a} &= \$50 + D_r \cdot \tfrac{1}{30} e^{M + S^2/2} + \$2000 \\ &\quad + D_r \left[ R_{\mathrm{remed}} \Phi\!\left(\tfrac{\Lambda - \log R_{\mathrm{remed}}}{\sqrt{V}}\right) + e^{\Lambda + V/2} \left(1 - \Phi\!\left(\tfrac{\Lambda + V - \log R_{\mathrm{remed}}}{\sqrt{V}}\right)\right) \right] \end{aligned} \tag{9.10} \]
\(L_1\) 과 구조 동일, \(M, S\) 대신 \(\Lambda, V\) — 사후 업데이트 적용.
3(b) 측정 후 방치:
\[ L_{3b} = \$50 + D_r \cdot \tfrac{1}{30} e^{M + S^2/2} + D_r \cdot e^{\Lambda + V/2} \tag{9.11} \]
2.10 측정 임계 \(y_0\) — 식 (9.12)
측정 후 완화 여부는 측정값 \(y\) 에 의존. 임계 \(y_0\):
\[ y > y_0 \Rightarrow \text{완화}, \quad y < y_0 \Rightarrow \text{방치} \]
\(y_0\) 는 방정식으로 결정:
\[ L_{3a}(y_0) = L_{3b}(y_0) \tag{9.12} \]
수치적으로 해결. \(y_0 \ne \log R_{\mathrm{action}}\) — 측정 오차 때문에 “완화를 정당화하는 측정값” 과 “완화를 정당화하는 실제 라돈” 이 다르다.
측정에 오차가 있음 — \(y\) 는 \(\theta\) 의 noisy 대리. \(y\) 가 정확히 \(R_{\mathrm{action}}\) 이라면 사후 \(\Lambda\) 는 \(M\) 과 \(y\) 의 절충으로 \(R_{\mathrm{action}}\) 보다 낮아짐 (shrinkage towards prior).
완화를 정당화하려면 사후 기대 라돈이 \(R_{\mathrm{action}}\) 넘어야 함 — 따라서 \(y_0\) 를 \(R_{\mathrm{action}}\) 보다 더 올려 잡아야. 단기 측정처럼 \(\sigma\) 가 크면 \(y_0\) 가 더 높아짐.
원리: 측정 오차를 고려하면 임계값이 shrinkage 반대 방향으로 조정. 임상 검사에서 “decision threshold ≠ diagnostic threshold” 의 일반 원리.
2.11 결정 3 의 기대 손실 — 식 (9.13)
측정값 \(y\) 가 관측되기 전이므로 \(y\) 에 대한 기댓값을 취한다.
\[ L_3 = \mathbb{E}_y[\min(L_{3a}(y), L_{3b}(y))] \tag{9.13} \]
\(y \sim \mathrm{N}(M, S^2 + \sigma^2)\) (사전 예측 분포, 측정 오차 포함). \(y_0\) 가 계산되면:
\[ L_3 = \mathbb{E}_{y < y_0}[L_{3b}] \cdot \Pr(y < y_0) + \mathbb{E}_{y > y_0}[L_{3a}] \cdot \Pr(y > y_0) \]
최종 결정: \(\min(L_1, L_2, L_3)\).
2.12 Figure 9.5 — 추천 결정의 map
\(R_{\mathrm{action}}\) (수평) vs \(e^M\) (수직) 평면에 결정 분할:
- 낮은 \(e^M\) + 높은 \(R_{\mathrm{action}}\): 방치.
- 높은 \(e^M\) + 낮은 \(R_{\mathrm{action}}\): 무조건 완화.
- 중간 구역: 장기 측정 권장.
측정이 유용한 구역이 “\(e^M\) 이 \(R_{\mathrm{action}}\) 근처인 가구” — 사후 예측이 임계 근처에서 불확실. VoI 가 최대.
2.13 집계 분석 — 네 전략 비교
전국 70M 가구 에 네 전략 적용해 총 비용·구한 생명 비교.
| 전략 | 기본 결정 |
|---|---|
| A. 추천 (계층 모형 기반) | 가구별 L1/L2/L3 최적 |
| B. 무조건 완화 | 모든 가구 \(\$2000\) |
| C. EPA 보정 후 단기 측정 | 단기 측정 + 편향 보정 |
| D. EPA 현행 (단기 + uncorrected) | 단기 측정 + 원값 |
\(R_{\mathrm{action}} = 4\) pCi/L 에서 전략 A:
- 26% 가구가 측정.
- 4.5% 가구가 완화.
- 4 pCi/L 초과 280 만 가구 중 74% 완화됨.
- 8 pCi/L 초과 84 만 가구 중 91% 완화됨.
- 총 비용 \(\$7.3B\) (측정 \(\$1B\) + 완화 \(\$6.3B\)).
- 구한 생명: 49K smokers + 35K nonsmokers = 83K lives.
전략 D (EPA uncorrected) 동일 비용에서: 64K lives — 19K 명 손실.
동일 83K lives 달성 비용: \(\$12B\) — \(\$4.7B\) 추가 지출.
전략 A 와 D 의 83K lives 당 비용 차이 \(\$4.7B\) 는 측정 정확도·편향 보정·공변량 활용의 직접적 가치.
핵심: 계층 모형이 카운티·지질 정보로 고위험 가구를 사전에 식별. 측정 없이도 “이 지역은 위험 낮음” 판정해 불필요한 측정·완화 건너뜀. EPA 현행 방식은 모든 가구에 동일한 단기 측정 → 편향 + 낮은 정확도 → 자원 낭비.
공공 정책의 “과학 → 정책” 변환에서 계층 모형이 자원 배분 효율을 질적으로 바꾼다. \(\$4.7B\) 가 그 구체 가치.
3 § 9.5 — Personal vs Institutional
3.1 주관 확률의 한계
§ 9.5 는 “주관적 베이즈” 의 실무적 비판으로 시작. 개인 결정자가 사전 + 효용을 주관 선택 → 사후 + 최적 결정 도출 — 이 흐름의 순환성:
원하는 결정을 미리 정하고, 그에 맞게 주관 입력을 설정하면 분석이 어떤 결론도 정당화 한다.
따라서 “formal decision analysis” 가 단순 선택보다 더 신뢰성 높다는 보장 없음. 주관 입력 설정 자체가 선택.
3.2 Personal Decision — 입력이 명확할 때만 유용
개인 결정 분석이 유용한 조건:
- 효용 함수가 덜 논쟁적. 예: QALY 는 환자 간 비교적 합의 가능.
- 확률이 외부 근거. 예: § 9.3 의 검사 민감도가 의학 문헌.
이 조건 하에서 결정 분석은 “정보의 가치 계산 도구” — 주관성을 최소화.
3.3 Institutional Decision — 투명성의 가치
조직 (기업, 정부, 연구 기관) 은 결정을 정당화해야 함. Gelman 은 이를 institutional decision analysis 라 명명.
핵심 역할:
- 모형·효용·데이터 → 비용·편익 추정의 관계를 투명하게 공개.
- 감도 분석으로 가정의 robustness 보임.
- 의사결정자가 공개 검토 가능.
§ 9.2 (survey incentive) 는 주관성이 높아 열린 권고 (“trade-off 곡선”). § 9.3 (bronchoscopy) 는 결정 자체 + 가정 분해 — bronchoscopy 금지가 어느 가정에 의존하는지 분석 가능. § 9.4 (radon) 는 \(R_{\mathrm{action}} = 4\) 가정 하 구체 권고 (카운티 지도). 가구별 조정 여지 명시.
3.4 세 예제의 의미 차이
| 예제 | Institutional 권고 | 가정 투명성 |
|---|---|---|
| § 9.2 Survey | Trade-off 곡선 | 응답률-비용 환율 결정자 몫 |
| § 9.3 Screening | “Bronchoscopy 금지” | 민감도/특이도/사전에 의존 |
| § 9.4 Radon | “\(R_{\mathrm{action}} = 4\) map” | \(D_d\) 정책 선택 명시 |
공통 원칙: “Objective 베이즈 = 가정의 명시 + fit 점검 + 모형 확장”. 주관 결정 자체를 거부하지 않고, 주관이 개입하는 지점을 투명하게 밝힌다.
완벽한 합리성이 있으면 좋겠지만 실제로 불가능 — 효용 함수도 확률도 추정. 완벽하지 않아도 “어떤 가정 하에 이 결정이 나왔는가” 를 공개하면 타인이 검토·수정 가능.
Institutional decision analysis 의 가치: 결정 자체보다 의사결정 프로세스의 재현 가능성. 다른 이해관계자가 다른 효용을 가정해 같은 분석 실행 → 다른 결정. 이 비교가 토론의 수학적 기반.
Gelman 의 입장은 “베이즈는 주관적” 이라는 공식을 거부하고, “베이즈는 가정을 수학으로 명시하는 도구” 라고 재해석. 결정 분석의 철학 선언.
4 § 9.6 — Bibliographic Note 지도
4.1 결정 이론 기초
- Berger (1985), DeGroot (1970) — 결정 이론과 베이즈 연결의 표준 교과서.
- Savage (1954) — 주관적 기대 효용의 공리화, 베이즈 방법의 결정 이론적 정당화.
- Luce & Raiffa (1957) — 게임 이론·결정 이론의 광범위 논의.
4.2 Scoring Rules
- Gneiting (2011) — 점 예측용 scoring function 리뷰.
- Gneiting & Raftery (2007) — 확률 예측용 scoring rules.
- Vehtari & Ojanen (2012) — 베이즈 예측 모델 평가·선택·비교의 결정 이론 리뷰 (Ch.7 에 연결).
4.3 응용 결정 분석
- Clemen (1996) — 응용 결정 분석 입문서.
- Parmigiani (2002) — 베이즈 의료 결정론 교재.
- Kahneman, Slovic, Tversky (1982), Gilovich, Griffin, Kahneman (2002) — 심리학적 관점.
4.4 각 절의 원 참고
- § 9.2 Survey incentive: Gelman, Stevens, Chan (2003). 메타분석 데이터는 Singer et al. (1999).
- § 9.3 Cancer screening: Moroff & Pauker (1983).
- § 9.4 Home radon: Lin et al. (1999), Boscardin & Gelman (1996) — 계층 모형 계산 상세.
- § 9.3 VoI 의료: Parmigiani (2004).
- 의료 비용-효과: Heitjan, Moskowitz, Whang (1999); Fouskakis, Ntzoufras, Draper (2009) — 모델 선택과 data collection cost 의 결합.
5 § 9.7 — 연습문제 풀이
5.1 문제 1 — Widget 수량 최적화
문제. Widget 제조 비용 \(\$2\), 판매 가격 \(\$3\). 시장 수요 \(\sim \mathrm{N}(10000, 5000^2)\). 이익 최대화 제조량?
풀이. 제조량 \(q\), 수요 \(D\). 이익:
\[ \pi(q, D) = 3 \min(q, D) - 2q \]
- 수요 \(\ge q\): \(\pi = 3q - 2q = q\) (모두 판매).
- 수요 \(< q\): \(\pi = 3D - 2q\) (미판매 \(q - D\) 개 손실).
기대 이익:
\[ \mathbb{E}[\pi(q)] = \int \pi(q, D) f(D) \, dD \]
\(\partial \mathbb{E}[\pi] / \partial q = 0\) 풀면, newsvendor 공식:
\[ \Pr(D \ge q^*) = \frac{c_u}{c_u + c_o} \]
- \(c_u = 3 - 2 = \$1\) (과소 생산 기회비용).
- \(c_o = \$2\) (과잉 생산 손실).
\[ \Pr(D \ge q^*) = \frac{1}{3} \Rightarrow q^* = \mu + \Phi^{-1}(2/3) \cdot \sigma = 10000 + 0.4307 \times 5000 \approx 12154 \]
답: 약 12,154 개. 수요 평균 10000 보다 많이 생산 — 미판매 손실보다 기회비용 (2 배) 이 작아 over-stock 선호.
Newsvendor 공식 \(\Pr(D \ge q^*) = c_u / (c_u + c_o)\) 는 결정 이론의 고전. 이 값을 “critical ratio” 라 부른다.
이익이 낮거나 과잉 손실이 크면 ratio 가 작음 → 적게 생산. 반대로 과소 손실이 크면 (예: 필수 의약품) ratio 가 커짐 → 많이 생산.
공식이 말하는 것: “수요가 \(q^*\) 를 넘을 확률이 critical ratio 와 같은 지점” 에서 한계 이익과 한계 손실이 균형. \(q\) 한 단위 늘렸을 때 기대 이득 = \(c_u \cdot \Pr(D \ge q)\), 기대 손실 = \(c_o \cdot \Pr(D < q)\). 두 개가 같으면 최적.
5.2 문제 2 — Oscar’s Dog (다단계 결정 + VoI)
문제. 개가 A 숲 70% / B 숲 30% 에 있다. A 수색 하루 시 발견 확률 0.5, B 수색 시 0.8.
(a) 첫날 어디?
- A: \(\Pr(\text{발견}) = 0.7 \cdot 0.5 = 0.35\).
- B: \(\Pr(\text{발견}) = 0.3 \cdot 0.8 = 0.24\).
A 선택. 잃을 확률 \(= 0.65\).
(b) 첫날 A 실패 후 두 번째 날?
Bayes 갱신: 실패 = {A 에 있는데 못 찾음} ∪ {B 에 있는데 찾지 않음}.
\[ \Pr(A \mid \text{fail}_1) = \frac{0.7 \cdot 0.5}{0.7 \cdot 0.5 + 0.3 \cdot 1} = \frac{0.35}{0.65} = 0.538 \]
\(\Pr(B \mid \text{fail}_1) = 0.462\).
- A 재수색: \(0.538 \cdot 0.5 = 0.269\).
- B 수색: \(0.462 \cdot 0.8 = 0.369\).
B 선택. 둘째 날 끝 잃을 확률 = \(0.65 \cdot (1 - 0.369) = 0.41\).
(c) 세 번째 날?
둘째 날 B 실패 후: \(\Pr(A \mid \text{fail}_2) = \frac{0.538}{0.538 + 0.462 \cdot 0.2} = \frac{0.538}{0.631} = 0.853\). \(\Pr(B) = 0.147\).
- A 수색: \(0.853 \cdot 0.5 = 0.426\).
- B 재수색: \(0.147 \cdot 0.8 = 0.118\).
A 선택. 세 번째 날 끝 잃을 확률 = \(0.41 \cdot (1 - 0.426) = 0.235\).
(d) VoI 계산.
Payoffs: \(-1\) (1 일 발견), \(-2\) (2 일), \(-3\) (3 일), \(-10\) (3 일 미발견).
정보 없이 기대 payoff:
- 1 일 발견 확률: \(0.35\).
- 2 일: \(0.65 \cdot 0.369 = 0.240\).
- 3 일: \(0.41 \cdot 0.426 = 0.175\).
- 미발견: \(0.235\).
\[ \mathbb{E}[U] = -1 \cdot 0.35 - 2 \cdot 0.24 - 3 \cdot 0.175 - 10 \cdot 0.235 = -3.705 \]
개가 A 임을 알 때: 매일 A 수색 → 1 일 확률 \(0.5\), 2 일 \(0.5 \cdot 0.5 = 0.25\), 3 일 \(0.125\), 미발견 \(0.125\).
\[ \mathbb{E}[U \mid A] = -1 \cdot 0.5 - 2 \cdot 0.25 - 3 \cdot 0.125 - 10 \cdot 0.125 = -2.625 \]
개가 B 임을 알 때: 매일 B → 1 일 \(0.8\), 2 일 \(0.16\), 3 일 \(0.032\), 미발견 \(0.008\).
\[ \mathbb{E}[U \mid B] = -1 \cdot 0.8 - 2 \cdot 0.16 - 3 \cdot 0.032 - 10 \cdot 0.008 = -1.296 \]
완벽 정보의 기대 효용:
\[ \mathbb{E}[U \mid \text{perfect}] = 0.7 \cdot (-2.625) + 0.3 \cdot (-1.296) = -2.2365 \]
EVPI \(= -2.2365 - (-3.705) = 1.47\). Oscar 는 약 \(\$1.47\) 를 지불할 의향이 있어야 한다 (payoff 단위가 달러라면).
첫 날 A 선택은 당연 (더 높은 발견 확률). 흥미로운 건 두 번째 날 B 전환. A 실패가 “개가 A 에 없다” 는 증거 — Bayes 로 \(A\) 확률 0.70 → 0.538. 여전히 A 가 더 높지만 B 의 발견률 상승 (0.8 > 0.5) 이 이를 뒤집는다.
세 번째 날 다시 A 로 전환: B 도 실패했으니 B 확률이 급락 (0.462 → 0.147), A 가 압도적 우세 (0.853).
패턴: “성공 확률 높은 곳 먼저, 실패하면 Bayes 갱신 후 재평가”. 이것이 다단계 결정의 기본 알고리즘. § 9.3 bronchoscopy 와 동일 구조 — 검사 결과 후 사후 갱신 + 조건부 최적.
5.3 문제 3 — 이전 예제를 결정 문제로 재구성
문제. Bioassay (§ 3.7) 또는 meta-analysis (§ 5.6) 를 결정 문제로 설정.
Bioassay 설정 예:
- 결정 공간: \(n\) (쥐 수). \(n = 0, 5, 10, 20, 40\).
- 효용: 실험 비용 \(-C_{\mathrm{setup}} - n \cdot C_{\mathrm{rat}}\) + 추정 정확도 편익.
- 정확도 편익: LD50 의 사후 표준편차 감소. \(\sigma_{\mathrm{LD50}} \propto 1/\sqrt{n}\) 근사.
- 효용 환율: 정확도 1 단위 감소의 달러 가치 (의약품 승인 결정에 영향).
최적화: \(n^* = \arg\max_n [\text{accuracy benefit}(n) - \text{cost}(n)]\).
전형적 결과: 중간 \(n\) 이 최적. \(n\) 이 작으면 정확도 낮음, 크면 비용 과다.
민감도 분석: 정확도-달러 환율의 불확실성이 \(n^*\) 에 큰 영향. 환율 10 배 차이 시 \(n^*\) 2~3 배 변동.
6 Ch.9 전체 정리 — 3 포스트의 논리 흐름
| 포스트 | 역할 | 핵심 메시지 |
|---|---|---|
| 01-9-0 Overview | 지도 | 사후를 사용하는 여섯 번째 걸음 |
| 01-9-1 §9.1~9.3 | 이론 + 반쪽·다단계 | 네 단계·VNM·VoI, 계층 회귀, bronchoscopy 완전 계산 |
| 01-9-2 §9.4~9.7 (본편) | 완전 통합·관점·연습 | Radon 3 층 계층·전국 83K lives, personal vs institutional, newsvendor·Oscar |
Ch.9 의 한 문장:
베이즈 추론이 계산한 사후를 실제 결정 (완화 여부, 측정 여부, 제조량) 으로 번역하려면 효용 함수를 명시하고 기대 효용을 최대화한다. 효용 선택이 정책의 투명성을 만들고, 계층 모형이 이질적 데이터를 자원 배분 효율로 바꾼다.
7 코드 — Home Radon 결정 분석 축약 구현
7.1 파라미터
7.2 세 손실 함수
def L1_remediate(M, S):
"""식 (9.8) — 무조건 완화."""
z = (np.log(R_remed) - M) / S
term1 = R_remed * norm.cdf(-z) # Phi((M - log R_remed)/S) — R >= R_remed
# E[R | R < R_remed] * Pr(R < R_remed)
term2 = np.exp(M + 0.5 * S**2) * (1 - norm.cdf((M + S**2 - np.log(R_remed)) / S))
# 위 공식은 E[R] - R_remed * Pr(R >= R_remed) 과 같음
# Gelman 식대로 직접:
return cost_remed + D_r * (R_remed * norm.cdf((M - np.log(R_remed))/S)
+ np.exp(M + 0.5*S**2) * (1 - norm.cdf((M + S**2 - np.log(R_remed))/S)))
def L2_nothing(M, S):
"""식 (9.9) — 방치."""
return D_r * np.exp(M + 0.5 * S**2)
def posterior_params(M, S, y, sigma):
"""식 (9.7) — 정밀도 가중 평균."""
prec_prior = 1 / S**2
prec_meas = 1 / sigma**2
V = 1 / (prec_prior + prec_meas)
Lambda = V * (prec_prior * M + prec_meas * y)
return Lambda, V
def L3a(M, S, y, sigma):
"""식 (9.10) — 측정 후 완화."""
Lambda, V = posterior_params(M, S, y, sigma)
meas_year_cost = D_r * (1/30) * np.exp(M + 0.5 * S**2)
post_remed_cost = D_r * (R_remed * norm.cdf((Lambda - np.log(R_remed))/np.sqrt(V))
+ np.exp(Lambda + 0.5*V) *
(1 - norm.cdf((Lambda + V - np.log(R_remed))/np.sqrt(V))))
return cost_measure + meas_year_cost + cost_remed + post_remed_cost
def L3b(M, S, y, sigma):
"""식 (9.11) — 측정 후 방치."""
Lambda, V = posterior_params(M, S, y, sigma)
meas_year_cost = D_r * (1/30) * np.exp(M + 0.5 * S**2)
return cost_measure + meas_year_cost + D_r * np.exp(Lambda + 0.5 * V)7.3 측정 임계 \(y_0\)
from scipy.optimize import brentq
def find_y0(M, S, sigma):
"""식 (9.12) — L3a(y0) = L3b(y0)."""
def diff(y):
return L3a(M, S, y, sigma) - L3b(M, S, y, sigma)
# y0 범위: (log(R_remed/2), log(50)) 정도
return brentq(diff, np.log(0.1), np.log(50))
# 예: 기하평균 사전 3 pCi/L, GSD 2.3, 장기 측정
M_example = np.log(3.0)
S_example = np.log(2.3)
sigma_long = np.log(1.2)
y0 = find_y0(M_example, S_example, sigma_long)
print(f"측정 임계 (R 스케일): {np.exp(y0):.2f} pCi/L")
print(f"R_action: {R_action:.2f} pCi/L")출력: \(y_0\) 가 \(R_{\mathrm{action}}\) 과 약간 다름 (측정 오차 반영).
7.4 세 전략 비교
def L3_expected(M, S, sigma):
"""식 (9.13) — 측정 사전 예측에 대한 기댓값."""
# y ~ N(M, S^2 + sigma^2) 하에서 적분
from scipy.integrate import quad
y0 = find_y0(M, S, sigma)
total_var = S**2 + sigma**2
def integrand_a(y):
return L3a(M, S, y, sigma) * norm.pdf(y, M, np.sqrt(total_var))
def integrand_b(y):
return L3b(M, S, y, sigma) * norm.pdf(y, M, np.sqrt(total_var))
e_a, _ = quad(integrand_a, y0, y0 + 10)
e_b, _ = quad(integrand_b, y0 - 10, y0)
return e_a + e_b
M_vals = np.log(np.linspace(1.0, 8.0, 15))
results = []
for M in M_vals:
l1 = L1_remediate(M, S_example)
l2 = L2_nothing(M, S_example)
l3 = L3_expected(M, S_example, sigma_long)
best = np.argmin([l1, l2, l3])
results.append((np.exp(M), l1, l2, l3, ["완화", "방치", "측정"][best]))
print(f"{'e^M (pCi/L)':>10} | {'L1 (완화)':>10} | {'L2 (방치)':>10} | {'L3 (측정)':>10} | 추천")
for r in results:
print(f"{r[0]:>10.2f} | {r[1]:>10.0f} | {r[2]:>10.0f} | {r[3]:>10.0f} | {r[4]}")기대 출력: 낮은 \(e^M\) 은 방치, 높은 \(e^M\) 은 무조건 완화, 중간 구역에서 측정 권장 — Figure 9.5 의 디지털 재현.
8 실전 체크리스트 — Ch.9 결산
§ 9.1~9.7 의 모든 교훈을 한 장으로.
설계 단계
- 결정 공간 먼저 — \(\mathcal{D}\) 를 남김없이 열거.
- 효용 차원 선택 — 달러·QALY·생명 중 기본. 다차원이면 환율 명시.
- 개인/제도 프레임 결정 — 누구의 효용인가.
추론 단계
- 계층 모형 적합 — 부정확한 대량 + 정확한 소량 데이터 융합.
- 사후 예측 분포 — 각 결정 조건부 \(p(x \mid d)\).
- Precision 가중 갱신 — 측정이 있으면 식 (9.7) 형식.
계산 단계
- 역방향 귀납 — 다단계 트리의 Bellman.
- 기대 손실 \(\mathbb{E}[L_k]\) — 각 결정 옵션.
- 측정 임계 \(y_0\) — 수치 해법.
- 기댓값 적분 — 미관측 \(y\) 에 대한 외부 기댓값.
평가 단계
- VoI 3 변종 (EVPI/EVSI/EVPPI) — 관측 가치 정량화.
- 민감도 분석 — 효용 환율·사전·모수 변동 하 결정 안정성.
- 집계 vs 개별 — 공공 정책이면 총 비용·총 생명.
보고 단계
- 가정 명시 — 효용 환율, 측정 정확도, 모형 선택.
- 대안 전략 비교 — 단일 추천 + 비교 표.
- 개인 조정 가능성 — 권고의 한계와 개별 맞춤 방향.
9 관련 주제
선행 지식
- Ch.9 Overview (01-9-0) — 전체 지도
- § 9.1~9.3 심화 (01-9-1) — 이론과 반쪽·다단계 분석
- Ch.8 시리즈 — 수집 모델 (Ch.9 의 전 단계)
후속 주제
- Ch.10 Introduction to Bayesian Computation — § 9.4 의 적분 수치 계산
- Ch.15 Hierarchical Linear Models — § 9.4 의 3 층 구조 상세
- Ch.18 Missing Data — 부분 관측된 예측자의 결정 분석 통합
관련 개념
- Berger (1985), Statistical Decision Theory and Bayesian Analysis — 결정 이론 표준
- DeGroot (1970), Optimal Statistical Decisions — 고전 교과서
- Savage (1954), The Foundations of Statistics — 공리적 기초
- Parmigiani (2002), Modeling in Medical Decision Making — 의료 베이즈 결정
- Gneiting & Raftery (2007) — proper scoring rules
- Vehtari & Ojanen (2012) — Bayesian predictive model assessment
- Boscardin & Gelman (1996), Lin et al. (1999) — home radon 원 참고문헌
- Gelman, Stevens, Chan (2003) — survey incentive 원 참고문헌
- Moroff & Pauker (1983) — bronchoscopy 원 예제
- Heitjan, Moskowitz, Whang (1999) — 의료 비용-효과 베이즈