Kwangmin Kim - Ch.9 Decision Analysis — 베이즈 분석의 여섯 번째 걸음

1 개요 — 왜 결정 분석인가

베이즈 분석의 여섯 걸음을 나란히 놓으면 Ch.8 과 Ch.9 의 경계가 드러난다.

모형 구성 — 사전 $p(\theta)$ + 우도 $p(y \mid \theta)$.
사후 계산 — $p(\theta \mid y)$.
모델 점검 (Ch.6) — 내부 자기 일관성.
모델 평가·비교·확장 (Ch.7) — 외부 예측 성능.
수집 과정의 모형화 (Ch.8) — 데이터가 어떻게 모였는가.
결정 분석 (Ch.9) — 이 사후로 무엇을 할 것인가.

Ch.1~8 까지가 “사후를 정확하게 만드는” 과정이었다면, Ch.9 는 “사후를 사용하는” 과정이다. 의사·정책 입안자·기업이 불확실성 하에서 실제 결정을 내려야 할 때, 사후 분포가 어떤 수치 (치료 선택, 인센티브 금액, 측정 여부) 로 번역되는가를 다룬다.

1.1 Gelman 의 세 예제 — 결정 분석의 세 층위

Ch.9 는 세 사례를 통해 결정 분석의 복잡도 스펙트럼을 보인다.

절	예제	결정 분석 수준
9.2	NYC 설문 인센티브	반쪽 분석 — 예측만 하고 효용은 명시 안 함
9.3	95 세 남성 폐암 진단	다단계 트리 + 조건부 확률 + QALY 효용
9.4	Home radon 측정·완화	완전 통합 — 계층 회귀 + 확률적 결정 + 달러·생명 효용

“반쪽 → 다단계 → 완전 통합” 의 진행이 Ch.9 의 학습 경로.

1.2 직관 — “통계적으로 유의하지 않음” 이 결정과 무관한 이유

Ch.9 의 관통 교훈 하나:

회귀 계수가 통계적으로 유의하지 않다고 해서 0 으로 놓으면 안 된다.

이유: 결정 문제에서 관심사는 계수의 p-value 가 아니라 기대 효용. 유의하지 않은 효과라도 비용이 낮다면 수용할 가치가 있다. § 9.2 의 survey incentive 에서 “형태 (cash vs gift)” 같은 변수가 자주 유의하지 않은데, 그걸 0 으로 두면 결정에 쓸 수 있는 정보가 사라진다.

이 한 문장이 빈도주의 검정 중심 사고에서 베이즈 결정 분석으로 넘어가는 정신적 장벽을 무너뜨린다.

2 § 9.1 — 결정 이론 네 단계

2.1 네 단계 정의

Gelman § 9.1 (p.238) 의 공식화.

정의 — Bayesian Decision Analysis 의 네 단계

결정 공간과 결과 공간 열거. 가능한 결정 $d$ 와 결과 $x$ 를 모두 나열. 결과 $x$ 는 관측 예정값 $\tilde{y}$ 와 미지 모수 $\theta$ 를 함께 포함할 수 있다.
각 결정 하 $x$ 의 확률 분포 결정 — $p(x \mid d)$. 베이즈 관점에서 이것은 조건부 사후 예측 분포. $d$ 자체에는 확률 부여 안 함 (결정자의 자유 변수).
효용 함수 $U(x)$ 정의. 결과를 실수로 사상. 단일 차원 (생애수명, 이익) 또는 다차원 (QALY, 비용×생명).
기대 효용 계산과 최대화. \[ d^* = \arg\max_d \; \mathbb{E}[U(x) \mid d] = \arg\max_d \int U(x) \, p(x \mid d) \, dx \] 다단계 트리에서는 각 결정 시점마다 그 시점까지의 정보 조건부로 기대 효용 재계산.

네 단계가 “불확실성 하의 합리적 선택” 을 수식화한다.

2.2 네 단계의 직관

직관 — 왜 $d$ 에는 확률을 주지 않는가

베이즈 추론에서는 모든 미지 수량에 확률을 부여한다. 그런데 $d$ (결정) 는 예외. 이유: 결정은 결정자가 선택하는 것 이지 자연이 임의로 발생시키는 것이 아니다.

수학적으로도 $p(d)$ 를 쓰면 순환 — “내가 결정 $d$ 를 선택할 확률” 을 정의하려면 이미 결정 규칙이 있어야 함. 결정 이론은 이 순환을 피하기 위해 $d$ 를 조건 변수로 고정하고 각 $d$ 마다 $p(x \mid d)$ 를 계산.

결과적으로 결정 분석은 “추론 (사후 계산) + 최적화 (기대 효용 최대화)” 의 합성. 추론 부분은 베이즈가 담당, 최적화 부분은 운영 연구·OR 가 담당.

2.3 베이즈 추론이 결정에 쓰이는 두 방식

§ 9.1 은 베이즈 추론이 결정 분석에 들어가는 두 경로를 구분한다.

2.3.1 경로 1 — 예측량 추정

결정에 들어가는 예측량 (회복 확률, 기대 비용) 이 모수 $\theta$ 에 의존. 사후 $p(\theta \mid y)$ 로 그 예측량의 불확실성을 표현.

대표: § 9.2 (survey incentive), § 9.4 (radon) — 계층 회귀 모수로부터 비용·편익 예측.

2.3.2 경로 2 — 순차 결정의 조건부 분포 갱신

다단계 트리에서 각 단계 관측 결과가 다음 결정의 조건부 분포를 갱신. Bayes’ rule 자체가 결정 노드 사이에 삽입됨.

대표: § 9.3 (bronchoscopy), § 9.4 (radon 측정 후 완화 결정) — 검사 결과로 사후 업데이트 후 다음 결정.

2.4 결정 트리 구조

결정 분석의 고전적 시각화. 두 종류 노드가 교차.

□ 결정 노드 (사각형) — 결정자가 선택
○ 확률 노드 (원형)   — 자연이 결정
▲ 말단 노드 (삼각형) — 최종 결과, 효용 값

평가 방식: 역방향 귀납 (backward induction). 말단에서 효용을 읽어 올라오면서 확률 노드는 기댓값 계산, 결정 노드는 최대값 선택.

직관 — 왜 “역방향” 으로 풀어야 하는가

결정 트리를 순방향으로 풀려면 “지금 결정을 내릴 때 나중에 어떤 정보가 들어올지” 를 예측해야 한다 — 그 예측은 그 정보에 대한 결정을 내려야 알 수 있음 — 순환.

역방향은 이 순환을 끊는다. 마지막 결정부터 해결. 마지막 시점에서 그 때 관측된 정보 조건부 최적 결정을 계산. 그 결정의 기대 효용이 그 관측 노드의 “값” 이 됨. 이를 반복하며 뿌리로 올라오면 현재 결정의 기대 효용이 나온다.

이 절차가 정확히 동적 프로그래밍의 Bellman 원리 — “최적 정책은 모든 부분 문제에서도 최적”. 결정 분석은 베이즈 추론 + 동적 프로그래밍의 결합이다.

2.5 Value of Information (VoI)

§ 9.3 의 핵심 도구. “추가 관측이 기대 효용을 얼마나 증가시키는가”.

\[ \mathrm{EVPI} = \mathbb{E}_{y_{\mathrm{new}}}[\max_d \, U(d, y_{\mathrm{new}})] - \max_d \, \mathbb{E}_{y_{\mathrm{new}}}[U(d, y_{\mathrm{new}})] \]

첫 항: “미래 관측을 본 후 결정” — 관측 후 최적 결정의 기대 효용.
둘째 항: “관측 없이 지금 최적 결정” — 현재 정보로의 최적.

차이가 “완벽한 정보가 있다면 얼마나 더 좋은가”. EVPI 가 관측 비용보다 크면 관측이 정당화.

2.6 요약·모델 선택의 결정 이론적 해석

Ch.9 의 미묘한 포인트: 사후 요약 자체가 결정 문제. 전체 사후 분포를 보고할 수 없을 때 (의사소통 제약) 평균·분위수·구간 중 무엇을 고를 것인가는 “어떤 scoring function 을 최소화할 것인가” 의 결정.

평균 = 제곱 손실 최소화.
중앙값 = 절댓값 손실 최소화.
로그 점수 최소화 = 전체 사후 예측 분포 보고.

Ch.7 의 로그 점수가 “가장 정보적 요약은 요약하지 않는 것” 임을 결정 이론적으로 말한다.

모델 선택도 같은 언어:

확장 모델의 예측 개선이 추가 변수 측정 비용을 정당화하는가?

이 질문을 Ch.7 의 LOO-CV·WAIC 점수에 비용 항을 결합해 결정 규칙으로 형식화할 수 있다.

3 § 9.2 — Survey Incentives (반쪽 결정 분석)

3.1 배경

NYC Social Indicators Survey (격년 전화 조사, 응답률 50% 미만). 설계자의 두 질문:

인센티브 비용이 편익을 정당화하는가?
준다면 얼마·언제·어떻게·누구에게?

다섯 요인이 인센티브 효과에 영향:

Value — 금액 (10 달러 단위).
Timing — 사전/사후 지급.
Form — 현금/선물.
Mode — 대면/전화.
Burden — 조사 부담 (고/저).

3.2 39 개 실험 메타분석

39 조사에 매립된 실험, 총 101 조건. “$y_i$” = $i$ 조건의 응답률. 기준 조건 대비 차이 $z_i = y_i - y_i^0$ 로 변환 (62 개 차이). 이 변환이 조사 간 기준 응답률의 차이를 제거.

3.3 계층 회귀 모형

$z_i$ 를 다섯 요인의 함수로 회귀. 개별 조사 내 실험 변동 + 조사 간 변동 을 계층 구조로.

\[ z_i \sim \mathrm{N}(X_i \beta + \alpha_{j[i]}, \sigma^2), \quad \alpha_j \sim \mathrm{N}(0, \tau^2) \]

$X_i$: 요인들의 상호작용.
$\alpha_j$: 조사 $j$ 의 random intercept.
$\tau$: 조사 간 분산.

이 모형이 sparse 한 요인 간 상호작용 (예: “prepaid × value”) 을 시각화.

3.4 비용-응답률 트레이드오프

회귀 추정치를 NYC 특정 상황 (전화·저부담) 의 예측으로 변환.

\[ \Delta R(\text{incentive}) = f(\text{value, timing, form}), \quad \Delta C(\text{incentive}) = g(\text{value, form, response rate}) \]

응답률 증가 $\Delta R$.
추가 비용 $\Delta C$ — 원래 비용 + 인센티브 × 응답자 수.

비용 대비 응답률 증가 곡선을 결정자에게 제시. 효용 함수를 명시하지 않고 trade-off 만 보여 주는 “반쪽 분석” — 결정자가 자신의 가치 판단으로 곡선에서 한 점을 선택.

직관 — 왜 “반쪽 분석” 이 실무에서 유용한가

완전 통합 분석은 효용 함수를 명시해야 하는데, “1% 응답률 증가가 달러로 얼마인가” 같은 질문에 자신 있게 답할 수 있는 조직은 드물다. 응답률은 설문의 과학적 품질과 연결되지만, 달러로 변환하는 환율이 불확실.

이럴 때 분석자는 trade-off 곡선만 그려 주고 결정자 (설문 PM) 가 자신의 가치에 따라 선택하게 한다. 이것이 실무 결정 분석의 80% — 효용 함수의 완전 명시는 의료·환경 같은 특수 도메인에만 가능.

3.5 “유의하지 않음 ≠ 무시” 의 구체

§ 9.2 의 핵심 교훈. “form (cash vs gift)” 회귀 계수가 유의하지 않았다고 가정. 전통 접근: 0 으로 설정 + 모형에서 제거. 결정 이론: 사후 평균 그대로 사용.

결과 차이: 0 으로 두면 “gift 가 cash 와 같은 효과” 가정 → gift 인센티브가 저비용이므로 과도하게 추천될 위험. 사후 평균을 쓰면 가격표 비교가 올바르게.

4 § 9.3 — Bronchoscopy 와 Value of Information

4.1 문제 설정

95 세 남성, 폐에 악성 의심 종양. 세 치료 선택.

결정	결과
방사선 치료	악성 시 수명 16.7 개월, 양성 시 34.8 개월
수술	35% 즉사. 생존 시 악성 20.3 / 양성 34.8
무치료	악성 5.6 / 양성 34.8

사전 악성 확률 $= 0.9$. 효용 = QALY (quality-adjusted life expectancy) = 수명 - 치료 시 1 개월 (불편).

4.2 단일 결정점 계산

$\mathbb{E}[\mathrm{QALY} \mid d]$ 를 각 $d$ 에 대해 계산.

Radiotherapy: $0.9 \cdot 16.7 + 0.1 \cdot 34.8 - 1 = 17.5$ 개월.
Surgery: $0.65 \cdot (0.9 \cdot 20.3 + 0.1 \cdot 34.8 - 1) = 13.5$ (35% 가 0).
No treatment: $0.9 \cdot 5.6 + 0.1 \cdot 34.8 = 8.5$.

방사선 치료가 최적 (17.5 개월).

4.3 두 번째 결정점 — Bronchoscopy

네 번째 선택: 기관지 내시경 으로 악성 확인 후 결정.

검사 민감도 70%, 특이도 98%.
검사 자체로 5% 사망 위험.

Bayes’ rule 로 사후 악성 확률 갱신:

\[ \Pr(\text{cancer} \mid T = +) = \frac{0.9 \cdot 0.7}{0.9 \cdot 0.7 + 0.1 \cdot 0.02} = 0.997 \]

\[ \Pr(\text{cancer} \mid T = -) = \frac{0.9 \cdot 0.3}{0.9 \cdot 0.3 + 0.1 \cdot 0.98} = 0.734 \]

양성 결과 → radiotherapy QALY = $0.997 \cdot 16.7 + 0.003 \cdot 34.8 - 1 = 15.8$. 음성 결과 → radiotherapy QALY = $0.734 \cdot 16.7 + 0.266 \cdot 34.8 - 1 = 20.5$.

두 경우 모두 radiotherapy 가 여전히 최적 → 검사 결과가 결정을 바꾸지 못함.

4.4 Bronchoscopy 의 기대 QALY

검사 위험 5% 반영.

양성 확률 = $0.9 \cdot 0.7 + 0.1 \cdot 0.02 = 0.632$. 결과: $0.95 \cdot 15.8 = 15.0$.
음성 확률 = $0.368$. 결과: $0.95 \cdot 20.5 = 19.5$.

\[ \mathbb{E}[\mathrm{QALY} \mid \text{bronchoscopy}] = 0.632 \cdot 15.0 + 0.368 \cdot 19.5 = 16.6 \text{ 개월} \]

방사선 (검사 없이) 17.5 > 검사 후 16.6 → 검사하지 말 것.

4.5 왜 쓸모없는 검사인가 — VoI 분해

검사가 쓸모없는 이유: 결과가 무엇이든 같은 결정 (radiotherapy). 완벽한 정보의 가치 $\mathrm{EVPI}$ 가 검사의 사망 위험 ($5\%$)보다 작은 경우.

직관 — “결정을 바꾸지 않는 정보는 가치가 없다”

이 예제의 교훈: VoI 는 “결정 변화 가능성”과 직결. 관측이 아무리 정확해도, 그 결과가 선택을 바꾸지 않으면 가치 0.

95 세 남성의 상황이 극단적: 사전 악성 확률이 매우 높아 음성 결과도 여전히 악성 확률 73%. 이 73% 도 radiotherapy 선택을 정당화. 검사의 유일한 기능이 “음성이면 무치료 선택” 이었어야 하는데, 수치적으로 그게 일어나지 않음.

실무 함의: 의료 검사 주문 전에 “이 결과로 무엇이 바뀌나” 를 먼저 물어야 한다. 바꾸지 않으면 검사의 위험·비용만 남음. 과잉 진단의 수학적 뿌리.

5 § 9.4 — Home Radon 의 완전 통합 분석

5.1 배경

라돈: 자연 발생 방사성 가스. 미국 연간 수천 명의 폐암 사망 원인으로 추정. 연간 평균 농도 분포는 로그정규 (기하평균 0.67 pCi/L, 기하표준편차 3.1). 대부분 가구는 안전하지만 약 5 만~10 만 가구가 20 pCi/L 초과 (광부 직업 노출 한계 수준).

5.2 세 결정

가구주의 세 선택.

측정 후 결정 (2 단계) — $\$15~20$ 단기 (또는 $\$50$ 장기) 측정 → 결과 보고 완화 여부 결정.
무조건 완화 — $\$2000$ 지출 (sub-slab depressurization). 측정 없이 바로.
무조건 무시 — 비용 0, 리스크 감수.

측정 정확도:

단기 측정 (지하실): 편향 있음, 기하표준편차 1.8.
장기 측정 (주거 공간 12 개월): 편향 없음, 기하표준편차 1.2.

5.3 계층 회귀 기반 예측

라돈 농도의 지역별 분포를 계층 모형으로. 각 주에 해당하는 카운티 별 분포를 공유 hyperparameter 로 묶음. 측정 오차도 계층의 일부.

\[ \log y_{ij} \sim \mathrm{N}(\mu_j, \sigma_y^2), \quad \mu_j \sim \mathrm{N}(\nu, \sigma_\mu^2) \]

$y_{ij}$: 카운티 $j$ 의 가구 $i$ 실제 라돈 농도.
$\mu_j$: 카운티 평균.
$\nu, \sigma_\mu$: 전국 hyperparameter.

5.4 효용 함수

달러 + 생명 두 차원을 결합.

\[ U = -(\text{cost in \$}) - (\text{expected life-years lost}) \cdot \alpha \]

$\alpha$: 생명-달러 환율 (QALY × $ per QALY). 미국 기준 $\alpha \approx \$100{,}000$ / life-year (공중보건 표준).

5.5 결정 분석 결과

장기 측정이 단기보다 비용-효용 기준 유리. 결정 규칙:

사후 라돈 분포가 특정 임계값 (대략 4 pCi/L) 을 초과할 확률이 높으면 완화.
특정 intermediate zone 에서는 장기 측정 권장 (VoI 최대).

이 분석이 “정확한 지역 위험 예측 + 개별 가구 결정 규칙” 의 프로토타입 — 계층 회귀가 카운티 평균을 추정하고, 결정 분석이 가구별 완화 임계값을 결정.

직관 — 계층 모형이 개인 결정에 어떻게 쓰이는가

계층 모형의 핵심 결과: “내 카운티 평균” 은 전국 평균과 카운티 표본 평균의 shrinkage. 작은 카운티는 전국 평균 쪽으로, 큰 카운티는 자기 평균 쪽으로.

한 가구의 결정은 자기 카운티의 사후 분포에 의존. 계층 모형이 없으면 “전국 평균만 본다 (과소 구별)” 아니면 “내 카운티 표본만 본다 (과도 분산)”. 계층 모형은 두 극단 사이의 데이터 기반 절충 — 그 절충이 가구 결정의 합리성을 높인다.

이것이 § 8.3 의 1988 CBS 16 strata 계층 모형이 결정 분석 맥락 에서 재해석된 결과. Ch.8 의 수집 모델과 Ch.9 의 결정 분석이 계층 모형으로 이어진다.

6 § 9.5 — Personal vs Institutional

6.1 두 관점

같은 결정 분석이 주체에 따라 다르게 해석된다.

차원	Personal	Institutional
주체	개인 (환자, 가구)	조직 (병원, 정부)
최적화 대상	자기 기대 효용	모집단 평균 / 사회 후생
효용 환율	개인 선호	사회적 합의
위험 태도	개인별 다름	평균적 중립 가정

6.2 의료 사례

폐암 환자 bronchoscopy 결정:

Personal: 95 세 개인이 자기 수명·삶의 질 기준으로 결정. 위험 회피가 강하면 검사 기피.
Institutional: 병원이 모든 95 세 환자에 대한 프로토콜 결정. 평균적 환자의 기대 효용 기준.

동일 확률·효용 추정치여도 결정 단위가 다르면 다른 결론이 나올 수 있다.

6.3 라돈 사례

Personal: 한 가구가 “내 집 측정할까” 결정. 자기 사후 + 자기 예산.
Institutional: EPA 가 “전국 공중보건 캠페인” 정책 결정. 집단 평균 피해 축소.

Institutional 관점은 “희귀 고위험 가구 발견” 에 가중치를 줄 수 있음 — 개인 기준으로는 비효율적인 대규모 측정 권고가 공중보건 기준으로는 정당.

직관 — “개인 최적 ≠ 집단 최적” 의 뿌리

개인의 기대 효용 최대화와 집단의 평균 효용 최대화는 일반적으로 다르다. 두 이유:

이질성. 집단 내 개인들의 위험·선호가 다르면 집단 평균 결정은 누구에게도 최적 아님.
외부성. 한 사람의 결정이 다른 사람에게 영향 (백신, 환경). 개인 관점은 이를 무시.

Ch.9 § 9.5 는 이 구분을 명시적으로 다루며, 베이즈 결정 분석이 프레임을 고를 때 이 선택을 분석자가 의식적으로 해야 함을 강조.

7 왜 Ch.9 도구가 필요한가

결정 분석을 생략하면 발생하는 사고.

추론 마비 — 사후 분포만 보고 “그래서 무엇을 할까?” 에 답 못 함.
과잉 진단 — VoI 고려 없이 모든 검사 주문. 위험·비용 무시.
유의성 함정 — $p < 0.05$ 변수만 모형 유지, 결정에 중요한 변수 손실.
위험 중립 가정 오남용 — 기대값만 보고 분산 무시. 위험 회피적 결정자에게 부적절.
개인-집단 혼동 — 개인 상담과 정책 결정에 같은 분석 적용.
효용 환율 은폐 — “달러 vs 생명” trade-off 를 명시하지 않고 암묵 가정.

Ch.9 는 이 사고를 “결정 공간·확률·효용·최적화” 의 명시적 네 단계로 차단.

8 응용 분야

분야	Ch.9 도구의 역할
임상 의학	QALY 기반 치료 선택, 검사 VoI
공중보건	백신 프로그램, 환경 규제
환경 공학	측정·완화 결정 (라돈, 석면)
보험 수리	보장 설계, 재보험 결정
마케팅	캠페인 예산 배분, A/B 테스트 중단 규칙
금융	포트폴리오 선택, 베이즈 최적 배팅
정책 평가	비용-편익 분석, 규제 영향 평가
과학 실험	실험 설계, 표본 크기 결정

9 예시 — Survey 인센티브 간단 시뮬레이션

§ 9.2 의 구조를 축약한 합성 예.

import numpy as np
import matplotlib.pyplot as plt

rng = np.random.default_rng(9)

# 예측: 인센티브 금액 별 응답률 증가 (사후 추출)
n_samples = 2000
incentive_values = np.arange(0, 50, 5)  # 0~45 달러

# 단순 계층 회귀 사후 추출 모사
beta_prepaid = rng.normal(0.003, 0.001, n_samples)  # 달러당 효과
alpha = rng.normal(0.02, 0.01, n_samples)           # 절편

# 각 금액에서의 기대 응답률 증가 (사후 평균)
delta_R = np.array([
    (alpha + beta_prepaid * v).mean() for v in incentive_values
])
delta_R_lo = np.array([
    np.quantile(alpha + beta_prepaid * v, 0.05) for v in incentive_values
])
delta_R_hi = np.array([
    np.quantile(alpha + beta_prepaid * v, 0.95) for v in incentive_values
])

# 비용: 기본 $20 + 인센티브 × 응답자 수 (1000 명 기준 응답률 0.5 가정)
base_cost = 20000
sample_size = 1000
baseline_rate = 0.5

total_cost = np.array([
    base_cost + v * sample_size * (baseline_rate + delta_R[i])
    for i, v in enumerate(incentive_values)
])

print("금액($) | 응답률 증가 | 90% 구간         | 총 비용($)")
for i, v in enumerate(incentive_values):
    print(f"  {v:3d}  |   {delta_R[i]:.4f}  | [{delta_R_lo[i]:.4f}, {delta_R_hi[i]:.4f}] | {total_cost[i]:,.0f}")

출력 해석: 인센티브가 증가하면 응답률도 증가하지만 비용이 가파르게 상승. 결정자는 이 trade-off 표에서 자신의 “응답률 1% 당 지불 의사” 에 따라 한 지점을 선택. 이것이 “반쪽 결정 분석” 의 전형.

10 예시 — Bronchoscopy VoI 계산

§ 9.3 의 결정 트리를 파이썬으로 재현.

# 상태
p_cancer_prior = 0.9
life_exp_no_cancer = 34.8
life_exp_radio_cancer = 16.7
life_exp_surgery_cancer = 20.3
life_exp_no_trt_cancer = 5.6
treatment_discomfort = 1  # month

# 단일 결정점 — radiotherapy
qaly_radio = (
    p_cancer_prior * life_exp_radio_cancer
    + (1 - p_cancer_prior) * life_exp_no_cancer
    - treatment_discomfort
)
qaly_surgery = (
    0.65 * (p_cancer_prior * life_exp_surgery_cancer
            + (1 - p_cancer_prior) * life_exp_no_cancer
            - treatment_discomfort)
)
qaly_no_trt = (
    p_cancer_prior * life_exp_no_trt_cancer
    + (1 - p_cancer_prior) * life_exp_no_cancer
)

print(f"Radiotherapy: {qaly_radio:.2f}")
print(f"Surgery:      {qaly_surgery:.2f}")
print(f"No treatment: {qaly_no_trt:.2f}")

best_no_test = max(qaly_radio, qaly_surgery, qaly_no_trt)
print(f"\n검사 없는 최적: {best_no_test:.2f} 개월")

# Bronchoscopy 후 분기
sensitivity = 0.70
specificity = 0.98
test_mortality = 0.05

p_pos = p_cancer_prior * sensitivity + (1 - p_cancer_prior) * (1 - specificity)
p_neg = 1 - p_pos
p_cancer_given_pos = p_cancer_prior * sensitivity / p_pos
p_cancer_given_neg = p_cancer_prior * (1 - sensitivity) / p_neg

def best_treatment(p_c):
    q_radio = p_c * 16.7 + (1 - p_c) * 34.8 - 1
    q_surg  = 0.65 * (p_c * 20.3 + (1 - p_c) * 34.8 - 1)
    q_none  = p_c * 5.6 + (1 - p_c) * 34.8
    return max(q_radio, q_surg, q_none)

qaly_post_pos = best_treatment(p_cancer_given_pos)
qaly_post_neg = best_treatment(p_cancer_given_neg)
qaly_bronch = (1 - test_mortality) * (p_pos * qaly_post_pos + p_neg * qaly_post_neg)

print(f"\n양성 후 최적: {qaly_post_pos:.2f}  (p_cancer={p_cancer_given_pos:.3f})")
print(f"음성 후 최적: {qaly_post_neg:.2f}  (p_cancer={p_cancer_given_neg:.3f})")
print(f"Bronchoscopy 기대 QALY: {qaly_bronch:.2f}")

evpi = (p_pos * qaly_post_pos + p_neg * qaly_post_neg) - best_no_test
voi = qaly_bronch - best_no_test
print(f"\n완벽 정보의 가치 (EVPI): {evpi:.2f} 개월")
print(f"실제 검사의 가치 (VoI):  {voi:.2f} 개월  <- 음수면 검사 금지")

기대 출력: EVPI 가 양수여도 검사 위험 5% 감점 후 VoI 가 음수 — 검사하지 말 것. § 9.3 의 교훈을 수치로 확인.

11 실전 체크리스트

결정 분석을 실무에 녹이는 8 단계.

결정 공간 명시 — 가능한 $d$ 를 모두 나열. 놓친 선택지가 없는지 점검.
확률 모형 먼저 — $p(x \mid d)$ 를 사후로 계산. 여기가 베이즈의 역할.
효용 단위 결정 — 달러·QALY·생명연수·이익 중 선택. 다차원이면 환율 명시.
결정 트리 그리기 — 다단계면 역방향 귀납.
VoI 계산 — 관측·검사 옵션이면 EVPI 가 비용·위험을 넘는지 확인.
민감도 분석 — 사전·효용 환율·모수에 대한 결정 안정성 점검.
개인 vs 집단 선택 — 누구의 효용을 최적화하는지 명시.
유의성 함정 피하기 — 모든 추정 계수를 사후 그대로 사용. 0 으로 설정 금지.

12 관련 주제

선행 지식

Bayesian Part II 개관 — Ch.6~9 전체 지도
Ch.6 Model Checking — 베이즈의 세 번째 걸음
Ch.7 Evaluating, Comparing, Expanding Models — 네 번째 걸음
Ch.8 Modeling Accounting for Data Collection — 다섯 번째 걸음
Ch.7 § 7.1~7.4 심화 — scoring function 이 § 9.1 의 model selection 에 연결

Ch.9 세부 절 (후속 작성 예정)

01-9-1-* — § 9.1~9.2 심화 (결정 이론 네 단계 정밀 전개, survey incentive 계층 회귀 상세)
01-9-2-* — § 9.3~9.4 심화 (bronchoscopy 트리 완전 계산, home radon 완전 통합)
01-9-3-* — § 9.5~9.7 심화 (personal vs institutional, 연습문제)

후속 주제

Ch.10 Introduction to Bayesian Computation — 다단계 트리 계산의 수치 방법
Ch.18 Missing Data — 결정 분석에서의 결측 처리
Ch.22 Finite Mixture Models — 이질 집단의 결정 분석

관련 개념

Berger (1985), Statistical Decision Theory and Bayesian Analysis — 결정 이론의 표준 교과서
Raiffa & Schlaifer (1961), Applied Statistical Decision Theory — decision tree 의 원전
Weinstein et al. (1980) — QALY 기반 의료 경제학의 기초
Claxton et al. (2001) — EVPI 의 의료 기술 평가 적용
Lindley (1985), Making Decisions — 베이즈 결정 분석 대중서
Parmigiani & Inoue (2009), Decision Theory: Principles and Approaches — 현대 통합 교재