§ 9.1~9.3 — 결정 이론·설문 인센티브·의료 검진

Gelman BDA Ch.9 심화 — 네 단계 수식 전개, 역방향 귀납과 VoI 분해, NYC Social Indicators 계층 회귀 식 (9.1)~(9.3), 95 세 폐암 환자 bronchoscopy 의 EVPI 가 음수인 이유 완전 계산

Ch.9 overview 가 “무엇을 결정할 것인가” 의 지도였다면, 이 포스트는 § 9.1~9.3 의 실제 여정이다. 왜 결정 \(d\) 에는 확률을 안 주는지, 기대 효용 최대화가 왜 유일한 합리적 선택 규칙인지 (von Neumann-Morgenstern), Value of Information 의 세 변종 (EVPI, EVSI, EVPPI) 이 어떻게 관측 선택을 안내하는지, NYC Social Indicators 설문의 계층 이항 회귀 식 (9.1)~(9.3) 이 39 조사 101 조건을 하나의 사후로 묶는 구조, \(\sigma \approx 3\%\) (내부 변동) 과 \(\tau \approx 18\%\) (조사 간 변동) 의 분산 분해가 결정에 어떻게 쓰이는지, \(\$5\) postpaid 인센티브가 net \(\$4.49\) per interview 가 되는 정확한 비용 계산, 95 세 남성의 폐암 bronchoscopy 예제에서 사전 악성 확률 0.9 에서 Bayes rule 로 양성 후 0.997·음성 후 0.734 로 갱신되는 수치, 왜 두 경우 모두 radiotherapy 가 최적이어서 검사 자체가 “결정을 바꾸지 못함” 의 수학적 의미, 검사가 유용해지려면 어떤 파라미터 조합이 필요한가의 민감도 — 각 수식 옆에 “왜 이 항이 들어가는가” 와 “왜 합리적인가” 를 붙여 전개한다.

Statistics
Bayesian
저자

Kwangmin Kim

공개

2026년 04월 23일

1 개요 — 세 절의 복잡도 증가

Ch.9 § 9.1~9.3 은 결정 분석의 복잡도 스펙트럼을 오른다.

단계 한 줄 요약
9.1 이론 네 단계·기대 효용·VoI 의 공식화
9.2 반쪽 분석 계층 회귀로 비용-편익 예측, 효용 함수는 결정자 몫
9.3 다단계 트리 Bayes rule + 역방향 귀납 + VoI 가 실제 계산에서 충돌

Overview (01-9-0) 가 결론과 도구를 지도로 제시했다면, 이 포스트는 각 수식의 유도, 각 단계의 계산, 실전 수치를 보인다.

2 § 9.1 — 결정 이론의 수학적 구조

2.1 왜 결정과 불확실성은 다르게 다뤄지는가

베이즈 추론은 모든 미지 수량에 확률을 부여한다. 모수 \(\theta\), 미래 관측 \(\tilde{y}\), 결측 \(y_{\mathrm{mis}}\) — 전부. 결정 이론은 여기에 결정 \(d\) 를 추가하는데, \(d\) 는 예외: 확률을 안 준다.

정의 — 결정과 불확실성의 분리
  • Uncertain quantity \(x\): 자연이 실현하는 값. 확률 분포 \(p(x)\) 또는 조건부 \(p(x \mid d)\) 를 가진다.
  • Decision \(d\): 결정자가 선택하는 값. 확률 분포 없음.

결정 분석의 대상:

\[ p(x \mid d) \quad \text{for each candidate } d \]

\(p(d)\), \(p(x)\) 는 정의 안 됨. 모든 확률은 \(d\) 조건부.

이 구분이 결정 분석의 출발점. 왜?

2.1.1 이유 1 — 순환 회피

\(p(d)\) 를 쓰려면 “나는 \(d\) 를 어떤 확률로 선택할까” 를 정의해야 하는데, 이건 이미 결정 규칙이 있어야 알 수 있다. 결정 규칙을 찾는 것이 목표인데 결정 규칙을 가정하는 셈.

2.1.2 이유 2 — 자유 의지의 수학적 표현

결정자는 모든 \(d\) 를 선택할 수 있다. 확률을 주면 “나의 선택이 무작위” 를 가정하는 셈. Game theory 의 mixed strategy 처럼 의도적 무작위화는 예외지만, 일반적으론 \(d\) 는 자유 변수.

2.1.3 이유 3 — 조건부 구조

베이즈 추론의 사후 \(p(\theta \mid y)\) 가 관측 \(y\) 조건부이듯, 결정 분석의 모든 계산은 \(d\) 조건부. \(d\) 를 바꾸면 전체 계산 다시.

2.2 기대 효용 최대화 — 네 단계의 정밀 전개

정의 — Bayesian Decision Analysis 네 단계 (정밀 버전)

Step 1. 결정·결과 공간 열거.

  • 결정 공간 \(\mathcal{D} = \{d_1, d_2, \ldots\}\). 유한 또는 연속.
  • 결과 공간 \(\mathcal{X}\). 결과 \(x \in \mathcal{X}\) 는 관측 \(\tilde{y}\) 와 모수 \(\theta\) 를 함께 포함할 수 있다.

Step 2. 조건부 분포 \(p(x \mid d)\).

사후 예측 분포의 일반화:

\[ p(x \mid d, y) = \int p(x \mid d, \theta) \, p(\theta \mid y) \, d\theta \]

\(y\) 는 이미 관측된 데이터. \(x\) 는 “결정 \(d\) 하의 미래 결과”.

Step 3. 효용 함수 \(U: \mathcal{X} \to \mathbb{R}\).

결과를 실수로 사상. 단일 차원 (수명, 이익) 또는 다차원 결합:

\[ U(x_1, x_2, \ldots) = \alpha_1 x_1 + \alpha_2 x_2 + \cdots \]

\(\alpha_k\) 는 차원 간 환율 (달러 per QALY 등). 명시적 선택 필요.

Step 4. 기대 효용 최대화.

\[ d^* = \arg\max_{d \in \mathcal{D}} \; \mathbb{E}[U(x) \mid d] = \arg\max_d \int U(x) \, p(x \mid d) \, dx \]

사후 예측 기댓값으로 적분. 시뮬레이션으로 근사 가능:

\[ \mathbb{E}[U(x) \mid d] \approx \frac{1}{S} \sum_{s=1}^S U(x^{(s)}), \quad x^{(s)} \sim p(x \mid d, y) \]

네 단계가 “추론 \(\to\) 최적화” 의 합성. 추론 부분 (Step 2) 은 베이즈, 최적화 부분 (Step 4) 은 OR/scipy.optimize.

2.3 왜 기대 효용 최대화가 “유일한 합리적” 규칙인가

von Neumann-Morgenstern (1944) 의 정리. 합리성 공리 네 개 (완비성·이행성·독립성·연속성) 를 만족하는 선호는 어떤 효용 함수 \(U\) 의 기대값 최대화로 표현된다.

공리 간단 요약:

  • 완비성: 어떤 두 옵션도 비교 가능 — \(A \succ B\), \(A \prec B\), \(A \sim B\) 중 하나.
  • 이행성: \(A \succ B, B \succ C \Rightarrow A \succ C\).
  • 독립성: \(A \succ B \Rightarrow \alpha A + (1-\alpha) C \succ \alpha B + (1-\alpha) C\) for \(\alpha \in (0, 1]\).
  • 연속성: “거의 같으면” 작은 확률 변화로 선호가 뒤집히지 않음.

이 네 공리를 받아들이면 다른 선택 규칙 (maxmin, minimax regret 등) 은 합리적일 수 없다.

직관 — 왜 공리가 “합리성” 인가

공리를 위반하면 “Dutch book” 에 걸린다 — 여러 번의 선택을 통해 지속적으로 손실을 보는 상황.

예: 이행성 위반. \(A \succ B, B \succ C, C \succ A\) 면, \(A\) 소유 시 “\(B\) 로 교환 + 수수료” 수락. \(B\) 소유 시 “\(C\) 로 교환 + 수수료” 수락. \(C\) 소유 시 “\(A\) 로 교환 + 수수료” 수락. 돌고 돌아 시작점으로 돌아왔는데 수수료만 지불 — 손실.

VNM 정리가 말하는 것: 이런 함정을 피하려면 기대 효용 최대화를 따라야 한다. 기대 효용 규칙은 편의가 아니라 합리성의 논리적 귀결.

2.4 결정 트리와 역방향 귀납

다단계 결정 문제. 트리 구조:

  • 결정 노드 (사각형) — 결정자가 선택.
  • 확률 노드 (원형) — 자연이 실현.
  • 말단 노드 (삼각형) — 효용 값.

평가는 역방향 귀납 (backward induction):

  1. 말단에서 효용 읽기.
  2. 확률 노드: 기댓값 계산.
  3. 결정 노드: 최대값 선택.
  4. 뿌리까지 반복.

수학적 재귀:

\[ V(\text{node}) = \begin{cases} U(x) & \text{leaf} \\ \sum_x p(x \mid \text{context}) V(\text{child}) & \text{chance node} \\ \max_d V(\text{child}_d) & \text{decision node} \end{cases} \]

직관 — 왜 순방향이 아니라 역방향인가

순방향: “지금 결정할 때 나중에 어떤 정보가 들어올지” 예측해야 하는데, 그 예측은 그 정보에 대한 결정에 의존 — 순환.

역방향: 마지막 결정부터 해결. 마지막 시점에서 그 때 조건부 최적 결정의 기대 효용이 그 노드의 값. 이를 반복 — Bellman 원리.

이 패턴이 Ch.9 의 모든 다단계 문제 (bronchoscopy, radon 측정-완화) 의 계산 엔진.

2.5 Value of Information — 세 변종

2.5.1 EVPI — Expected Value of Perfect Information

“완벽한 미래 관측이 가치가 얼마인가” 의 척도.

\[ \mathrm{EVPI} = \mathbb{E}_{y_{\mathrm{new}}}[\max_d U(d, y_{\mathrm{new}})] - \max_d \mathbb{E}_{y_{\mathrm{new}}}[U(d, y_{\mathrm{new}})] \]

  • 첫 항: 관측 결정 (각 관측값마다 최적). 기댓값 밖에 max.
  • 둘째 항: 관측 없이 결정. max 밖에 기댓값.

\(\mathrm{EVPI} \ge 0\) 항상 (Jensen 부등식 역방향). 등호는 관측이 결정을 바꾸지 못할 때만.

2.5.2 EVSI — Expected Value of Sample Information

“구체적 표본 크기의 관측” 의 가치. EVPI 와 달리 유한·정확도 제한.

\[ \mathrm{EVSI}(n) = \mathbb{E}_{y_{1:n}}[\max_d \mathbb{E}[U(d, x) \mid y_{1:n}]] - \max_d \mathbb{E}[U(d, x)] \]

\(n \to \infty\) 에서 \(\mathrm{EVSI} \to \mathrm{EVPI}\).

2.5.3 EVPPI — Expected Value of Partial Perfect Information

“특정 모수 \(\theta_k\) 를 정확히 안다면” 의 가치. 다차원 모수 중 어느 것이 결정에 가장 영향을 주는가 를 진단.

\[ \mathrm{EVPPI}(\theta_k) = \mathbb{E}_{\theta_k}[\max_d \mathbb{E}[U \mid d, \theta_k]] - \max_d \mathbb{E}[U \mid d] \]

EVPPI 가 크면 \(\theta_k\) 추정 정확도에 투자할 가치 있음.

직관 — VoI 세 변종의 관계

\[ 0 \le \mathrm{EVSI}(n) \le \mathrm{EVPPI}(\theta_k) \le \mathrm{EVPI} \]

순서: 부분 정보 \(\le\) 부분 완벽 정보 \(\le\) 완벽 정보.

실무 전략: EVPI 로 “관측의 이론적 상한” 확인 → EVPPI 로 “어느 모수가 결정적인가” 진단 → EVSI 로 “현실적 \(n\) 이 투자 가치 있는가” 판단.

§ 9.3 의 bronchoscopy 는 EVPI 자체가 검사 비용보다 작아 검사 무효 — 첫 단계부터 음수 판정.

2.6 Scoring Rules 와 Model Selection 의 결정 이론적 해석

Ch.9 § 9.1 의 미묘한 포인트. 사후 요약 자체가 결정 문제.

전체 사후 \(p(\theta \mid y)\) 를 보고할 수 없을 때, 무엇을 보고할 것인가? 점추정 \(\hat{\theta}\)? 구간? 분위수?

각 요약은 loss function 을 암묵 가정:

요약 최소화하는 손실
사후 평균 제곱 손실 \((\theta - \hat{\theta})^2\)
사후 중앙값 절댓값 손실 \(\lvert\theta - \hat{\theta}\rvert\)
MAP 추정 0-1 손실 (근사)
95% 구간 커버리지 제약 하 길이 최소화

전체 사후 보고는 로그 점수 최대화 — Ch.7 § 7.1 의 “local & proper 한 유일한 점수 규칙”.

2.6.1 모델 선택도 결정 문제

“모델 \(M_1\) vs \(M_2\)” 는 다음 결정 문제:

\[ d^* = \arg\max_{d \in \{M_1, M_2\}} \; \mathrm{elpd}(d) - C(d) \]

\(\mathrm{elpd}\) 는 예측 로그 우도, \(C(d)\)변수 측정 비용. 추가 변수로 예측이 개선되더라도 수집 비용이 더 크면 \(M_2\) 포기.

Ch.7 의 LOO-CV·WAIC 이 첫 항 추정, Ch.9 의 결정 이론이 두 항의 균형.

3 § 9.2 — Survey Incentive 계층 회귀

3.1 문제 정의

NYC Social Indicators Survey: 격년 전화 조사, 응답률 50% 미만. 설계자 질문:

  1. 인센티브 제공이 정당화되는가?
  2. 제공 시 얼마·언제·어떻게·누구에게?

다섯 요인이 효과에 영향:

  • Value (10 달러 단위).
  • Timing (prepaid / postpaid).
  • Form (cash / gift).
  • Mode (전화 / 대면).
  • Burden (고부담 / 저부담).

고부담: 1 시간 이상 + 민감 질문.

3.2 데이터 — 39 조사 101 조건 메타분석

39 조사에 매립된 실험. 각 조사는 내부적으로 여러 인센티브 조건 비교 (randomization within survey). 총 101 조건, 62 쌍 차이.

단순 차이 \(z_i = y_i - y_i^0\) 에서 시작 (62 개). 그러나 Gelman 은 더 정교한 계층 모형으로 확장 — 이유: 상호작용 (예: prepaid × value) 추정, 불균형 표본 크기 처리, 조사 간 변동 모형화.

3.3 계층 이항 회귀 — 식 (9.1)~(9.3)

세 단계 모형.

3.3.1 1단계 — 이항 우도 (식 9.1)

\(i = 1, \ldots, 101\) 조건. \(N_i\) 명 접촉, \(n_i\) 명 응답. \(y_i = n_i/N_i\), \(\pi_i\) 는 모집단 응답 확률.

\[ n_i \sim \mathrm{Bin}(N_i, \pi_i) \tag{9.1} \]

왜 이항? 응답 여부가 Bernoulli, 독립 개인 \(N_i\) 명의 합이 Binomial. 불균형 \(N_i\) 를 자동 반영.

3.3.2 2단계 — 회귀 (식 9.2)

\[ \pi_i \sim \mathrm{N}(X_i \beta + \alpha_{j(i)}, \sigma^2) \tag{9.2} \]

  • \(X_i \beta\): 고정 효과 (인센티브 요인 + 상호작용).
  • \(\alpha_{j(i)}\): 조사 \(j(i)\) 의 random intercept (39 조사).
  • \(\sigma\): 조사 내 잔차.

응답률이 0~1 사이여야 하므로 로짓 변환이 맞지만, 실제 응답률이 0.3~0.7 범위라 선형이 근사적으로 타당. 저자는 의도적으로 선형 선택 — “계수 해석이 훨씬 쉬움” (백분율 직접).

직관 — 왜 로짓 대신 선형을 쓰는가

로짓이 이론적으로 더 엄밀하지만, 응답률이 0·1 에서 멀리 있으면 (0.3~0.7) 두 모형이 거의 같은 예측을 낸다.

결정 분석에서는 계수 해석 가능성이 결정적. “\(\$10\) 가 응답률을 3~4 백분율 포인트 올린다” 가 직관적 의사소통. 로짓 계수 “\(\$10\) 가 log-odds 를 0.15 올린다” 는 비전문가에게 의미 없음.

Ch.9 의 교훈: 모형은 결정 사용자의 언어로 파라미터화. 수학적 엄밀성보다 의사소통 가능성 우선 — 근사가 충분히 정확한 구간에서.

3.3.3 3단계 — 초모수 (식 9.3)

\[ \alpha_j \sim \mathrm{N}(0, \tau^2), \quad \beta \sim \text{uniform}, \quad \sigma, \tau \sim \text{uniform} \tag{9.3} \]

조사 간 random effect 가 정규. \(\beta, \sigma, \tau\) 모두 비정보 사전. \(\tau\) 가 충분히 정확하게 추정되어 사전 민감도 낮음.

3.4 분산 분해 — \(\sigma \approx 3\%\) vs \(\tau \approx 18\%\)

적합 결과:

  • \(\hat{\sigma} \approx 3{-}4\) 백분율 포인트조사 내 잔차. 같은 조사에서 다른 인센티브 조건 간 예측 오차.
  • \(\hat{\tau} \approx 18\) 백분율 포인트조사 간 변동. 기준 응답률 차이 (Mode, Burden 로도 설명 안 되는 부분).
직관 — 왜 \(\tau \gg \sigma\) 인가, 그리고 왜 중요한가

조사 간 차이가 조사 내 차이보다 6 배 크다. 즉 “어떤 조사인가” 가 “어떤 인센티브를 줬는가” 보다 응답률에 훨씬 영향.

함의: 메타분석에서 얻은 평균 효과를 특정 새 조사 (NYC Social Indicators) 에 적용할 때, 예측 불확실성의 대부분이 “NYC 가 어떤 조사인가” 에서 온다. Random effect \(\alpha_{\mathrm{NYC}}\) 는 데이터에 없음 → 사전 \(\mathrm{N}(0, \tau^2)\) 로 예측 → \(\pm 18\%\) 불확실성.

이것이 “인센티브 효과는 작고 예측은 넓다” 의 구조적 이유. 결정자는 점추정 + 구간 을 함께 보고 위험을 평가해야 함.

3.5 선택된 모형 — 어느 상호작용을 포함하는가

36 가능 predictor 중 저자 선택:

  1. Mode, Burden, Mode × Burden — 조사 수준 효과 (응답률 기준선).
  2. Incentive 본체.
  3. Incentive × (Value, Timing, Form, Mode, Burden) — 모든 2-way.
  4. Incentive × Value × Timing, Incentive × Value × Burden — 3-way 일부.

모형 선택 원칙: 결정에 관련된 상호작용 포함. Incentive × Burden 은 “고부담 조사에서 인센티브 효과” 를 추정 — NYC 가 저부담이므로 이 상호작용이 없으면 잘못된 외삽.

Gelman 의 발견:

  • \(\$10\) 인센티브 → 응답률 3~4 백분율 포인트 증가.
  • Cash > gift: 1 백분율 포인트.
  • Prepaid > postpaid (per dollar): 1~2 백분율 포인트.
  • High-burden 에서 인센티브 효과 5 백분율 포인트 더 큼.

3.6 비용 계산 — \(\$5\) postpaid 의 전체 계산

§ 9.2 의 구체 사례 (p.243): caregiver survey (1500 respondents), \(\$5\) postpaid.

1단계 — 응답률 증가. 회귀 모형 예측:

\[ \Delta\pi = 1.5\% \Rightarrow \pi_{\mathrm{new}} = 38.9\% + 1.5\% = 40.4\% \]

2단계 — 인센티브 비용. 응답자 1500 명, 각 \(\$5 + \$1.25\) 처리 = \(\$6.25\).

\[ C_{\mathrm{incentive}} = 1500 \times 6.25 = \$9{,}375 \]

3단계 — 필요 접촉 수 감소. 응답률이 높아졌으므로 같은 1500 응답을 얻는 데 필요한 접촉 수 감소.

  • 원래: \(1500 / 0.389 = 3856\) 접촉.
  • 새로: \(1500 / 0.404 = 3715\) 접촉.

차이 141 가구. 스크리닝 단계까지 전파하면 약 3377 통화 감소.

4단계 — 절약. 통화당 평균 비용 × 3377 = \(\$2{,}634\).

5단계 — 순비용.

\[ C_{\mathrm{net}} = 9375 - 2634 = \$6{,}741 \quad \Rightarrow \quad \$6741/1500 = \$4.49 \text{ per interview} \]

응답률 1.5% 증가를 얻기 위한 인터뷰당 \(\$4.49\).

직관 — “인센티브 비용 = 순비용” 이 아닌 이유

순진한 계산: “\(1500 \times \$5 = \$7500\), 따라서 인터뷰당 \(\$5\)”. 틀림.

정확한 계산: 접촉 효율 증가 효과까지 포함. 응답률이 높으면 실패한 통화가 줄어든다. 실패 통화에도 인터뷰어 비용이 들어감 — 이 비용이 절약됨.

따라서 인센티브의 “진짜 비용” 은 원래 지출보다 훨씬 작다. 이게 “반쪽 결정 분석” 의 핵심 기여 — 결정자가 간과할 수 있는 2 차 효과를 명시화.

3.7 Figure 9.3 — Trade-off 곡선의 해석

두 조사 (individual, caregiver) × 두 타이밍 (prepaid, postpaid) 에 대한 trade-off.

조사 Prepaid Postpaid
Individual 약간 유리 불리
Caregiver 불리 (대규모라 prepaid 비용 급증) 유리

Individual 조사가 작으므로 prepaid 비용 부담 낮음. Caregiver 조사는 스크리닝 단계에서 많은 가구 제외 — prepaid 를 보내도 응답 안 하는 경우 많음 → postpaid 가 효율적.

운영 통일성을 위해 두 조사에 같은 타이밍 사용 → Gelman 의 권고: postpaid.

최종 결정 (금액 선택) 은 결정자에게 위임. 분석자 역할은 trade-off 곡선까지.

3.8 Loose Ends — 모델 한계

Gelman § 9.2 말미 (p.244) 의 솔직한 고백.

  1. 계수 불확실성 높음 — 36 가능 predictor, 62 차이만 있어 상호작용이 noisy.
  2. 비정보 사전 문제 — 모든 상호작용 포함하면 variance 폭발. Ridge-like weakly informative prior 가 더 맞음.
  3. 선형성 — 인센티브 증가에 따른 포화 미반영. 데이터 범위 밖 (\(\$20+\)) 외삽 금지.
  4. Random effect 확장 필요 — 인센티브 효과 자체가 조사별로 달라질 가능성.

저자가 확장 안 한 이유: “현재 지식의 한계에서 멈춤”. 결정 분석은 모델의 불완전성을 투명하게 보고하는 자세가 필수.

4 § 9.3 — Bronchoscopy 다단계 의사결정

4.1 문제 정의

95 세 남성, 폐 종양. 의사는 세 치료 선택을 고려.

결정 상태 의존 결과
Radiotherapy 악성 → 16.7 개월, 양성 → 34.8 개월, +1 개월 불편 감점
Surgery 35% 즉사. 생존 시: 악성 → 20.3 개월, 양성 → 34.8 개월, +1 개월 불편 감점
No treatment 악성 → 5.6 개월, 양성 → 34.8 개월

사전 악성 확률: \(\Pr(C) = 0.9\).

효용: QALY = 기대 수명 (개월) - 치료 시 1 개월 (불편).

4.2 단일 결정점 계산

4.2.1 Radiotherapy 기대 QALY

\[ \mathbb{E}[U \mid \text{radio}] = 0.9 \cdot 16.7 + 0.1 \cdot 34.8 - 1 = 15.03 + 3.48 - 1 = 17.51 \approx 17.5 \]

4.2.2 Surgery 기대 QALY

수술 자체 35% 사망. 생존 시 0.65 확률로 성공 결과:

\[ \mathbb{E}[U \mid \text{surgery}] = 0.35 \cdot 0 + 0.65 \cdot (0.9 \cdot 20.3 + 0.1 \cdot 34.8 - 1) = 0.65 \cdot 20.75 = 13.49 \approx 13.5 \]

4.2.3 No Treatment 기대 QALY

\[ \mathbb{E}[U \mid \text{none}] = 0.9 \cdot 5.6 + 0.1 \cdot 34.8 = 5.04 + 3.48 = 8.52 \approx 8.5 \]

최적: Radiotherapy (17.5 개월).

직관 — 왜 Surgery 가 Radiotherapy 보다 못한가 (악성 효과가 더 큰데도)

Surgery 가 악성 환자에게 더 좋은 결과 (20.3 vs 16.7). 그런데 왜 지는가?

35% 즉사 위험이 평균 효용을 지배. 수술 성공 시 기대 QALY \(\approx 20.75\) 인데, 0.65 를 곱해 13.49. 반면 radiotherapy 는 수술 사망 위험이 없음 — 전체에 0.9·16.7 + 0.1·34.8 곱이 적용.

일반 원리: 치료 자체의 치명 위험치료 효과를 상쇄할 수 있다. 고령 환자 (95 세) 에서 특히 중요 — 기대 수명이 짧아 “위험한 개입” 의 upside 가 제한적.

4.3 두 번째 결정점 — Bronchoscopy 도입

네 번째 옵션: 기관지 내시경 으로 악성 여부 확인 후 치료 결정.

검사 특성:

  • 민감도 (sensitivity): \(\Pr(T=+ \mid C) = 0.70\).
  • 특이도 (specificity): \(\Pr(T=- \mid \neg C) = 0.98\). 즉 \(\Pr(T=+ \mid \neg C) = 0.02\).
  • 검사 사망 위험: \(0.05\).

4.4 Bayes Rule — 사후 악성 확률 갱신

\[ \Pr(C \mid T=+) = \frac{\Pr(C) \Pr(T=+ \mid C)}{\Pr(C) \Pr(T=+ \mid C) + \Pr(\neg C) \Pr(T=+ \mid \neg C)} \]

4.4.1 양성 결과

\[ \Pr(C \mid T=+) = \frac{0.9 \cdot 0.7}{0.9 \cdot 0.7 + 0.1 \cdot 0.02} = \frac{0.63}{0.632} = 0.997 \]

사전 0.9 → 사후 0.997. 거의 확실한 악성.

4.4.2 음성 결과

\[ \Pr(C \mid T=-) = \frac{0.9 \cdot 0.3}{0.9 \cdot 0.3 + 0.1 \cdot 0.98} = \frac{0.27}{0.368} = 0.734 \]

사전 0.9 → 사후 0.734. 여전히 73% 악성 의심.

직관 — 왜 음성 결과도 악성 확률이 높은가

사전 확률 0.9 가 매우 높다. 음성 결과가 악성을 “배제” 하려면 극도로 정확한 검사가 필요.

수식으로: 사후 확률은 사전 × likelihood ratio. 음성의 likelihood ratio = 0.3 / 0.98 \(\approx 0.31\). 사전 오즈 \(0.9/0.1 = 9\) 에 0.31 곱 = 2.8 → 확률 2.8/3.8 = 0.74.

일반 원리: 사전이 강하면 검사 정보가 사전을 크게 움직이지 못한다. 95 세 환자의 사전 0.9 는 “노인 폐 종양은 거의 악성” 의사 경험 지식. 민감도 70% 검사로는 이를 뒤집기 어려움.

이것이 BAYES의 “강한 사전 + 약한 증거 = 사전 거의 그대로” 의 실전 예.

4.5 양성·음성 후 치료별 QALY

4.5.1 양성 후 (사후 0.997)

  • Radio: \(0.997 \cdot 16.7 + 0.003 \cdot 34.8 - 1 = 15.8\).
  • Surgery: \(0.65 \cdot (0.997 \cdot 20.3 + 0.003 \cdot 34.8 - 1) = 12.6\).
  • None: \(0.997 \cdot 5.6 + 0.003 \cdot 34.8 = 5.7\).

최적: Radio (15.8).

4.5.2 음성 후 (사후 0.734)

  • Radio: \(0.734 \cdot 16.7 + 0.266 \cdot 34.8 - 1 = 20.5\).
  • Surgery: \(0.65 \cdot (0.734 \cdot 20.3 + 0.266 \cdot 34.8 - 1) = 15.1\).
  • None: \(0.734 \cdot 5.6 + 0.266 \cdot 34.8 = 13.4\).

최적: Radio (20.5).

4.6 결정 트리의 결론 — “검사해도 같은 치료”

두 경우 모두 Radio 가 최적. 즉 검사 결과가 치료 선택을 바꾸지 않음.

4.7 Bronchoscopy 기대 QALY

트리의 역방향 귀납.

양성 확률:

\[ \Pr(T=+) = 0.9 \cdot 0.7 + 0.1 \cdot 0.02 = 0.632 \]

음성 확률:

\[ \Pr(T=-) = 1 - 0.632 = 0.368 \]

검사 후 기대 QALY (검사 사망 0.05 반영):

\[ \begin{aligned} \mathbb{E}[U \mid \text{bronch}] &= (1 - 0.05) \cdot [\Pr(T=+) \cdot U_+^{\mathrm{opt}} + \Pr(T=-) \cdot U_-^{\mathrm{opt}}] \\ &= 0.95 \cdot [0.632 \cdot 15.8 + 0.368 \cdot 20.5] \\ &= 0.95 \cdot [9.98 + 7.54] \\ &= 0.95 \cdot 17.53 \\ &\approx 16.6 \text{ 개월} \end{aligned} \]

검사 없이 radio: 17.5. 검사 후 radio: 16.6. 검사가 0.9 개월 손해.

4.8 EVPI 분해 — 왜 검사가 “가치 없음” 인가

EVPI 를 이 문제에 적용.

완벽한 정보: 종양이 악성인지 여부 100% 확실히 안다면?

  • 악성 (확률 0.9) → radio 로 16.7 - 1 = 15.7 (surgery 의 \(0.65 \cdot 19.3 = 12.5\) 보다 좋음).
  • 양성 (확률 0.1) → no treatment 로 34.8 (radio 의 33.8 보다 좋음).

\[ \mathbb{E}[U \mid \text{perfect}] = 0.9 \cdot 15.7 + 0.1 \cdot 34.8 = 14.13 + 3.48 = 17.61 \]

현재 최적 결정 (radio 무검사): \(17.5\).

\[ \mathrm{EVPI} = 17.61 - 17.5 = 0.11 \text{ 개월} \]

완벽한 정보의 가치가 고작 0.11 개월. 검사 사망 위험 5% 로 잃는 기대 QALY: \(0.05 \cdot 17.5 = 0.875\) 개월.

\[ 0.11 - 0.875 = -0.76 \quad \text{(이조차 완벽 정보 가정)} \]

Bronchoscopy 는 완벽 정보도 아니고 (민감도 70%, 특이도 98%) 검사 위험 5%. 결과: 검사 VoI = 음수. 계산: \(16.6 - 17.5 = -0.9\) 개월.

직관 — EVPI 가 왜 이렇게 작은가

EVPI 가 크려면 두 조건 필요:

  1. 결과에 따라 결정이 바뀌어야 함.
  2. 다른 결정들이 기대 효용에서 크게 차이나야 함.

이 문제에서 양성이면 radio (15.7), 음성이면 no-treatment (34.8). 조건 1 만족. 그러나 사전 확률이 매우 불균형 (0.9 vs 0.1) — 음성의 가중치가 작음 → EVPI 가 “가끔 있는 좋은 뉴스” 의 기댓값으로 작아짐.

만약 사전 악성 확률이 0.5 였다면? EVPI 가 훨씬 커져 검사가 유용. 사전이 극단적이면 검사가 덜 유용.

4.9 “검사가 유용해지려면” — 민감도 분석

Bronchoscopy 를 정당화하려면 어떤 조합이 필요한가?

  1. 사전 확률 완화\(\Pr(C)\) 가 0.5~0.7 이면 EVPI 상승.
  2. 검사 위험 감소 — 5% → 1% 면 검사 가치 재평가.
  3. 치료 간 격차 확대 — 양성 시 “no treatment” 가 “radio” 보다 훨씬 유리해지면.
  4. 검사 정확도 향상 — 민감도·특이도 100% 에 가까워지면.

현재 구조에서는 95 세 + 사전 0.9 조합이 검사를 무효화. 더 젊은 환자 (사전 0.5) 면 다른 결론 가능.

4.10 왜 이 예제가 “고전” 인가

§ 9.3 예제 (Cooper 1984 에서 인용) 는 의료 결정 분석의 표준 사례. 가르치는 교훈:

검사 주문 전에 “이 결과로 무엇이 바뀔까” 를 먼저 물어라.

바꾸지 않으면 검사의 비용·위험만 남는다. 과잉 진단의 수학적 뿌리가 이 VoI 분석에 있다.

현실의 의료 실무: 많은 검사가 “혹시 모르니까” 논리로 주문되는데, 베이즈 결정 분석은 “혹시” 의 확률이 작으면 검사 비용을 정당화 못 한다는 것을 정량화.

5 세 절을 관통하는 직관 모음

5.1 추론과 최적화의 분리

§ 9.1 의 네 단계는 “추론 (Step 2) + 최적화 (Step 4)” 의 합성. 베이즈가 담당하는 부분과 OR 이 담당하는 부분이 명확히 분리.

단계 책임 영역 도구
Step 1 문제 정의 분석자 창의성
Step 2 사후 예측 MCMC / PyMC
Step 3 효용 설계 도메인 지식 + 윤리
Step 4 최적화 scipy / 역방향 귀납

§ 9.2 는 Step 1·2 에 집중, Step 3·4 는 결정자에게 위임 (“반쪽 분석”). § 9.3 은 네 단계 모두 명시.

5.2 “유의성” 과 “결정” 의 완전 분리

§ 9.2 의 가장 중요한 교훈. 빈도주의 검정이 결정에 부적합한 이유:

  • 유의성 임계값 (0.05) 은 자의적, 결정과 무관.
  • 0 으로 설정 은 “효과 없음” 을 가정 — 비용은 그대로인데 수치만 0.
  • 사후 평균 사용이 정직 — 효과가 있든 없든, 그 불확실성을 결정에 반영.

§ 9.2 의 Form (cash/gift) 이 통계적으로 유의하지 않아도, cash 가 약간이라도 나으면 “비용이 같으니 cash 선택”. 유의성 검정은 이 결정을 막는다.

5.3 Bayes Rule 이 결정 트리 안에 들어간다

§ 9.3 의 수학적 구조. 다단계 트리에서 각 관측 노드 후:

\[ p(\theta \mid y_{\mathrm{new}}) = \frac{p(y_{\mathrm{new}} \mid \theta) p(\theta \mid y_{\mathrm{old}})}{p(y_{\mathrm{new}} \mid y_{\mathrm{old}})} \]

사전 갱신이 결정 노드 사이에 삽입. 역방향 귀납이 이를 통합.

베이즈 추론이 “고정된 사후 계산” 이 아니라 “관측이 들어올 때마다 갱신되는 동적 과정” 으로 확장된다. § 9.3 bronchoscopy 의 계산 엔진.

6 코드 — Bronchoscopy 결정 트리 완전 구현

6.1 트리 클래스 설계

from dataclasses import dataclass
from typing import Callable

@dataclass
class TreeNode:
    """결정 트리 노드."""
    node_type: str  # "decision", "chance", "leaf"
    name: str
    children: list = None
    probabilities: list = None  # chance 노드만
    utility: float = None        # leaf 만

def evaluate(node: TreeNode) -> tuple[float, str]:
    """역방향 귀납으로 트리 평가. (기대 효용, 최적 경로)."""
    if node.node_type == "leaf":
        return node.utility, node.name

    if node.node_type == "chance":
        total = 0.0
        paths = []
        for p, child in zip(node.probabilities, node.children):
            value, path = evaluate(child)
            total += p * value
            paths.append(f"{p:.3f}:{path}")
        return total, f"{node.name}[{','.join(paths)}]"

    if node.node_type == "decision":
        best_value = -float("inf")
        best_path = None
        for child in node.children:
            value, path = evaluate(child)
            if value > best_value:
                best_value = value
                best_path = f"{node.name}->{child.name}:{path}"
        return best_value, best_path

6.2 Bronchoscopy 문제 입력

# 파라미터
p_cancer = 0.9
life_nocancer = 34.8
life_radio_c = 16.7
life_surg_c = 20.3
life_none_c = 5.6
discomfort = 1
surg_mortality = 0.35
sens = 0.70
spec = 0.98
test_mortality = 0.05

def treatment_qaly(p_c, trt):
    if trt == "radio":
        return p_c * life_radio_c + (1 - p_c) * life_nocancer - discomfort
    elif trt == "surgery":
        return (1 - surg_mortality) * (p_c * life_surg_c + (1 - p_c) * life_nocancer - discomfort)
    elif trt == "none":
        return p_c * life_none_c + (1 - p_c) * life_nocancer

# 단일 결정점 — 검사 없이
print("=== 검사 없이 ===")
for trt in ["radio", "surgery", "none"]:
    q = treatment_qaly(p_cancer, trt)
    print(f"  {trt}: {q:.2f}")
best_no_test = max(treatment_qaly(p_cancer, t) for t in ["radio", "surgery", "none"])
print(f"  최적: {best_no_test:.2f}")

6.3 Bayes Rule 갱신 + 조건부 최적

p_pos = p_cancer * sens + (1 - p_cancer) * (1 - spec)
p_neg = 1 - p_pos
p_c_pos = p_cancer * sens / p_pos
p_c_neg = p_cancer * (1 - sens) / p_neg

print(f"\n=== Bayes 갱신 ===")
print(f"P(T=+) = {p_pos:.3f}, P(C|T=+) = {p_c_pos:.3f}")
print(f"P(T=-) = {p_neg:.3f}, P(C|T=-) = {p_c_neg:.3f}")

print("\n=== 양성 후 ===")
q_pos = {trt: treatment_qaly(p_c_pos, trt) for trt in ["radio", "surgery", "none"]}
for trt, q in q_pos.items():
    print(f"  {trt}: {q:.2f}")
best_pos = max(q_pos.values())
print(f"  최적: {best_pos:.2f}")

print("\n=== 음성 후 ===")
q_neg = {trt: treatment_qaly(p_c_neg, trt) for trt in ["radio", "surgery", "none"]}
for trt, q in q_neg.items():
    print(f"  {trt}: {q:.2f}")
best_neg = max(q_neg.values())
print(f"  최적: {best_neg:.2f}")

6.4 전체 검사 옵션 기대 QALY

q_bronch = (1 - test_mortality) * (p_pos * best_pos + p_neg * best_neg)
print(f"\n=== Bronchoscopy 기대 QALY ===")
print(f"  {q_bronch:.2f}")

print(f"\n=== 비교 ===")
print(f"  검사 없이 (radio): {best_no_test:.2f}")
print(f"  Bronchoscopy:     {q_bronch:.2f}")
print(f"  VoI:              {q_bronch - best_no_test:+.2f}  <- 음수면 검사 금지")

6.5 EVPI 계산

# 완벽 정보: 악성 여부 확실 시 최적 치료
q_given_cancer = max(
    1.0 * life_radio_c + 0.0 * life_nocancer - discomfort,
    (1 - surg_mortality) * (1.0 * life_surg_c + 0.0 * life_nocancer - discomfort),
    1.0 * life_none_c + 0.0 * life_nocancer,
)
q_given_benign = max(
    1.0 * life_nocancer - discomfort,  # radio
    (1 - surg_mortality) * (life_nocancer - discomfort),  # surgery
    1.0 * life_nocancer,  # none <- 최적
)
q_perfect = p_cancer * q_given_cancer + (1 - p_cancer) * q_given_benign

evpi = q_perfect - best_no_test
print(f"\n=== EVPI ===")
print(f"  완벽 정보: {q_perfect:.2f}")
print(f"  최적 무검사: {best_no_test:.2f}")
print(f"  EVPI: {evpi:.2f}  <- 검사 비용 상한")

6.6 민감도 분석 — 사전 확률 변동

import numpy as np

priors = np.linspace(0.3, 0.99, 20)
voi_values = []
for p in priors:
    no_test = max(treatment_qaly(p, t) for t in ["radio", "surgery", "none"])
    pp = p * sens + (1 - p) * (1 - spec)
    pn = 1 - pp
    pc_p = p * sens / pp
    pc_n = p * (1 - sens) / pn
    bp = max(treatment_qaly(pc_p, t) for t in ["radio", "surgery", "none"])
    bn = max(treatment_qaly(pc_n, t) for t in ["radio", "surgery", "none"])
    bronch = (1 - test_mortality) * (pp * bp + pn * bn)
    voi_values.append(bronch - no_test)

print("\n=== 사전 확률별 VoI ===")
print("사전 | VoI (개월) | 검사 권장?")
for p, voi in zip(priors[::3], voi_values[::3]):
    recommend = "O" if voi > 0 else "X"
    print(f" {p:.2f} | {voi:+.3f}    | {recommend}")

결과: 특정 사전 확률 범위 (대략 0.4~0.7) 에서만 검사가 유용. 0.9 같은 강한 사전에선 무효.

7 실전 체크리스트

§ 9.1~9.3 의 교훈을 실무 절차로:

  1. 네 단계 명시 실행 — 결정·확률·효용·최적화를 암묵 가정 없이.
  2. 결정 \(d\) 에 확률 안 줌 — 자유 변수로 취급, 모든 확률은 \(d\) 조건부.
  3. VNM 합리성 점검 — 위반이 의심되면 Dutch book 시나리오 구성.
  4. 계층 모형 부활용\(\sigma\) (조사 내) vs \(\tau\) (조사 간) 분산 분해로 예측 불확실성의 원천 식별.
  5. “유의하지 않음” ≠ “0” — 모든 추정 계수를 사후 그대로 결정에 입력.
  6. 비용의 2 차 효과 포함 — § 9.2 의 접촉 효율처럼 간접 비용·절약 계산.
  7. Bayes rule 을 결정 트리에 삽입 — 관측 후 사후 갱신 → 조건부 최적 결정.
  8. EVPI 먼저 계산 — 완벽 정보가 저렴하면 실제 검사는 무효.
  9. 민감도 분석 — 사전·효용 환율·검사 정확도에 대한 결정 안정성 점검.
  10. 의사소통 가능 파라미터화 — 로짓보다 선형, 로그 비용보다 달러 (해석 가능 구간에서).

8 관련 주제

선행 지식

Ch.9 세부 절 (후속 작성 예정)

  • 01-9-2-* — § 9.4 home radon 완전 통합 심화
  • 01-9-3-* — § 9.5~9.7 personal vs institutional, 문헌, 연습문제 심화

후속 주제

  • Ch.10 Introduction to Bayesian Computation — 다단계 트리의 수치 계산
  • Ch.15 Hierarchical Linear Models — § 9.2 계층 구조의 상세
  • Ch.18 Missing Data — 관찰 결정과 결측 메커니즘의 통합

관련 개념

  • von Neumann & Morgenstern (1944), Theory of Games and Economic Behavior — VNM 효용 이론의 원저
  • Savage (1954), The Foundations of Statistics — 주관적 기대 효용의 공리화
  • Raiffa & Schlaifer (1961), Applied Statistical Decision Theory — 결정 트리와 VoI 의 원전
  • Weinstein et al. (1980) — QALY 기반 의료 결정 분석
  • Cooper (1984) — bronchoscopy 결정 문제의 원 사례
  • Felli & Hazen (1998, 2003) — EVPI/EVPPI 의 확률적 민감도 분석 확장
  • Claxton et al. (2001) — 의료 기술 평가에서의 VoI 적용
  • Groves et al. (2009), Survey Methodology — 설문 인센티브 효과의 현대 리뷰

Subscribe

Enjoy this blog? Get notified of new posts by email: