Kwangmin Kim - 구간추정량 탐색 방법 (Methods of Finding Interval Estimators)

1 개요

구간추정량을 찾는 방법은 크게 네 가지로 분류된다.

방법	핵심 아이디어	적용 조건
검정의 역전 (9.2.1)	수용역 \(A(\theta_0)\)를 \(\theta_0\)에 대해 역전	검정 구성 가능 시 항상 적용
피벗 양 (9.2.2)	분포가 \(\theta\)에 무관한 함수 \(Q(X,\theta)\) 이용	위치·척도 문제에서 자연스럽게 존재
CDF 피벗팅 (9.2.3)	CDF 자체를 피벗으로 활용	\(F_T(t\|\theta)\)가 \(\theta\)에 단조일 때
베이즈 구간 (9.2.4)	사후분포 \(\pi(\theta\|x)\)에서 직접 구성	사전분포 지정 가능 시

Casella & Berger(2002, Ch.9)는 다음을 강조한다: “베이즈 구간을 제외하면, 세 가지 방법은 본질적으로 모두 검정통계량의 역전(inverting a test statistic)이라는 동일한 전략에 기반한다.”

이 포스트에서는 각 방법을 정의 → 이론 → 예시 순서로 상세히 전개한다.

2 방법 1: 검정의 역전 (Inverting a Test Statistic)

2.1 핵심 대응 관계

가설검정과 구간추정은 동일한 데이터에 대해 다른 질문을 던진다.

검정: 모수 \(\theta_0\) 를 고정하고, “이 표본이 \(\theta_0\) 와 일치하는가?” 를 묻는다
구간추정: 표본을 고정하고, “어떤 \(\theta_0\) 값이 이 표본과 일치하는가?” 를 묻는다

이 질문들이 수학적으로 동치임을 다음 정리가 보인다.

정리 9.2.2 (검정과 신뢰집합의 대응)

각 \(\theta_0 \in \Theta\) 에 대해, \(H_0: \theta = \theta_0\) 의 수준(level) \(\alpha\) 검정의 수용역을 \(A(\theta_0)\) 라 하면, 각 \(x \in \mathcal{X}\) 에 대해 정의한

\[C(x) = \{\theta_0 : x \in A(\theta_0)\}\]

는 \(1 - \alpha\) 신뢰집합이다. 역으로, \(C(X)\) 가 \(1 - \alpha\) 신뢰집합이면,

\[A(\theta_0) = \{x : \theta_0 \in C(x)\}\]

는 \(H_0: \theta = \theta_0\) 의 수준 \(\alpha\) 검정의 수용역이다.

증명 (전방향):

\(A(\theta_0)\) 가 수준 \(\alpha\) 검정의 수용역이므로, \(P_{\theta_0}(X \in A(\theta_0)) \geq 1 - \alpha\) 이다. 임의의 \(\theta\) 에 대해

\[P_\theta(\theta \in C(X)) = P_\theta(X \in A(\theta)) \geq 1 - \alpha\]

마지막 등호는 \(C(x) = \{\theta_0 : x \in A(\theta_0)\}\) 의 정의에서 \(\theta \in C(X) \Leftrightarrow X \in A(\theta)\) 이기 때문이다. 따라서 \(C(X)\) 의 피복확률이 모든 \(\theta\) 에서 \(1 - \alpha\) 이상이므로 신뢰계수 \(\geq 1 - \alpha\) 다. \(\square\)

역방향:

\(C(X)\) 가 \(1 - \alpha\) 신뢰집합이면, \(P_{\theta_0}(\theta_0 \in C(X)) \geq 1 - \alpha\), 즉

\[P_{\theta_0}(X \in A(\theta_0)) = P_{\theta_0}(\theta_0 \in C(X)) \geq 1 - \alpha\]

그러므로 \(A(\theta_0)\) 는 수준 \(\alpha\) 검정의 수용역이다. \(\square\)

정리가 실용적인 이유: 수용역은 구성하기 쉽고(기각역의 여집합), 신뢰집합은 구성하기 어렵다. 정리 9.2.2는 전자를 후자로 자동 변환한다. 우도비 검정, UMP 검정 등 모든 검정 기법이 신뢰집합 구성에 즉시 사용된다.

2.2 예시 1: 정규분포 양측 신뢰구간 (알려진 분산)

\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} N(\mu, \sigma^2)\), \(\sigma^2\) 알려짐. \(H_0: \mu = \mu_0\) vs \(H_1: \mu \neq \mu_0\) 에 대한 크기 \(\alpha\) 검정의 수용역은

\[A(\mu_0) = \left\{x : \left|\bar{x} - \mu_0\right| \leq z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right\}\]

정리 9.2.2를 적용하면,

\[C(x) = \left\{\mu_0 : x \in A(\mu_0)\right\} = \left\{\mu_0 : \left|\bar{x} - \mu_0\right| \leq z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right\}\]

이를 \(\mu_0\) 에 대해 풀면

\[C(x) = \left[\bar{x} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}},\; \bar{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right]\]

이것이 고전적인 \(z\)-신뢰구간이다. 피복확률은 정확히 \(1 - \alpha\) 로 상수다.

2.3 예시 2: 정규분포 단측 신뢰구간 (미지 분산)

\(\sigma^2\) 미지일 때, \(H_0: \mu = \mu_0\) vs \(H_1: \mu < \mu_0\) 에 대한 수준 \(\alpha\) 검정의 수용역(t-검정 기반)은

\[A(\mu_0) = \left\{x : \bar{x} \geq \mu_0 - t_{n-1,\alpha}\frac{s}{\sqrt{n}}\right\}\]

역전하면 \(x \in A(\mu_0) \Leftrightarrow \bar{x} + t_{n-1,\alpha}\frac{s}{\sqrt{n}} \geq \mu_0\), 즉

\[C(x) = \left(-\infty,\; \bar{x} + t_{n-1,\alpha}\frac{s}{\sqrt{n}}\right]\]

단측 검정을 역전하면 단측 신뢰구간이 나온다는 것을 보여주는 예시다.

2.4 예시 3: 우도비 검정 역전 — 지수분포 평균

\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Exp}(\lambda)\). \(H_0: \lambda = \lambda_0\) vs \(H_1: \lambda \neq \lambda_0\) 에 대한 LRT 통계량에서 수용역은

\[A(\lambda_0) = \left\{x : \left(\frac{\sum x_i}{\lambda_0}\right)^n e^{-\sum x_i/\lambda_0} \geq k^*\right\}\]

여기서 \(k^*\) 는 \(P_{\lambda_0}(X \in A(\lambda_0)) = 1 - \alpha\) 를 만족하도록 결정된다. 역전하면

\[C(x) = \left\{\lambda : \left(\frac{\sum x_i}{\lambda}\right)^n e^{-\sum x_i/\lambda} \geq k^*\right\}\]

이를 \(L(\sum x_i) \leq \lambda \leq U(\sum x_i)\) 형태로 표현하면, \(L\)과 \(U\)는 다음 연립 방정식으로 결정된다:

\[\left(\frac{\sum x_i}{L}\right)^n e^{-\sum x_i/L} = \left(\frac{\sum x_i}{U}\right)^n e^{-\sum x_i/U}\]

\(a = \sum x_i / L\), \(b = \sum x_i / U\) 로 놓으면 \(a^n e^{-a} = b^n e^{-b}\) 가 수치적으로 풀린다. \(n=2\) 일 때 90% 신뢰구간은 \(a \approx 5.480\), \(b \approx 0.441\) 로

\[\left[\frac{\sum x_i}{5.480},\; \frac{\sum x_i}{0.441}\right]\]

2.5 예시 4: 이항 분포 단측 신뢰구간

\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Bernoulli}(p)\), \(T = \sum X_i \sim \text{Bin}(n, p)\). 아래에서 구성하는 것은 \(p\) 의 \(1-\alpha\) 하측 신뢰구간 \((L(T), 1]\) 이다.

\(H_0: p = p_0\) vs \(H_1: p > p_0\) 에 대한 UMP 검정(이항 분포의 단조 우도비 성질로 존재)의 수용역을 역전한다. 이항 분포의 CDF \(f(p_0|k) = \sum_{y=0}^k \binom{n}{y}p_0^y(1-p_0)^{n-y}\) 는 \(p_0\) 에 대해 감소함수이므로, 수용역은

\[A(p_0) = \{t : t \leq k(p_0)\}, \quad k(p_0) \text{ s.t. } \sum_{y=0}^{k(p_0)}\binom{n}{y}p_0^y(1-p_0)^{n-y} \geq 1-\alpha\]

역전하면 \(C(t) = \{p_0 : t \leq k(p_0)\} = \{p_0 : p_0 > k^{-1}(t)\}\) 이므로

\[C(T) = (k^{-1}(T), 1], \quad k^{-1}(t) = \sup\left\{p : \sum_{y=0}^{t-1}\binom{n}{y}p^y(1-p)^{n-y} \geq 1-\alpha\right\}\]

이산 분포이므로 정확한 \(1-\alpha\) 크기를 달성할 수 없고, 최소 \(1-\alpha\) 를 보장하는 보수적(conservative) 구간이 얻어진다.

3 방법 2: 피벗 양 (Pivotal Quantities)

3.1 정의와 직관

정의 9.2.6: 피벗 (Pivotal Quantity)

확률변수 \(Q(X,\theta) = Q(X_1, \ldots, X_n, \theta)\) 의 분포가 모든 \(\theta\) 에서 동일하면, 즉 \(X \sim F(x|\theta)\) 일 때 \(Q(X,\theta)\) 의 분포가 \(\theta\) 에 무관하면, \(Q\) 를 피벗(pivot) 이라 한다.

왜 피벗이 유용한가? 피벗의 분포는 \(\theta\) 에 무관하므로, 분위수 \(a, b\) 를 \(\theta\) 와 무관하게 결정할 수 있다. 피벗에 대한 확률 부등식

\[P_\theta(a \leq Q(X,\theta) \leq b) \geq 1 - \alpha\]

를 \(\theta\) 에 대해 역전하면 신뢰집합을 얻는다. 이 역전이 가능하려면 \(Q(x, \theta)\) 가 \(\theta\) 에 대해 단조여야 한다.

피벗 구성 원리:

위치 문제(location): 차(difference)가 피벗 — pdf \(f(x|\mu) = f_0(x - \mu)\) 이면 \(Q = \bar{X} - \mu\) 가 \(\mu\) 에 무관
척도 문제(scale): 비(ratio)가 피벗 — pdf \(f(x|\sigma) = \sigma^{-1}f_0(x/\sigma)\) 이면 \(Q = \bar{X}/\sigma\) 가 \(\sigma\) 에 무관
위치-척도 문제: \(Q = (\bar{X} - \mu)/S\) 형태 (스튜던트 \(t\) 통계량이 대표적 예)

일반 공식: 통계량 \(T\) 의 pdf가

\[f(t|\theta) = g(Q(t,\theta))\left|\frac{\partial}{\partial t}Q(t,\theta)\right|\]

형태로 분해되고 \(Q\) 가 \(t\) 에 대해 단조이면, \(Q(T,\theta)\) 는 피벗이다 (Thm 2.1.5 적용).

3.2 피벗을 이용한 신뢰구간 구성 절차

피벗 \(Q(X,\theta)\) 를 구성한다
\(P(a \leq Q(X,\theta) \leq b) \geq 1-\alpha\) 를 만족하는 \(a, b\) 를 결정한다
수용역 \(A(\theta_0) = \{x : a \leq Q(x,\theta_0) \leq b\}\) 를 \(\theta_0\) 에 대해 역전하여 \(C(x)\) 를 구한다

\(Q(x,\theta)\) 가 \(\theta\) 에 대해 단조 감소이면, \(C(x) = [L(x,b),\, U(x,a)]\) 형태이고 단조 증가이면, \(C(x) = [L(x,a),\, U(x,b)]\) 형태이다.

3.3 예시 5: 위치-척도 피벗 모음

\(X_1, \ldots, X_n\) 의 형태에 따른 피벗을 정리한다.

pdf 형태	분포 유형	피벗	피벗의 분포
\(f_0(x - \mu)\)	위치(Location)	\(\bar{X} - \mu\)	\(\mu\) 무관
\(\frac{1}{\sigma}f_0\!\left(\frac{x}{\sigma}\right)\)	척도(Scale)	\(\bar{X}/\sigma\)	\(\sigma\) 무관
\(\frac{1}{\sigma}f_0\!\left(\frac{x-\mu}{\sigma}\right)\)	위치-척도	\(\frac{\bar{X}-\mu}{S}\)	\((\mu,\sigma)\) 무관

특히 \(X_i \overset{\text{iid}}{\sim} N(\mu,\sigma^2)\) 이면 \(\frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t_{n-1}\) 은 \((\mu,\sigma^2)\) 모두에 무관한 피벗이다.

3.4 예시 6: 지수 분포 감마 피벗

\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Exp}(\lambda)\). \(T = \sum X_i \sim \text{Gamma}(n, \lambda)\) 이고, 감마 pdf에서 \(t\) 와 \(\lambda\) 는 항상 \(t/\lambda\) 형태로 등장한다(척도족). 따라서

\[Q(T,\lambda) = \frac{2T}{\lambda} \sim \text{Gamma}(n, 2) = \chi^2_{2n}\]

이 피벗의 분포는 \(\lambda\) 에 무관하다. \(P(a \leq \chi^2_{2n} \leq b) = 1-\alpha\) 를 만족하는 분위수 \(a = \chi^2_{2n,1-\alpha/2}\), \(b = \chi^2_{2n,\alpha/2}\) 를 이용하면

\[P_\lambda\!\left(a \leq \frac{2T}{\lambda} \leq b\right) = 1-\alpha\]

이를 \(\lambda\) 에 대해 역전하면 (\(Q\) 는 \(\lambda\) 에 대해 단조 감소)

\[\frac{2T}{b} \leq \lambda \leq \frac{2T}{a}\]

\(n=10\), \(\alpha=0.05\) 일 때 \(a = \chi^2_{20,0.975}=9.591\), \(b = \chi^2_{20,0.025}=34.170\) 이므로

\[\left[\frac{2T}{34.170},\; \frac{2T}{9.591}\right]\]

3.5 예시 7: 정규 분포 분산 피벗

\(X_i \overset{\text{iid}}{\sim} N(\mu,\sigma^2)\), \(\mu\) 미지. 충분통계량 \(S^2 = \frac{1}{n-1}\sum(X_i-\bar{X})^2\) 에 대해

\[Q(S^2, \sigma^2) = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2_{n-1}\]

이 \(\sigma^2\) 에 무관한 피벗이다. \(P(a \leq \chi^2_{n-1} \leq b) = 1-\alpha\) 에서 \(a = \chi^2_{n-1,1-\alpha/2}\), \(b = \chi^2_{n-1,\alpha/2}\) 로 놓으면

\[\left[\frac{(n-1)s^2}{b},\; \frac{(n-1)s^2}{a}\right] = \left[\frac{(n-1)s^2}{\chi^2_{n-1,\alpha/2}},\; \frac{(n-1)s^2}{\chi^2_{n-1,1-\alpha/2}}\right]\]

주의: \(\chi^2\) 분포는 비대칭이므로, \(\alpha/2\) 씩 양 꼬리에 배분하는 등분할 절단점이 최단 구간을 주지 않는다. 최단 구간을 원하면 절단점을 수치 최적화로 구해야 한다(9.3 참조).

4 방법 3: CDF 피벗팅 (Pivoting the CDF)

4.1 동기 — 피벗이 없을 때

피벗 방법은 위치·척도 구조가 있을 때 자연스럽게 적용된다. 그러나 일반적인 분포에서는 피벗을 찾기 어렵다. CDF 피벗팅은 이런 경우에도 사용할 수 있는 완전히 일반적인 방법이다.

핵심 아이디어: 확률적분변환(PIT)에 의해, 연속 확률변수 \(T\) 에 대해 \(F_T(T|\theta) \sim \text{Uniform}(0,1)\) 이 모든 \(\theta\) 에서 성립한다 — 즉 \(F_T(T|\theta)\) 는 피벗이다.

4.2 연속 분포의 경우

정리 9.2.12: 연속 CDF 피벗팅

통계량 \(T\) 의 연속 CDF가 \(F_T(t|\theta)\) 이고, \(\alpha_1 + \alpha_2 = \alpha\) 로 고정. \(F_T(t|\theta)\) 가 각 \(t\) 에 대해 \(\theta\) 의 감소함수이면,

\[F_T(t|\theta_U(t)) = \alpha_1, \quad F_T(t|\theta_L(t)) = 1 - \alpha_2\]

를 만족하는 \(\theta_L(t)\), \(\theta_U(t)\) 로 구성된 구간 \([\theta_L(T), \theta_U(T)]\) 는 \(1-\alpha\) 신뢰구간이다.

\(F_T(t|\theta)\) 가 \(\theta\) 의 증가함수이면, 조건이 반전된다:

\[F_T(t|\theta_U(t)) = 1-\alpha_2, \quad F_T(t|\theta_L(t)) = \alpha_1\]

증명 스케치 (감소함수 경우):

\(F_T(t|\theta)\) 가 \(\theta\) 에 대해 감소함수이면,

\[F_T(t|\theta) < \alpha_1 \Leftrightarrow \theta > \theta_U(t)\] \[F_T(t|\theta) > 1-\alpha_2 \Leftrightarrow \theta < \theta_L(t)\]

따라서

\[\alpha_1 \leq F_T(t|\theta) \leq 1-\alpha_2 \Leftrightarrow \theta_L(t) \leq \theta \leq \theta_U(t)\]

수용역 \(\{t : \alpha_1 \leq F_T(t|\theta_0) \leq 1-\alpha_2\}\) 는 PIT에 의해 피복확률이 \(\geq 1-\alpha\) 이므로, 정리 9.2.2를 적용하면 역전된 집합 \([\theta_L(T), \theta_U(T)]\) 는 \(1-\alpha\) 신뢰구간이다. \(\square\)

실용적 계산법: 관측값 \(T = t_0\) 가 주어졌을 때 실현된 구간은

\[\int_{-\infty}^{t_0} f_T(u|\theta_U(t_0))\,du = \alpha_1, \quad \int_{t_0}^{\infty} f_T(u|\theta_L(t_0))\,du = \alpha_2\]

이 두 방정식을 \(\theta_L(t_0)\), \(\theta_U(t_0)\) 에 대해 수치적으로 풀면 된다.

\(\alpha_1, \alpha_2\) 선택: 일반적으로 \(\alpha_1 = \alpha_2 = \alpha/2\) (등분할)를 사용하지만, 이것이 최단 구간을 보장하지는 않는다. 단측 구간은 \(\alpha_1 = 0\) 또는 \(\alpha_2 = 0\) 으로 얻는다.

4.3 예시 8: 위치 지수 분포 신뢰구간

\(X_i \overset{\text{iid}}{\sim} \text{Exp}(1)\) 을 위치 \(\mu\) 만큼 이동시킨 pdf \(f(x|\mu) = e^{-(x-\mu)}I_{[\mu,\infty)}(x)\). 충분통계량 \(Y = \min\{X_1, \ldots, X_n\}\) 의 pdf는

\[f_Y(y|\mu) = n e^{-n(y-\mu)} I_{[\mu,\infty)}(y)\]

\(F_Y(y|\mu) = 1 - e^{-n(y-\mu)}\) 는 \(\mu\) 에 대해 단조 증가함수이므로, \(\alpha_1 = \alpha_2 = \alpha/2\) 로

\[\int_{\mu_U(y)}^{y} n e^{-n(u-\mu_U)}\,du = \frac{\alpha}{2}, \quad \int_{y}^{\infty} n e^{-n(u-\mu_L)}\,du = \frac{\alpha}{2}\]

이를 풀면

\[1 - e^{-n(y-\mu_U)} = \frac{\alpha}{2} \Rightarrow \mu_U(y) = y + \frac{1}{n}\log\!\left(1 - \frac{\alpha}{2}\right)\]

\[e^{-n(y-\mu_L)} = \frac{\alpha}{2} \Rightarrow \mu_L(y) = y + \frac{1}{n}\log\!\left(\frac{\alpha}{2}\right)\]

따라서 \(1-\alpha\) 신뢰구간은

\[C(Y) = \left[Y + \frac{\log(\alpha/2)}{n},\; Y + \frac{\log(1-\alpha/2)}{n}\right]\]

\(\log(x) < 0\) (for \(x < 1\))이므로 양 끝점 모두 \(Y\) 보다 작다 — \(Y = \min\{X_i\}\) 가 \(\mu\) 의 상한이기 때문에 직관과 일치한다.

4.4 이산 분포의 경우

이산 분포에서는 PIT의 등분포성이 정확히 성립하지 않아 별도 정리가 필요하다.

정리 9.2.14: 이산 CDF 피벗팅

이산 통계량 \(T\) 의 CDF \(F_T(t|\theta)\) 가 각 \(t\) 에 대해 \(\theta\) 의 감소함수일 때, \(\alpha_1 + \alpha_2 = \alpha\) 에 대해

\[P(T \leq t|\theta_U(t)) = \alpha_1, \quad P(T \geq t|\theta_L(t)) = \alpha_2\]

를 만족하는 \(\theta_L(T)\), \(\theta_U(T)\) 로 구성된 \([\theta_L(T), \theta_U(T)]\) 는 \(1-\alpha\) 신뢰구간이다.

(\(F_T\) 가 증가함수이면 부등호 방향 반전.)

이산 분포에서는 CDF가 불연속이므로 정확한 피복확률 \(1-\alpha\) 를 달성할 수 없고, 최소 \(1-\alpha\) 를 보장하는 보수적(conservative) 구간이 얻어진다.

4.5 예시 9: 포아송 신뢰구간

\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Poisson}(\lambda)\). \(Y = \sum X_i \sim \text{Poisson}(n\lambda)\) 는 충분통계량이다.

\(F_Y(y|n\lambda)\) 는 \(\lambda\) 에 대해 단조 감소이므로, \(y_0 = Y = y_0\) 관측 시

\[P(Y \leq y_0|\lambda_U) = \frac{\alpha}{2}, \quad P(Y \geq y_0|\lambda_L) = \frac{\alpha}{2}\]

포아송-감마 항등식 (Ex. 3.3.1)을 이용하면:

\[\frac{\alpha}{2} = P(Y \leq y_0|\lambda) = P\!\left(\chi^2_{2(y_0+1)} > 2n\lambda\right)\]

\[\frac{\alpha}{2} = P(Y \geq y_0|\lambda) = P\!\left(\chi^2_{2y_0} < 2n\lambda\right)\]

따라서

\[\lambda_U = \frac{\chi^2_{2(y_0+1),\alpha/2}}{2n}, \quad \lambda_L = \frac{\chi^2_{2y_0,1-\alpha/2}}{2n}\]

\(1-\alpha\) 신뢰구간 (Garwood, 1936):

\[\left[\frac{\chi^2_{2y_0,1-\alpha/2}}{2n},\; \frac{\chi^2_{2(y_0+1),\alpha/2}}{2n}\right]\]

수치 예시: \(n=10\), \(y_0 = 6\), \(\alpha=0.10\) 이면

\[\left[\frac{\chi^2_{12,0.95}}{20},\; \frac{\chi^2_{14,0.05}}{20}\right] = \left[\frac{5.226}{20},\; \frac{23.685}{20}\right] = [0.261,\; 1.184]\]

so what: 포아송 신뢰구간의 피복확률 곡선은 들쑥날쑥하다 — 이산 분포에서 CDF의 불연속성 때문에, 구간 경계에서 피복확률이 점프한다. 그러나 어떤 \(\lambda\) 에서도 \(1-\alpha\) 이상임은 보장된다.

5 방법 4: 베이즈 구간 (Bayesian Intervals)

5.1 사후분포 기반 신용집합

빈도주의 신뢰구간은 모수를 고정된 미지 상수로 보지만, 베이즈 방법은 모수 자체를 확률변수로 보고 사후분포에서 구간을 구성한다.

정의: 신용집합 (Credible Set)

사후분포 \(\pi(\theta|x)\) 와 임의의 집합 \(A \subset \Theta\) 에 대해,

\[P(\theta \in A|x) = \int_A \pi(\theta|x)\,d\theta \geq 1-\alpha\]

를 만족하면 \(A\) 를 \(1-\alpha\) 신용집합(credible set) 이라 한다. 이산 경우 적분을 합산으로 교체한다.

신뢰구간 vs. 신용집합 해석의 차이

	빈도주의 신뢰구간	베이즈 신용집합
모수	고정된 미지 상수	확률변수
확률의 대상	구간 \([L(X), U(X)]\) (랜덤)	모수 \(\theta\) (사후분포 상에서)
90% 의미	반복 시 90%의 구간이 \(\theta\) 포함	사후 믿음의 90%가 \(\theta \in A\)
추가 입력	없음	사전분포 \(\pi(\theta)\)

5.2 HPD 영역 (Highest Posterior Density Region)

신용집합 중 가장 좁은 것은 사후 밀도가 높은 값들로 구성된다.

정의: HPD 영역 (Highest Posterior Density Region)

\[C^* = \{\theta : \pi(\theta|x) \geq k\}\]

여기서 \(k\) 는 \(P(\theta \in C^*|x) = 1-\alpha\) 를 만족하도록 결정한다. HPD 영역은 주어진 신용 수준에서 기대 길이가 최소인 신용집합이다.

단봉 사후분포(unimodal)에서 HPD 영역은 구간이 된다. 다봉 분포에서는 불연속 집합이 될 수 있다.

5.3 예시 10: 포아송-감마 공액 쌍

\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Poisson}(\lambda)\), 사전분포 \(\lambda \sim \text{Gamma}(a, b)\). 사후분포는

\[\pi\!\left(\lambda \middle| \sum X = \sum x\right) = \text{Gamma}\!\left(a + \sum x,\; \frac{b}{nb+1}\right)\]

\(a\) 가 정수이면 \(\frac{2(nb+1)}{b}\lambda \sim \chi^2_{2(a+\sum x)}\) 이고, 등분할 \(1-\alpha\) 신용구간은

\[\left[\frac{b\,\chi^2_{2(a+\sum x),1-\alpha/2}}{2(nb+1)},\; \frac{b\,\chi^2_{2(a+\sum x),\alpha/2}}{2(nb+1)}\right]\]

\(a=b=1\), \(n=10\), \(\sum x = 6\) 일 때 90% 신용구간:

\[\left[\frac{\chi^2_{14,0.95}}{22},\; \frac{\chi^2_{14,0.05}}{22}\right] = \left[\frac{6.571}{22},\; \frac{23.685}{22}\right] = [0.299,\; 1.077]\]

빈도주의 구간 \([0.261, 1.184]\) 보다 짧다 — 사전분포 Gamma(1,1)이 \(\lambda\) 가 작을 쪽으로 정보를 제공하기 때문이다.

5.4 신뢰구간과 신용집합의 상호 평가

빈도주의 구간과 베이즈 신용집합은 서로의 기준에서 좋지 않을 수 있다.

빈도주의 구간의 신용확률: 포아송 예시에서 90% 신뢰구간의 베이즈 신용확률은 \(\sum x_i \to \infty\) 에 따라 0으로 수렴한다 (사전 분포 설정에 따라 다름). 즉, 데이터가 많아질수록 사전분포로부터 멀어진다.

베이즈 구간의 피복확률: \(X_i \overset{\text{iid}}{\sim} N(\theta, \sigma^2)\), 사전 \(\theta \sim N(\mu, \tau^2)\) 의 경우, \(\sigma/\sqrt{n} \to 0\) 이면서 \(\theta \neq \mu\) 이면 베이즈 신용구간의 피복확률이 0으로 수렴한다. 데이터가 풍부할수록 사전분포가 지배하게 되어 참값과 멀어지기 때문이다.

결론: 두 방법은 서로 다른 목적을 위해 설계되었다. 빈도주의 신뢰구간은 반복 실험의 장기적 오류율을 제어하고, 베이즈 신용집합은 사후 믿음을 표현한다. 사전 정보가 신뢰할 수 있으면 베이즈 구간이 더 짧고 직관적이지만, 잘못된 사전분포는 오해를 유발한다.

6 네 가지 방법 비교

기준	검정 역전	피벗	CDF 피벗팅	베이즈 구간
적용 범위	가장 광범위	위치·척도 문제	연속·이산 CDF 단조 시	사전분포 필요
구성 용이성	검정 구성 후 역전	피벗 발견 후 분위수	수치 방정식 풀기	MCMC 또는 공액쌍
피복확률	정확 또는 보수적	정확 (연속 시)	정확 또는 보수적	빈도주의 보장 없음
최적성 연결	UMP → UMAU	—	—	HPD = 최단 신용집합
이산 분포	보수적 구간	직접 적용 어려움	Thm 9.2.14로 적용	자연스럽게 적용
사전 정보 활용	안 함	안 함	안 함	핵심 요소

7 코드 예시

7.1 Step 1: 순수 Python — 네 가지 방법 직접 구현

import math

# -------------------------------------------------------
# 방법 1: 검정 역전 — 정규분포 z-구간
# -------------------------------------------------------
def z_interval(data, sigma, alpha=0.05):
    n = len(data)
    x_bar = sum(data) / n
    # z_{alpha/2} ≈ 1.96 for alpha=0.05
    z = 1.9600
    margin = z * sigma / math.sqrt(n)
    return x_bar - margin, x_bar + margin

# -------------------------------------------------------
# 방법 2: 피벗 — 정규분포 t-구간 (sigma 미지)
# -------------------------------------------------------
def t_interval_manual(data, alpha=0.05):
    n = len(data)
    x_bar = sum(data) / n
    s = math.sqrt(sum((x - x_bar)**2 for x in data) / (n - 1))
    # t_{n-1, alpha/2}: n=10이면 ≈ 2.262
    t_crit = 2.262  # n=10 고정 시
    margin = t_crit * s / math.sqrt(n)
    return x_bar - margin, x_bar + margin

# -------------------------------------------------------
# 방법 3: CDF 피벗팅 — 포아송 Garwood 구간
# (scipy 없이 chi2 분위수를 상수로 대입)
# -------------------------------------------------------
def poisson_garwood_interval(y0, n, alpha=0.05):
    # chi2_{2y0, 1-alpha/2}와 chi2_{2(y0+1), alpha/2}를 수치로 구해야 함
    # 여기서는 scipy 없이 개념만 시연; 실제 구현은 Step 2 참조
    print(f"관측합: {y0}, 표본 수: {n}")
    print(f"하한: chi2_({2*y0}, {1-alpha/2}) / (2n)")
    print(f"상한: chi2_({2*(y0+1)}, {alpha/2}) / (2n)")

data = [7.2, 6.8, 7.5, 8.1, 7.0, 6.5, 7.8, 8.3, 6.9, 7.4]

L_z, U_z = z_interval(data, sigma=0.6)
print(f"z-구간 (sigma=0.6 가정): [{L_z:.3f}, {U_z:.3f}]")

L_t, U_t = t_interval_manual(data)
print(f"t-구간 (sigma 미지):     [{L_t:.3f}, {U_t:.3f}]")

poisson_garwood_interval(y0=6, n=10)

7.2 Step 2: scipy — 네 가지 방법 실무 구현

import numpy as np
from scipy import stats

data = np.array([7.2, 6.8, 7.5, 8.1, 7.0, 6.5, 7.8, 8.3, 6.9, 7.4])
n, alpha = len(data), 0.05
x_bar, s = np.mean(data), np.std(data, ddof=1)

# -------------------------------------------------------
# 방법 1: 검정 역전 — z-구간 (sigma 알려짐 가정)
# -------------------------------------------------------
sigma = 0.6
z = stats.norm.ppf(1 - alpha/2)
L_z = x_bar - z * sigma / np.sqrt(n)
U_z = x_bar + z * sigma / np.sqrt(n)
print(f"[검정 역전] z-구간:  [{L_z:.3f}, {U_z:.3f}]")

# -------------------------------------------------------
# 방법 2: 피벗 — t-구간 (sigma 미지)
# -------------------------------------------------------
L_t, U_t = stats.t.interval(1-alpha, df=n-1, loc=x_bar, scale=s/np.sqrt(n))
print(f"[피벗]     t-구간:  [{L_t:.3f}, {U_t:.3f}]")

# 분산의 chi2 구간
s2 = s**2
chi2_lo = stats.chi2.ppf(alpha/2, df=n-1)
chi2_hi = stats.chi2.ppf(1-alpha/2, df=n-1)
var_L = (n-1) * s2 / chi2_hi
var_U = (n-1) * s2 / chi2_lo
print(f"[피벗]     분산 구간: [{var_L:.4f}, {var_U:.4f}]")

# -------------------------------------------------------
# 방법 3: CDF 피벗팅 — 포아송 Garwood 구간
# -------------------------------------------------------
n_pois, y0 = 10, 6

chi2_lo_p = stats.chi2.ppf(alpha/2,   df=2*(y0+1))
chi2_hi_p = stats.chi2.ppf(1-alpha/2, df=2*y0)
L_pois = chi2_hi_p / (2 * n_pois)
U_pois = chi2_lo_p / (2 * n_pois)
print(f"[CDF 피벗팅] 포아송 구간: [{L_pois:.3f}, {U_pois:.3f}]")

# -------------------------------------------------------
# 방법 4: 베이즈 — 포아송-감마 공액 신용구간 (a=b=1)
# -------------------------------------------------------
a_prior, b_prior = 1, 1
alpha_post = a_prior + y0          # 사후 형상 = 7
beta_post  = b_prior / (n_pois * b_prior + 1)  # 사후 척도 = 1/11

# 2*(n+1)/b * lambda ~ chi2_{2*(a+sum_x)}
dof_bayes = 2 * (a_prior + y0)
scale = b_prior / (2 * (n_pois * b_prior + 1))
L_bayes = scale * stats.chi2.ppf(alpha/2,   df=dof_bayes)
U_bayes = scale * stats.chi2.ppf(1-alpha/2, df=dof_bayes)
print(f"[베이즈]   포아송 신용구간 (a=b=1): [{L_bayes:.3f}, {U_bayes:.3f}]")

결과 해석: - z-구간과 t-구간의 차이: \(\sigma\) 를 모를 때 t-구간이 약간 더 넓다 — \(\sigma^2\) 추정의 불확실성이 구간 폭에 반영됨 - 분산 구간이 비대칭인 이유: \(\chi^2\) 분포 자체가 오른쪽으로 긴 꼬리를 가지기 때문 - 포아송 Garwood 구간: 이산 분포이므로 실제 피복확률이 90% 보다 높게 나오는 경우가 많다 (보수적) - 베이즈 신용구간: 사전분포 Gamma(1,1)이 \(\lambda\) 가 작을 쪽으로 당기므로 빈도주의 구간보다 상한이 낮다

8 관련 주제

선행 지식

후속 주제

관련 개념

충분성 원리 — 검정과 구간 모두 충분통계량에 집중해야 함
손실함수 최적성 — UMAU 구간의 이론적 근거