1 개요
구간추정량을 찾는 방법은 크게 네 가지로 분류된다.
| 방법 | 핵심 아이디어 | 적용 조건 |
|---|---|---|
| 검정의 역전 (9.2.1) | 수용역 \(A(\theta_0)\)를 \(\theta_0\)에 대해 역전 | 검정 구성 가능 시 항상 적용 |
| 피벗 양 (9.2.2) | 분포가 \(\theta\)에 무관한 함수 \(Q(X,\theta)\) 이용 | 위치·척도 문제에서 자연스럽게 존재 |
| CDF 피벗팅 (9.2.3) | CDF 자체를 피벗으로 활용 | \(F_T(t|\theta)\)가 \(\theta\)에 단조일 때 |
| 베이즈 구간 (9.2.4) | 사후분포 \(\pi(\theta|x)\)에서 직접 구성 | 사전분포 지정 가능 시 |
Casella & Berger(2002, Ch.9)는 다음을 강조한다: “베이즈 구간을 제외하면, 세 가지 방법은 본질적으로 모두 검정통계량의 역전(inverting a test statistic)이라는 동일한 전략에 기반한다.”
이 포스트에서는 각 방법을 정의 → 이론 → 예시 순서로 상세히 전개한다.
2 방법 1: 검정의 역전 (Inverting a Test Statistic)
2.1 핵심 대응 관계
가설검정과 구간추정은 동일한 데이터에 대해 다른 질문을 던진다.
- 검정: 모수 \(\theta_0\) 를 고정하고, “이 표본이 \(\theta_0\) 와 일치하는가?” 를 묻는다
- 구간추정: 표본을 고정하고, “어떤 \(\theta_0\) 값이 이 표본과 일치하는가?” 를 묻는다
이 질문들이 수학적으로 동치임을 다음 정리가 보인다.
각 \(\theta_0 \in \Theta\) 에 대해, \(H_0: \theta = \theta_0\) 의 수준(level) \(\alpha\) 검정의 수용역을 \(A(\theta_0)\) 라 하면, 각 \(x \in \mathcal{X}\) 에 대해 정의한
\[C(x) = \{\theta_0 : x \in A(\theta_0)\}\]
는 \(1 - \alpha\) 신뢰집합이다. 역으로, \(C(X)\) 가 \(1 - \alpha\) 신뢰집합이면,
\[A(\theta_0) = \{x : \theta_0 \in C(x)\}\]
는 \(H_0: \theta = \theta_0\) 의 수준 \(\alpha\) 검정의 수용역이다.
증명 (전방향):
\(A(\theta_0)\) 가 수준 \(\alpha\) 검정의 수용역이므로, \(P_{\theta_0}(X \in A(\theta_0)) \geq 1 - \alpha\) 이다. 임의의 \(\theta\) 에 대해
\[P_\theta(\theta \in C(X)) = P_\theta(X \in A(\theta)) \geq 1 - \alpha\]
마지막 등호는 \(C(x) = \{\theta_0 : x \in A(\theta_0)\}\) 의 정의에서 \(\theta \in C(X) \Leftrightarrow X \in A(\theta)\) 이기 때문이다. 따라서 \(C(X)\) 의 피복확률이 모든 \(\theta\) 에서 \(1 - \alpha\) 이상이므로 신뢰계수 \(\geq 1 - \alpha\) 다. \(\square\)
역방향:
\(C(X)\) 가 \(1 - \alpha\) 신뢰집합이면, \(P_{\theta_0}(\theta_0 \in C(X)) \geq 1 - \alpha\), 즉
\[P_{\theta_0}(X \in A(\theta_0)) = P_{\theta_0}(\theta_0 \in C(X)) \geq 1 - \alpha\]
그러므로 \(A(\theta_0)\) 는 수준 \(\alpha\) 검정의 수용역이다. \(\square\)
정리가 실용적인 이유: 수용역은 구성하기 쉽고(기각역의 여집합), 신뢰집합은 구성하기 어렵다. 정리 9.2.2는 전자를 후자로 자동 변환한다. 우도비 검정, UMP 검정 등 모든 검정 기법이 신뢰집합 구성에 즉시 사용된다.
2.2 예시 1: 정규분포 양측 신뢰구간 (알려진 분산)
\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} N(\mu, \sigma^2)\), \(\sigma^2\) 알려짐. \(H_0: \mu = \mu_0\) vs \(H_1: \mu \neq \mu_0\) 에 대한 크기 \(\alpha\) 검정의 수용역은
\[A(\mu_0) = \left\{x : \left|\bar{x} - \mu_0\right| \leq z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right\}\]
정리 9.2.2를 적용하면,
\[C(x) = \left\{\mu_0 : x \in A(\mu_0)\right\} = \left\{\mu_0 : \left|\bar{x} - \mu_0\right| \leq z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right\}\]
이를 \(\mu_0\) 에 대해 풀면
\[C(x) = \left[\bar{x} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}},\; \bar{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right]\]
이것이 고전적인 \(z\)-신뢰구간이다. 피복확률은 정확히 \(1 - \alpha\) 로 상수다.
2.3 예시 2: 정규분포 단측 신뢰구간 (미지 분산)
\(\sigma^2\) 미지일 때, \(H_0: \mu = \mu_0\) vs \(H_1: \mu < \mu_0\) 에 대한 수준 \(\alpha\) 검정의 수용역(t-검정 기반)은
\[A(\mu_0) = \left\{x : \bar{x} \geq \mu_0 - t_{n-1,\alpha}\frac{s}{\sqrt{n}}\right\}\]
역전하면 \(x \in A(\mu_0) \Leftrightarrow \bar{x} + t_{n-1,\alpha}\frac{s}{\sqrt{n}} \geq \mu_0\), 즉
\[C(x) = \left(-\infty,\; \bar{x} + t_{n-1,\alpha}\frac{s}{\sqrt{n}}\right]\]
단측 검정을 역전하면 단측 신뢰구간이 나온다는 것을 보여주는 예시다.
2.4 예시 3: 우도비 검정 역전 — 지수분포 평균
\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Exp}(\lambda)\). \(H_0: \lambda = \lambda_0\) vs \(H_1: \lambda \neq \lambda_0\) 에 대한 LRT 통계량에서 수용역은
\[A(\lambda_0) = \left\{x : \left(\frac{\sum x_i}{\lambda_0}\right)^n e^{-\sum x_i/\lambda_0} \geq k^*\right\}\]
여기서 \(k^*\) 는 \(P_{\lambda_0}(X \in A(\lambda_0)) = 1 - \alpha\) 를 만족하도록 결정된다. 역전하면
\[C(x) = \left\{\lambda : \left(\frac{\sum x_i}{\lambda}\right)^n e^{-\sum x_i/\lambda} \geq k^*\right\}\]
이를 \(L(\sum x_i) \leq \lambda \leq U(\sum x_i)\) 형태로 표현하면, \(L\)과 \(U\)는 다음 연립 방정식으로 결정된다:
\[\left(\frac{\sum x_i}{L}\right)^n e^{-\sum x_i/L} = \left(\frac{\sum x_i}{U}\right)^n e^{-\sum x_i/U}\]
\(a = \sum x_i / L\), \(b = \sum x_i / U\) 로 놓으면 \(a^n e^{-a} = b^n e^{-b}\) 가 수치적으로 풀린다. \(n=2\) 일 때 90% 신뢰구간은 \(a \approx 5.480\), \(b \approx 0.441\) 로
\[\left[\frac{\sum x_i}{5.480},\; \frac{\sum x_i}{0.441}\right]\]
2.5 예시 4: 이항 분포 단측 신뢰구간
\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Bernoulli}(p)\), \(T = \sum X_i \sim \text{Bin}(n, p)\). 아래에서 구성하는 것은 \(p\) 의 \(1-\alpha\) 하측 신뢰구간 \((L(T), 1]\) 이다.
\(H_0: p = p_0\) vs \(H_1: p > p_0\) 에 대한 UMP 검정(이항 분포의 단조 우도비 성질로 존재)의 수용역을 역전한다. 이항 분포의 CDF \(f(p_0|k) = \sum_{y=0}^k \binom{n}{y}p_0^y(1-p_0)^{n-y}\) 는 \(p_0\) 에 대해 감소함수이므로, 수용역은
\[A(p_0) = \{t : t \leq k(p_0)\}, \quad k(p_0) \text{ s.t. } \sum_{y=0}^{k(p_0)}\binom{n}{y}p_0^y(1-p_0)^{n-y} \geq 1-\alpha\]
역전하면 \(C(t) = \{p_0 : t \leq k(p_0)\} = \{p_0 : p_0 > k^{-1}(t)\}\) 이므로
\[C(T) = (k^{-1}(T), 1], \quad k^{-1}(t) = \sup\left\{p : \sum_{y=0}^{t-1}\binom{n}{y}p^y(1-p)^{n-y} \geq 1-\alpha\right\}\]
이산 분포이므로 정확한 \(1-\alpha\) 크기를 달성할 수 없고, 최소 \(1-\alpha\) 를 보장하는 보수적(conservative) 구간이 얻어진다.
3 방법 2: 피벗 양 (Pivotal Quantities)
3.1 정의와 직관
확률변수 \(Q(X,\theta) = Q(X_1, \ldots, X_n, \theta)\) 의 분포가 모든 \(\theta\) 에서 동일하면, 즉 \(X \sim F(x|\theta)\) 일 때 \(Q(X,\theta)\) 의 분포가 \(\theta\) 에 무관하면, \(Q\) 를 피벗(pivot) 이라 한다.
왜 피벗이 유용한가? 피벗의 분포는 \(\theta\) 에 무관하므로, 분위수 \(a, b\) 를 \(\theta\) 와 무관하게 결정할 수 있다. 피벗에 대한 확률 부등식
\[P_\theta(a \leq Q(X,\theta) \leq b) \geq 1 - \alpha\]
를 \(\theta\) 에 대해 역전하면 신뢰집합을 얻는다. 이 역전이 가능하려면 \(Q(x, \theta)\) 가 \(\theta\) 에 대해 단조여야 한다.
피벗 구성 원리:
- 위치 문제(location): 차(difference)가 피벗 — pdf \(f(x|\mu) = f_0(x - \mu)\) 이면 \(Q = \bar{X} - \mu\) 가 \(\mu\) 에 무관
- 척도 문제(scale): 비(ratio)가 피벗 — pdf \(f(x|\sigma) = \sigma^{-1}f_0(x/\sigma)\) 이면 \(Q = \bar{X}/\sigma\) 가 \(\sigma\) 에 무관
- 위치-척도 문제: \(Q = (\bar{X} - \mu)/S\) 형태 (스튜던트 \(t\) 통계량이 대표적 예)
일반 공식: 통계량 \(T\) 의 pdf가
\[f(t|\theta) = g(Q(t,\theta))\left|\frac{\partial}{\partial t}Q(t,\theta)\right|\]
형태로 분해되고 \(Q\) 가 \(t\) 에 대해 단조이면, \(Q(T,\theta)\) 는 피벗이다 (Thm 2.1.5 적용).
3.2 피벗을 이용한 신뢰구간 구성 절차
- 피벗 \(Q(X,\theta)\) 를 구성한다
- \(P(a \leq Q(X,\theta) \leq b) \geq 1-\alpha\) 를 만족하는 \(a, b\) 를 결정한다
- 수용역 \(A(\theta_0) = \{x : a \leq Q(x,\theta_0) \leq b\}\) 를 \(\theta_0\) 에 대해 역전하여 \(C(x)\) 를 구한다
\(Q(x,\theta)\) 가 \(\theta\) 에 대해 단조 감소이면, \(C(x) = [L(x,b),\, U(x,a)]\) 형태이고 단조 증가이면, \(C(x) = [L(x,a),\, U(x,b)]\) 형태이다.
3.3 예시 5: 위치-척도 피벗 모음
\(X_1, \ldots, X_n\) 의 형태에 따른 피벗을 정리한다.
| pdf 형태 | 분포 유형 | 피벗 | 피벗의 분포 |
|---|---|---|---|
| \(f_0(x - \mu)\) | 위치(Location) | \(\bar{X} - \mu\) | \(\mu\) 무관 |
| \(\frac{1}{\sigma}f_0\!\left(\frac{x}{\sigma}\right)\) | 척도(Scale) | \(\bar{X}/\sigma\) | \(\sigma\) 무관 |
| \(\frac{1}{\sigma}f_0\!\left(\frac{x-\mu}{\sigma}\right)\) | 위치-척도 | \(\frac{\bar{X}-\mu}{S}\) | \((\mu,\sigma)\) 무관 |
특히 \(X_i \overset{\text{iid}}{\sim} N(\mu,\sigma^2)\) 이면 \(\frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t_{n-1}\) 은 \((\mu,\sigma^2)\) 모두에 무관한 피벗이다.
3.4 예시 6: 지수 분포 감마 피벗
\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Exp}(\lambda)\). \(T = \sum X_i \sim \text{Gamma}(n, \lambda)\) 이고, 감마 pdf에서 \(t\) 와 \(\lambda\) 는 항상 \(t/\lambda\) 형태로 등장한다(척도족). 따라서
\[Q(T,\lambda) = \frac{2T}{\lambda} \sim \text{Gamma}(n, 2) = \chi^2_{2n}\]
이 피벗의 분포는 \(\lambda\) 에 무관하다. \(P(a \leq \chi^2_{2n} \leq b) = 1-\alpha\) 를 만족하는 분위수 \(a = \chi^2_{2n,1-\alpha/2}\), \(b = \chi^2_{2n,\alpha/2}\) 를 이용하면
\[P_\lambda\!\left(a \leq \frac{2T}{\lambda} \leq b\right) = 1-\alpha\]
이를 \(\lambda\) 에 대해 역전하면 (\(Q\) 는 \(\lambda\) 에 대해 단조 감소)
\[\frac{2T}{b} \leq \lambda \leq \frac{2T}{a}\]
\(n=10\), \(\alpha=0.05\) 일 때 \(a = \chi^2_{20,0.975}=9.591\), \(b = \chi^2_{20,0.025}=34.170\) 이므로
\[\left[\frac{2T}{34.170},\; \frac{2T}{9.591}\right]\]
3.5 예시 7: 정규 분포 분산 피벗
\(X_i \overset{\text{iid}}{\sim} N(\mu,\sigma^2)\), \(\mu\) 미지. 충분통계량 \(S^2 = \frac{1}{n-1}\sum(X_i-\bar{X})^2\) 에 대해
\[Q(S^2, \sigma^2) = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2_{n-1}\]
이 \(\sigma^2\) 에 무관한 피벗이다. \(P(a \leq \chi^2_{n-1} \leq b) = 1-\alpha\) 에서 \(a = \chi^2_{n-1,1-\alpha/2}\), \(b = \chi^2_{n-1,\alpha/2}\) 로 놓으면
\[\left[\frac{(n-1)s^2}{b},\; \frac{(n-1)s^2}{a}\right] = \left[\frac{(n-1)s^2}{\chi^2_{n-1,\alpha/2}},\; \frac{(n-1)s^2}{\chi^2_{n-1,1-\alpha/2}}\right]\]
주의: \(\chi^2\) 분포는 비대칭이므로, \(\alpha/2\) 씩 양 꼬리에 배분하는 등분할 절단점이 최단 구간을 주지 않는다. 최단 구간을 원하면 절단점을 수치 최적화로 구해야 한다(9.3 참조).
4 방법 3: CDF 피벗팅 (Pivoting the CDF)
4.1 동기 — 피벗이 없을 때
피벗 방법은 위치·척도 구조가 있을 때 자연스럽게 적용된다. 그러나 일반적인 분포에서는 피벗을 찾기 어렵다. CDF 피벗팅은 이런 경우에도 사용할 수 있는 완전히 일반적인 방법이다.
핵심 아이디어: 확률적분변환(PIT)에 의해, 연속 확률변수 \(T\) 에 대해 \(F_T(T|\theta) \sim \text{Uniform}(0,1)\) 이 모든 \(\theta\) 에서 성립한다 — 즉 \(F_T(T|\theta)\) 는 피벗이다.
4.2 연속 분포의 경우
통계량 \(T\) 의 연속 CDF가 \(F_T(t|\theta)\) 이고, \(\alpha_1 + \alpha_2 = \alpha\) 로 고정. \(F_T(t|\theta)\) 가 각 \(t\) 에 대해 \(\theta\) 의 감소함수이면,
\[F_T(t|\theta_U(t)) = \alpha_1, \quad F_T(t|\theta_L(t)) = 1 - \alpha_2\]
를 만족하는 \(\theta_L(t)\), \(\theta_U(t)\) 로 구성된 구간 \([\theta_L(T), \theta_U(T)]\) 는 \(1-\alpha\) 신뢰구간이다.
\(F_T(t|\theta)\) 가 \(\theta\) 의 증가함수이면, 조건이 반전된다:
\[F_T(t|\theta_U(t)) = 1-\alpha_2, \quad F_T(t|\theta_L(t)) = \alpha_1\]
증명 스케치 (감소함수 경우):
\(F_T(t|\theta)\) 가 \(\theta\) 에 대해 감소함수이면,
\[F_T(t|\theta) < \alpha_1 \Leftrightarrow \theta > \theta_U(t)\] \[F_T(t|\theta) > 1-\alpha_2 \Leftrightarrow \theta < \theta_L(t)\]
따라서
\[\alpha_1 \leq F_T(t|\theta) \leq 1-\alpha_2 \Leftrightarrow \theta_L(t) \leq \theta \leq \theta_U(t)\]
수용역 \(\{t : \alpha_1 \leq F_T(t|\theta_0) \leq 1-\alpha_2\}\) 는 PIT에 의해 피복확률이 \(\geq 1-\alpha\) 이므로, 정리 9.2.2를 적용하면 역전된 집합 \([\theta_L(T), \theta_U(T)]\) 는 \(1-\alpha\) 신뢰구간이다. \(\square\)
실용적 계산법: 관측값 \(T = t_0\) 가 주어졌을 때 실현된 구간은
\[\int_{-\infty}^{t_0} f_T(u|\theta_U(t_0))\,du = \alpha_1, \quad \int_{t_0}^{\infty} f_T(u|\theta_L(t_0))\,du = \alpha_2\]
이 두 방정식을 \(\theta_L(t_0)\), \(\theta_U(t_0)\) 에 대해 수치적으로 풀면 된다.
\(\alpha_1, \alpha_2\) 선택: 일반적으로 \(\alpha_1 = \alpha_2 = \alpha/2\) (등분할)를 사용하지만, 이것이 최단 구간을 보장하지는 않는다. 단측 구간은 \(\alpha_1 = 0\) 또는 \(\alpha_2 = 0\) 으로 얻는다.
4.3 예시 8: 위치 지수 분포 신뢰구간
\(X_i \overset{\text{iid}}{\sim} \text{Exp}(1)\) 을 위치 \(\mu\) 만큼 이동시킨 pdf \(f(x|\mu) = e^{-(x-\mu)}I_{[\mu,\infty)}(x)\). 충분통계량 \(Y = \min\{X_1, \ldots, X_n\}\) 의 pdf는
\[f_Y(y|\mu) = n e^{-n(y-\mu)} I_{[\mu,\infty)}(y)\]
\(F_Y(y|\mu) = 1 - e^{-n(y-\mu)}\) 는 \(\mu\) 에 대해 단조 증가함수이므로, \(\alpha_1 = \alpha_2 = \alpha/2\) 로
\[\int_{\mu_U(y)}^{y} n e^{-n(u-\mu_U)}\,du = \frac{\alpha}{2}, \quad \int_{y}^{\infty} n e^{-n(u-\mu_L)}\,du = \frac{\alpha}{2}\]
이를 풀면
\[1 - e^{-n(y-\mu_U)} = \frac{\alpha}{2} \Rightarrow \mu_U(y) = y + \frac{1}{n}\log\!\left(1 - \frac{\alpha}{2}\right)\]
\[e^{-n(y-\mu_L)} = \frac{\alpha}{2} \Rightarrow \mu_L(y) = y + \frac{1}{n}\log\!\left(\frac{\alpha}{2}\right)\]
따라서 \(1-\alpha\) 신뢰구간은
\[C(Y) = \left[Y + \frac{\log(\alpha/2)}{n},\; Y + \frac{\log(1-\alpha/2)}{n}\right]\]
\(\log(x) < 0\) (for \(x < 1\))이므로 양 끝점 모두 \(Y\) 보다 작다 — \(Y = \min\{X_i\}\) 가 \(\mu\) 의 상한이기 때문에 직관과 일치한다.
4.4 이산 분포의 경우
이산 분포에서는 PIT의 등분포성이 정확히 성립하지 않아 별도 정리가 필요하다.
이산 통계량 \(T\) 의 CDF \(F_T(t|\theta)\) 가 각 \(t\) 에 대해 \(\theta\) 의 감소함수일 때, \(\alpha_1 + \alpha_2 = \alpha\) 에 대해
\[P(T \leq t|\theta_U(t)) = \alpha_1, \quad P(T \geq t|\theta_L(t)) = \alpha_2\]
를 만족하는 \(\theta_L(T)\), \(\theta_U(T)\) 로 구성된 \([\theta_L(T), \theta_U(T)]\) 는 \(1-\alpha\) 신뢰구간이다.
(\(F_T\) 가 증가함수이면 부등호 방향 반전.)
이산 분포에서는 CDF가 불연속이므로 정확한 피복확률 \(1-\alpha\) 를 달성할 수 없고, 최소 \(1-\alpha\) 를 보장하는 보수적(conservative) 구간이 얻어진다.
4.5 예시 9: 포아송 신뢰구간
\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Poisson}(\lambda)\). \(Y = \sum X_i \sim \text{Poisson}(n\lambda)\) 는 충분통계량이다.
\(F_Y(y|n\lambda)\) 는 \(\lambda\) 에 대해 단조 감소이므로, \(y_0 = Y = y_0\) 관측 시
\[P(Y \leq y_0|\lambda_U) = \frac{\alpha}{2}, \quad P(Y \geq y_0|\lambda_L) = \frac{\alpha}{2}\]
포아송-감마 항등식 (Ex. 3.3.1)을 이용하면:
\[\frac{\alpha}{2} = P(Y \leq y_0|\lambda) = P\!\left(\chi^2_{2(y_0+1)} > 2n\lambda\right)\]
\[\frac{\alpha}{2} = P(Y \geq y_0|\lambda) = P\!\left(\chi^2_{2y_0} < 2n\lambda\right)\]
따라서
\[\lambda_U = \frac{\chi^2_{2(y_0+1),\alpha/2}}{2n}, \quad \lambda_L = \frac{\chi^2_{2y_0,1-\alpha/2}}{2n}\]
\(1-\alpha\) 신뢰구간 (Garwood, 1936):
\[\left[\frac{\chi^2_{2y_0,1-\alpha/2}}{2n},\; \frac{\chi^2_{2(y_0+1),\alpha/2}}{2n}\right]\]
수치 예시: \(n=10\), \(y_0 = 6\), \(\alpha=0.10\) 이면
\[\left[\frac{\chi^2_{12,0.95}}{20},\; \frac{\chi^2_{14,0.05}}{20}\right] = \left[\frac{5.226}{20},\; \frac{23.685}{20}\right] = [0.261,\; 1.184]\]
so what: 포아송 신뢰구간의 피복확률 곡선은 들쑥날쑥하다 — 이산 분포에서 CDF의 불연속성 때문에, 구간 경계에서 피복확률이 점프한다. 그러나 어떤 \(\lambda\) 에서도 \(1-\alpha\) 이상임은 보장된다.
5 방법 4: 베이즈 구간 (Bayesian Intervals)
5.1 사후분포 기반 신용집합
빈도주의 신뢰구간은 모수를 고정된 미지 상수로 보지만, 베이즈 방법은 모수 자체를 확률변수로 보고 사후분포에서 구간을 구성한다.
사후분포 \(\pi(\theta|x)\) 와 임의의 집합 \(A \subset \Theta\) 에 대해,
\[P(\theta \in A|x) = \int_A \pi(\theta|x)\,d\theta \geq 1-\alpha\]
를 만족하면 \(A\) 를 \(1-\alpha\) 신용집합(credible set) 이라 한다. 이산 경우 적분을 합산으로 교체한다.
신뢰구간 vs. 신용집합 해석의 차이
| 빈도주의 신뢰구간 | 베이즈 신용집합 | |
|---|---|---|
| 모수 | 고정된 미지 상수 | 확률변수 |
| 확률의 대상 | 구간 \([L(X), U(X)]\) (랜덤) | 모수 \(\theta\) (사후분포 상에서) |
| 90% 의미 | 반복 시 90%의 구간이 \(\theta\) 포함 | 사후 믿음의 90%가 \(\theta \in A\) |
| 추가 입력 | 없음 | 사전분포 \(\pi(\theta)\) |
5.2 HPD 영역 (Highest Posterior Density Region)
신용집합 중 가장 좁은 것은 사후 밀도가 높은 값들로 구성된다.
\[C^* = \{\theta : \pi(\theta|x) \geq k\}\]
여기서 \(k\) 는 \(P(\theta \in C^*|x) = 1-\alpha\) 를 만족하도록 결정한다. HPD 영역은 주어진 신용 수준에서 기대 길이가 최소인 신용집합이다.
단봉 사후분포(unimodal)에서 HPD 영역은 구간이 된다. 다봉 분포에서는 불연속 집합이 될 수 있다.
5.3 예시 10: 포아송-감마 공액 쌍
\(X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Poisson}(\lambda)\), 사전분포 \(\lambda \sim \text{Gamma}(a, b)\). 사후분포는
\[\pi\!\left(\lambda \middle| \sum X = \sum x\right) = \text{Gamma}\!\left(a + \sum x,\; \frac{b}{nb+1}\right)\]
\(a\) 가 정수이면 \(\frac{2(nb+1)}{b}\lambda \sim \chi^2_{2(a+\sum x)}\) 이고, 등분할 \(1-\alpha\) 신용구간은
\[\left[\frac{b\,\chi^2_{2(a+\sum x),1-\alpha/2}}{2(nb+1)},\; \frac{b\,\chi^2_{2(a+\sum x),\alpha/2}}{2(nb+1)}\right]\]
\(a=b=1\), \(n=10\), \(\sum x = 6\) 일 때 90% 신용구간:
\[\left[\frac{\chi^2_{14,0.95}}{22},\; \frac{\chi^2_{14,0.05}}{22}\right] = \left[\frac{6.571}{22},\; \frac{23.685}{22}\right] = [0.299,\; 1.077]\]
빈도주의 구간 \([0.261, 1.184]\) 보다 짧다 — 사전분포 Gamma(1,1)이 \(\lambda\) 가 작을 쪽으로 정보를 제공하기 때문이다.
5.4 신뢰구간과 신용집합의 상호 평가
빈도주의 구간과 베이즈 신용집합은 서로의 기준에서 좋지 않을 수 있다.
빈도주의 구간의 신용확률: 포아송 예시에서 90% 신뢰구간의 베이즈 신용확률은 \(\sum x_i \to \infty\) 에 따라 0으로 수렴한다 (사전 분포 설정에 따라 다름). 즉, 데이터가 많아질수록 사전분포로부터 멀어진다.
베이즈 구간의 피복확률: \(X_i \overset{\text{iid}}{\sim} N(\theta, \sigma^2)\), 사전 \(\theta \sim N(\mu, \tau^2)\) 의 경우, \(\sigma/\sqrt{n} \to 0\) 이면서 \(\theta \neq \mu\) 이면 베이즈 신용구간의 피복확률이 0으로 수렴한다. 데이터가 풍부할수록 사전분포가 지배하게 되어 참값과 멀어지기 때문이다.
결론: 두 방법은 서로 다른 목적을 위해 설계되었다. 빈도주의 신뢰구간은 반복 실험의 장기적 오류율을 제어하고, 베이즈 신용집합은 사후 믿음을 표현한다. 사전 정보가 신뢰할 수 있으면 베이즈 구간이 더 짧고 직관적이지만, 잘못된 사전분포는 오해를 유발한다.
6 네 가지 방법 비교
| 기준 | 검정 역전 | 피벗 | CDF 피벗팅 | 베이즈 구간 |
|---|---|---|---|---|
| 적용 범위 | 가장 광범위 | 위치·척도 문제 | 연속·이산 CDF 단조 시 | 사전분포 필요 |
| 구성 용이성 | 검정 구성 후 역전 | 피벗 발견 후 분위수 | 수치 방정식 풀기 | MCMC 또는 공액쌍 |
| 피복확률 | 정확 또는 보수적 | 정확 (연속 시) | 정확 또는 보수적 | 빈도주의 보장 없음 |
| 최적성 연결 | UMP → UMAU | — | — | HPD = 최단 신용집합 |
| 이산 분포 | 보수적 구간 | 직접 적용 어려움 | Thm 9.2.14로 적용 | 자연스럽게 적용 |
| 사전 정보 활용 | 안 함 | 안 함 | 안 함 | 핵심 요소 |
7 코드 예시
7.1 Step 1: 순수 Python — 네 가지 방법 직접 구현
import math
# -------------------------------------------------------
# 방법 1: 검정 역전 — 정규분포 z-구간
# -------------------------------------------------------
def z_interval(data, sigma, alpha=0.05):
n = len(data)
x_bar = sum(data) / n
# z_{alpha/2} ≈ 1.96 for alpha=0.05
z = 1.9600
margin = z * sigma / math.sqrt(n)
return x_bar - margin, x_bar + margin
# -------------------------------------------------------
# 방법 2: 피벗 — 정규분포 t-구간 (sigma 미지)
# -------------------------------------------------------
def t_interval_manual(data, alpha=0.05):
n = len(data)
x_bar = sum(data) / n
s = math.sqrt(sum((x - x_bar)**2 for x in data) / (n - 1))
# t_{n-1, alpha/2}: n=10이면 ≈ 2.262
t_crit = 2.262 # n=10 고정 시
margin = t_crit * s / math.sqrt(n)
return x_bar - margin, x_bar + margin
# -------------------------------------------------------
# 방법 3: CDF 피벗팅 — 포아송 Garwood 구간
# (scipy 없이 chi2 분위수를 상수로 대입)
# -------------------------------------------------------
def poisson_garwood_interval(y0, n, alpha=0.05):
# chi2_{2y0, 1-alpha/2}와 chi2_{2(y0+1), alpha/2}를 수치로 구해야 함
# 여기서는 scipy 없이 개념만 시연; 실제 구현은 Step 2 참조
print(f"관측합: {y0}, 표본 수: {n}")
print(f"하한: chi2_({2*y0}, {1-alpha/2}) / (2n)")
print(f"상한: chi2_({2*(y0+1)}, {alpha/2}) / (2n)")
data = [7.2, 6.8, 7.5, 8.1, 7.0, 6.5, 7.8, 8.3, 6.9, 7.4]
L_z, U_z = z_interval(data, sigma=0.6)
print(f"z-구간 (sigma=0.6 가정): [{L_z:.3f}, {U_z:.3f}]")
L_t, U_t = t_interval_manual(data)
print(f"t-구간 (sigma 미지): [{L_t:.3f}, {U_t:.3f}]")
poisson_garwood_interval(y0=6, n=10)7.2 Step 2: scipy — 네 가지 방법 실무 구현
import numpy as np
from scipy import stats
data = np.array([7.2, 6.8, 7.5, 8.1, 7.0, 6.5, 7.8, 8.3, 6.9, 7.4])
n, alpha = len(data), 0.05
x_bar, s = np.mean(data), np.std(data, ddof=1)
# -------------------------------------------------------
# 방법 1: 검정 역전 — z-구간 (sigma 알려짐 가정)
# -------------------------------------------------------
sigma = 0.6
z = stats.norm.ppf(1 - alpha/2)
L_z = x_bar - z * sigma / np.sqrt(n)
U_z = x_bar + z * sigma / np.sqrt(n)
print(f"[검정 역전] z-구간: [{L_z:.3f}, {U_z:.3f}]")
# -------------------------------------------------------
# 방법 2: 피벗 — t-구간 (sigma 미지)
# -------------------------------------------------------
L_t, U_t = stats.t.interval(1-alpha, df=n-1, loc=x_bar, scale=s/np.sqrt(n))
print(f"[피벗] t-구간: [{L_t:.3f}, {U_t:.3f}]")
# 분산의 chi2 구간
s2 = s**2
chi2_lo = stats.chi2.ppf(alpha/2, df=n-1)
chi2_hi = stats.chi2.ppf(1-alpha/2, df=n-1)
var_L = (n-1) * s2 / chi2_hi
var_U = (n-1) * s2 / chi2_lo
print(f"[피벗] 분산 구간: [{var_L:.4f}, {var_U:.4f}]")
# -------------------------------------------------------
# 방법 3: CDF 피벗팅 — 포아송 Garwood 구간
# -------------------------------------------------------
n_pois, y0 = 10, 6
chi2_lo_p = stats.chi2.ppf(alpha/2, df=2*(y0+1))
chi2_hi_p = stats.chi2.ppf(1-alpha/2, df=2*y0)
L_pois = chi2_hi_p / (2 * n_pois)
U_pois = chi2_lo_p / (2 * n_pois)
print(f"[CDF 피벗팅] 포아송 구간: [{L_pois:.3f}, {U_pois:.3f}]")
# -------------------------------------------------------
# 방법 4: 베이즈 — 포아송-감마 공액 신용구간 (a=b=1)
# -------------------------------------------------------
a_prior, b_prior = 1, 1
alpha_post = a_prior + y0 # 사후 형상 = 7
beta_post = b_prior / (n_pois * b_prior + 1) # 사후 척도 = 1/11
# 2*(n+1)/b * lambda ~ chi2_{2*(a+sum_x)}
dof_bayes = 2 * (a_prior + y0)
scale = b_prior / (2 * (n_pois * b_prior + 1))
L_bayes = scale * stats.chi2.ppf(alpha/2, df=dof_bayes)
U_bayes = scale * stats.chi2.ppf(1-alpha/2, df=dof_bayes)
print(f"[베이즈] 포아송 신용구간 (a=b=1): [{L_bayes:.3f}, {U_bayes:.3f}]")결과 해석: - z-구간과 t-구간의 차이: \(\sigma\) 를 모를 때 t-구간이 약간 더 넓다 — \(\sigma^2\) 추정의 불확실성이 구간 폭에 반영됨 - 분산 구간이 비대칭인 이유: \(\chi^2\) 분포 자체가 오른쪽으로 긴 꼬리를 가지기 때문 - 포아송 Garwood 구간: 이산 분포이므로 실제 피복확률이 90% 보다 높게 나오는 경우가 많다 (보수적) - 베이즈 신용구간: 사전분포 Gamma(1,1)이 \(\lambda\) 가 작을 쪽으로 당기므로 빈도주의 구간보다 상한이 낮다
8 관련 주제
선행 지식
- 구간추정 개요 (Interval Estimation: Overview)
- 가설검정과 우도비 검정
- 정규 모집단에서의 표본분포 — \(t\), \(\chi^2\) 분포
- 베이즈 추정량 — 공액 사전분포, 사후분포
후속 주제
- 피벗 양 심화 (Pivotal Quantities)
- CDF 피벗팅 심화 (Pivoting the CDF)
- 베이즈 구간 심화 (Bayesian Intervals)
- 구간추정 평가 (Methods of Evaluating Interval Estimators)
관련 개념