1 빈도론 검정의 한계와 베이즈 패러다임
빈도론 가설검정은 강력하지만, 결과 해석에 개념적 불편함이 있다.
“p-value = 0.03이면 \(H_0\) 가 참일 확률이 3%인가?”
아니다. p-value는 \(H_0\) 가 참이라고 가정했을 때 현재 관측값만큼 극단적인 데이터가 나올 확률이다. 연구자가 실제로 알고 싶은 것, 즉 “\(H_0\) 가 참일 확률”은 직접 계산되지 않는다.
베이즈 검정은 이 질문에 직접 답한다.
“데이터를 관측한 후 \(H_0\) 가 참일 확률은 \(P(H_0 | \mathbf{x})\) 이다.”
이를 계산하기 위해 베이즈 정리와 사전분포 \(\pi(\theta)\) 를 활용한다 (Casella & Berger, 2002, §8.2.2).
2 베이즈 검정의 기본 구조
2.1 베이즈 추론의 출발점
빈도론에서 \(\theta\) 는 고정된 미지 상수이다. 베이즈에서 \(\theta\) 는 확률변수이며, 사전분포 \(\pi(\theta)\) 로 불확실성을 표현한다.
데이터 \(\mathbf{x}\) 를 관측한 후 베이즈 정리로 사후분포를 계산한다:
\[ \pi(\theta | \mathbf{x}) = \frac{f(\mathbf{x}|\theta) \cdot \pi(\theta)}{m(\mathbf{x})}, \quad m(\mathbf{x}) = \int f(\mathbf{x}|\theta)\,\pi(\theta)\,d\theta \]
여기서: - \(f(\mathbf{x}|\theta)\): 우도함수 (데이터의 생성 모형) - \(\pi(\theta)\): 사전분포 (데이터 관측 전 \(\theta\) 에 대한 믿음) - \(m(\mathbf{x})\): 주변 우도 (normalizing constant) - \(\pi(\theta|\mathbf{x})\): 사후분포 (데이터 관측 후 갱신된 믿음)
2.2 베이즈 검정의 의사결정 규칙
\(H_0: \theta \in \Theta_0\) vs \(H_1: \theta \in \Theta_0^c\) 에서 사후확률을 직접 비교한다:
\[ P(H_0 \text{ 참} | \mathbf{x}) = P(\theta \in \Theta_0 | \mathbf{x}) = \int_{\Theta_0} \pi(\theta|\mathbf{x})\,d\theta \]
\[ P(H_1 \text{ 참} | \mathbf{x}) = P(\theta \in \Theta_0^c | \mathbf{x}) = \int_{\Theta_0^c} \pi(\theta|\mathbf{x})\,d\theta \]
\(H_0\) 채택: \(P(\theta \in \Theta_0 | \mathbf{x}) \geq P(\theta \in \Theta_0^c | \mathbf{x})\)
\(H_0\) 기각: \(P(\theta \in \Theta_0^c | \mathbf{x}) > P(\theta \in \Theta_0 | \mathbf{x})\)
즉, 데이터를 보고 난 후 \(H_1\) 이 더 가능성 높다고 판단되면 \(H_0\) 를 기각한다.
직관: 법원에서 “증거를 고려했을 때 피고가 유죄일 확률이 50% 초과”이면 유죄 판결하는 것과 같다. 빈도론이 “무죄라고 가정 시 이 증거가 나올 확률”을 따지는 것과 대비된다.
3 예시 1: 정규분포 평균 검정
\(X_1, \ldots, X_n \overset{iid}{\sim} N(\theta, \sigma^2)\) (분산 \(\sigma^2\) 알려짐), 사전 \(\theta \sim N(\mu_0, \tau^2)\), \(H_0: \theta \leq \theta_0\) vs \(H_1: \theta > \theta_0\)
사후분포 계산: 정규-정규 켤레(conjugate) 결합이므로 사후분포도 정규이다:
\[ \pi(\theta|\bar{x}) \sim N\left(\mu_n,\, \sigma_n^2\right) \]
\[ \mu_n = \frac{n\tau^2\bar{x} + \sigma^2\mu_0}{n\tau^2 + \sigma^2}, \qquad \sigma_n^2 = \frac{\sigma^2\tau^2}{n\tau^2 + \sigma^2} \]
직관적 의미:
- \(\mu_n\) 은 사전 평균 \(\mu_0\) 과 표본 평균 \(\bar{x}\) 의 가중 평균이다
- 가중치는 각각의 정밀도(precision = 1/분산)에 비례한다: 사전 정밀도 \(1/\tau^2\), 데이터 정밀도 \(n/\sigma^2\)
- 표본이 많을수록 (\(n \to \infty\)) 사후 평균은 \(\bar{x}\) 로 수렴 → 데이터가 사전정보를 압도
의사결정: 사후분포가 정규이므로
\[ P(\theta \leq \theta_0 | \bar{x}) = \Phi\left(\frac{\theta_0 - \mu_n}{\sigma_n}\right) \]
\(\mu_0 = \theta_0\) (사전에 \(H_0\), \(H_1\) 각각 50% 확률)으로 놓으면:
\[ P(H_0 | \bar{x}) = P(\theta \leq \theta_0 | \bar{x}) \geq \frac{1}{2} \iff \mu_n \leq \theta_0 \iff \bar{x} \leq \theta_0 \]
이 경우 베이즈 검정 기각역 \(\{\bar{X} > \theta_0\}\) 은 빈도론 검정과 같지만, 해석이 다르다.
빈도론 해석: \(H_0\) 하에서 \(\bar{X}\) 가 이만큼 크게 나올 확률이 \(\alpha\) 이하 베이즈 해석: 데이터를 본 후 \(\theta > \theta_0\) 일 사후 확률이 50% 초과
4 베이즈 인수 (Bayes Factor)
베이즈 인수는 두 가설을 직접 비교하는 핵심 도구이다.
4.1 사전 오즈와 사후 오즈
사전 오즈(prior odds):
\[ \text{Prior Odds} = \frac{P(H_1)}{P(H_0)} = \frac{\pi(\theta \in \Theta_0^c)}{\pi(\theta \in \Theta_0)} \]
사후 오즈(posterior odds):
\[ \text{Posterior Odds} = \frac{P(H_1|\mathbf{x})}{P(H_0|\mathbf{x})} \]
베이즈 인수는 데이터가 오즈를 얼마나 바꾸는지를 나타낸다:
\[ BF_{10} = \frac{\text{Posterior Odds}}{\text{Prior Odds}} = \frac{P(H_1|\mathbf{x})/P(H_0|\mathbf{x})}{P(H_1)/P(H_0)} \]
동치 표현 (주변 우도의 비율):
\[ BF_{10} = \frac{m_1(\mathbf{x})}{m_0(\mathbf{x})} = \frac{\int_{\Theta_0^c} f(\mathbf{x}|\theta)\,\pi(\theta)\,d\theta}{\int_{\Theta_0} f(\mathbf{x}|\theta)\,\pi(\theta)\,d\theta} \]
따라서: 사후 오즈 = 사전 오즈 × 베이즈 인수
직관: \(BF_{10} = 10\) 이면, 데이터를 관측한 후 \(H_1\) 에 유리한 증거가 10배 강해졌다는 뜻이다.
4.2 베이즈 인수 해석 기준 (Jeffreys 척도)
| \(BF_{10}\) | 해석 |
|---|---|
| 1 미만 | \(H_0\) 지지 |
| 1 ~ 3 | \(H_1\) 에 대한 미약한 증거 |
| 3 ~ 10 | 상당한 증거 |
| 10 ~ 30 | 강한 증거 |
| 30 ~ 100 | 매우 강한 증거 |
| 100 이상 | 결정적 증거 |
이 척도는 절대적 기준이 아니라 연구 영역에 따라 조정된다.
4.3 베이즈 인수 vs p-value
베이즈 인수는 p-value와 근본적으로 다른 정보를 제공한다.
| 항목 | p-value | 베이즈 인수 |
|---|---|---|
| 측정 대상 | \(H_0\) 하의 데이터 극단성 | \(H_1\) 대 \(H_0\) 의 상대적 증거 |
| 사전정보 | 사용 안 함 | 사전분포 필요 |
| 양방향 해석 | \(H_1\) 에 유리한 방향만 | \(H_0\), \(H_1\) 양방향 가능 |
| 연속 모니터링 | 불가 (다중검정 문제) | 가능 (순차 업데이트) |
| 직관적 해석 | 어려움 | “\(H_1\) 이 \(k\) 배 더 잘 지지됨” |
5 손실함수 기반 베이즈 검정 (§8.3.5)
5.1 결정이론 관점
가설검정을 결정이론(decision theory) 문제로 보면, 최적 베이즈 검정은 기대 손실(expected loss)을 최소화하는 결정 규칙이다.
행동 공간: \(\{a_0 = \text{H}_0 \text{ 채택},\; a_1 = \text{H}_0 \text{ 기각}\}\)
5.2 0-1 손실 (Symmetric Loss)
\[ L(\theta, a_0) = \begin{cases} 0 & \theta \in \Theta_0 \\ 1 & \theta \in \Theta_0^c \end{cases}, \qquad L(\theta, a_1) = \begin{cases} 1 & \theta \in \Theta_0 \\ 0 & \theta \in \Theta_0^c \end{cases} \]
두 오류가 동일한 비용을 가진다. 이 손실 하의 베이즈 결정 규칙:
사후 기대 손실은
\[ E[L(\theta, a_0)|\mathbf{x}] = P(\theta \in \Theta_0^c | \mathbf{x}) = P(H_1|\mathbf{x}) \]
\[ E[L(\theta, a_1)|\mathbf{x}] = P(\theta \in \Theta_0 | \mathbf{x}) = P(H_0|\mathbf{x}) \]
기대 손실을 최소화하므로:
\[ \text{기각} \iff E[L(\theta,a_1)|\mathbf{x}] < E[L(\theta,a_0)|\mathbf{x}] \iff P(H_0|\mathbf{x}) < P(H_1|\mathbf{x}) \]
즉, 0-1 손실에서 최적 베이즈 검정은 더 높은 사후확률을 가진 가설을 선택한다.
5.3 일반화 0-1 손실 (Asymmetric Loss)
두 오류의 비용이 다를 때 (Casella & Berger, 2002, eq. 8.3.11):
\[ L(\theta, a_0) = \begin{cases} 0 & \theta \in \Theta_0 \\ c_{II} & \theta \in \Theta_0^c \end{cases}, \qquad L(\theta, a_1) = \begin{cases} c_I & \theta \in \Theta_0 \\ 0 & \theta \in \Theta_0^c \end{cases} \]
- \(c_I\): 제1종 오류 비용 (거짓 기각)
- \(c_{II}\): 제2종 오류 비용 (거짓 채택)
최적 베이즈 결정:
\[ E[L(\theta,a_1)|\mathbf{x}] < E[L(\theta,a_0)|\mathbf{x}] \]
\[ c_I \cdot P(H_0|\mathbf{x}) < c_{II} \cdot P(H_1|\mathbf{x}) \]
\[ \text{기각} \iff \frac{P(H_1|\mathbf{x})}{P(H_0|\mathbf{x})} > \frac{c_I}{c_{II}} \iff BF_{10} \cdot \frac{P(H_1)}{P(H_0)} > \frac{c_I}{c_{II}} \]
직관: 제1종 오류 비용 \(c_I\) 이 클수록 (잘못된 기각이 심각할수록) 기각 임계값이 높아진다. 임상시험에서 신약 효과가 없는데 승인하는 오류(\(c_I\) 가 큼)보다 효과 있는데 거절하는 오류(\(c_{II}\))가 덜 심각할 수 있다.
5.4 위험 함수 (Risk Function)
일반화 0-1 손실의 위험 함수:
\[ R(\theta, \delta) = \begin{cases} c_I \cdot \beta(\theta) & \theta \in \Theta_0 \\ c_{II} \cdot (1 - \beta(\theta)) & \theta \in \Theta_0^c \end{cases} \]
여기서 \(\beta(\theta) = P_\theta(\mathbf{X} \in R)\) 는 검정력 함수이다.
\(\theta \in \Theta_0\) 에서 위험은 제1종 오류 확률에 비용을 곱한 것이고, \(\theta \in \Theta_0^c\) 에서는 제2종 오류 확률에 비용을 곱한 것이다.
6 예시 2: 포아송 모형 베이즈 검정
\(X_1, \ldots, X_n \overset{iid}{\sim} \text{Poisson}(\lambda)\), 켤레 사전 \(\lambda \sim \text{Gamma}(\alpha, \beta)\), \(H_0: \lambda \leq \lambda_0\) vs \(H_1: \lambda > \lambda_0\)
사후분포: 포아송-감마 켤레 관계에서
\[ \lambda | \mathbf{x} \sim \text{Gamma}\left(\alpha + \sum_{i=1}^n x_i,\; \beta + n\right) \]
베이즈 검정:
\[ P(H_1 | \mathbf{x}) = P\left(\lambda > \lambda_0 \,\Big|\, \lambda \sim \text{Gamma}\!\left(\alpha + \sum x_i,\; \beta + n\right)\right) \]
이를 감마 분포의 CDF로 계산한다.
직관적 업데이트: 사전 믿음 \((\alpha, \beta)\) 에서 출발하여, 데이터 \(\sum x_i\) 를 관측하면 형상(shape) 모수가 \(\alpha + \sum x_i\) 로, 율(rate) 모수가 \(\beta + n\) 으로 업데이트된다. 이 새로운 감마 분포가 사후에 \(\lambda\) 의 불확실성을 표현한다.
7 켤레 사전분포 요약
베이즈 검정에서 켤레 사전분포를 사용하면 사후분포를 닫힌 형태(closed form)로 구할 수 있다.
| 우도 | 사전분포 | 사후분포 | 업데이트 규칙 |
|---|---|---|---|
| \(N(\theta, \sigma^2)\) | \(N(\mu_0, \tau^2)\) | \(N(\mu_n, \sigma_n^2)\) | 정밀도 가중 평균 |
| \(\text{Poisson}(\lambda)\) | \(\text{Gamma}(\alpha, \beta)\) | \(\text{Gamma}(\alpha+\sum x_i, \beta+n)\) | 관측 합 누적 |
| \(\text{Binomial}(n,p)\) | \(\text{Beta}(\alpha, \beta)\) | \(\text{Beta}(\alpha+s, \beta+n-s)\) | 성공·실패 누적 |
| \(\text{Exponential}(\lambda)\) | \(\text{Gamma}(\alpha, \beta)\) | \(\text{Gamma}(\alpha+n, \beta+\sum x_i)\) | 관측 합 누적 |
8 빈도론 LRT vs 베이즈 검정: 비교 정리
| 항목 | 빈도론 LRT | 베이즈 검정 |
|---|---|---|
| \(\theta\) 관점 | 고정된 미지 상수 | 확률변수 |
| 사전정보 활용 | 없음 | 사전분포 \(\pi(\theta)\) |
| 판단 근거 | \(P_{\theta_0}(\text{극단적 데이터})\) | \(P(H_1|\mathbf{x})\) vs \(P(H_0|\mathbf{x})\) |
| 오류 통제 | 제1종 오류 \(\alpha\) 고정 | 손실 함수 기반 기대 손실 최소화 |
| 결과 보고 | 기각/채택 + p-value | 사후 확률 또는 베이즈 인수 |
| 연속 업데이트 | 어려움 (다중검정 문제) | 자연스러운 순차 업데이트 |
| 소표본 성질 | 정확한 분포에 의존 | 사전분포 선택에 의존 |
| 대표본 수렴 | CLT + 점근 이론 | 사전 영향 감소, 데이터 지배 |
언제 각각을 사용하는가:
- 빈도론 선호: 사전정보가 없거나 주관적 사전분포에 대한 거부감이 있을 때, 제1종 오류 통제가 엄격히 요구될 때 (규제 승인 등)
- 베이즈 선호: 이전 연구, 전문가 지식 등 신뢰할 수 있는 사전정보가 있을 때, 불확실성을 확률로 직접 표현하고 싶을 때, 순차 실험/적응적 설계 등에서
9 코드 예시
9.1 Step 1: 정규 켤레 모형 베이즈 검정
import numpy as np
from scipy.stats import norm
def bayesian_test_normal(X, theta0, sigma2, mu0, tau2, alpha=0.05):
"""
정규 켤레 베이즈 검정: H0: theta <= theta0 vs H1: theta > theta0
사전: theta ~ N(mu0, tau2)
우도: X_i | theta ~ N(theta, sigma2)
사후: theta | X_bar ~ N(mu_n, sigma2_n)
"""
n = len(X)
x_bar = np.mean(X)
# 사후 모수 계산 (정밀도 가중 평균)
prec_prior = 1 / tau2
prec_data = n / sigma2
prec_post = prec_prior + prec_data
mu_n = (prec_prior * mu0 + prec_data * x_bar) / prec_post
sigma2_n = 1 / prec_post
# 사후 확률
p_H0 = norm.cdf(theta0, loc=mu_n, scale=np.sqrt(sigma2_n))
p_H1 = 1 - p_H0
# 베이즈 인수 계산 (사전 오즈 = 1:1 가정)
prior_odds = (1 - norm.cdf(theta0, mu0, np.sqrt(tau2))) / \
norm.cdf(theta0, mu0, np.sqrt(tau2))
post_odds = p_H1 / p_H0
bayes_factor = post_odds / prior_odds if prior_odds > 0 else np.inf
return {
'posterior_mean': mu_n,
'posterior_std': np.sqrt(sigma2_n),
'P(H0|X)': p_H0,
'P(H1|X)': p_H1,
'bayes_factor': bayes_factor,
'reject_H0': p_H1 > p_H0
}
# 예시: n=20, 실제 theta = 0.5, H0: theta <= 0
np.random.seed(42)
n = 20
true_theta = 0.5
X = np.random.normal(true_theta, 1.0, n)
result = bayesian_test_normal(
X, theta0=0.0, sigma2=1.0,
mu0=0.0, tau2=1.0 # 사전: N(0, 1)
)
print("=== 정규 켤레 베이즈 검정 ===")
print(f"표본 평균: {np.mean(X):.3f}")
print(f"사후 평균 μ_n: {result['posterior_mean']:.3f}")
print(f"사후 표준편차 σ_n: {result['posterior_std']:.3f}")
print(f"P(H0|X) = {result['P(H0|X)']:.4f}")
print(f"P(H1|X) = {result['P(H1|X)']:.4f}")
print(f"베이즈 인수 BF10 = {result['bayes_factor']:.2f}")
print(f"H0 기각: {result['reject_H0']}")9.2 Step 2: 포아송 켤레 모형 + 손실함수 기반 결정
from scipy.stats import gamma as gamma_dist, poisson
def bayesian_test_poisson(X, lambda0, alpha_prior=1.0, beta_prior=1.0,
c_I=1.0, c_II=1.0):
"""
포아송 켤레 베이즈 검정: H0: lambda <= lambda0 vs H1: lambda > lambda0
손실함수: 일반화 0-1 손실 (c_I, c_II)
사전: lambda ~ Gamma(alpha_prior, beta_prior) [rate parametrization]
사후: lambda | X ~ Gamma(alpha_prior + sum(X), beta_prior + n)
"""
n = len(X)
alpha_post = alpha_prior + sum(X)
beta_post = beta_prior + n
# 사후 확률: P(lambda <= lambda0 | X)
# Gamma의 CDF (rate parametrization)
p_H0 = gamma_dist.cdf(lambda0, a=alpha_post, scale=1/beta_post)
p_H1 = 1 - p_H0
# 최적 베이즈 결정 (일반화 0-1 손실)
# 기각 조건: c_I * P(H0|X) < c_II * P(H1|X)
reject = (c_I * p_H0) < (c_II * p_H1)
# 사후 평균
post_mean = alpha_post / beta_post
return {
'alpha_post': alpha_post,
'beta_post': beta_post,
'posterior_mean': post_mean,
'P(H0|X)': p_H0,
'P(H1|X)': p_H1,
'reject_H0 (0-1 loss)': p_H1 > p_H0,
f'reject_H0 (c_I={c_I}, c_II={c_II})': reject
}
# 예시: 실제 lambda = 3, H0: lambda <= 2
np.random.seed(42)
X_pois = poisson.rvs(mu=3, size=15)
result_pois = bayesian_test_poisson(
X_pois, lambda0=2.0,
alpha_prior=2.0, beta_prior=1.0, # 사전: Gamma(2,1), 평균 = 2
c_I=3.0, c_II=1.0 # 거짓 기각 비용이 3배
)
print("\n=== 포아송 켤레 베이즈 검정 ===")
print(f"표본 평균: {np.mean(X_pois):.2f}")
print(f"사후 평균 E[λ|X]: {result_pois['posterior_mean']:.3f}")
print(f"P(H0|X) = {result_pois['P(H0|X)']:.4f}")
print(f"P(H1|X) = {result_pois['P(H1|X)']:.4f}")
print(f"H0 기각 (0-1 손실): {result_pois['reject_H0 (0-1 loss)']}")
print(f"H0 기각 (c_I=3, c_II=1): {result_pois['reject_H0 (c_I=3, c_II=1)']}")
# c_I가 크면 기각에 더 신중해짐9.3 Step 3: 베이즈 인수 시뮬레이션 (사전 민감도 분석)
import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt
# 사전 분산 tau2에 따른 베이즈 인수 변화
np.random.seed(42)
X = np.random.normal(0.5, 1.0, 20) # 실제 theta = 0.5
tau2_values = [0.1, 0.5, 1.0, 2.0, 5.0, 10.0]
results = []
for tau2 in tau2_values:
r = bayesian_test_normal(X, theta0=0.0, sigma2=1.0, mu0=0.0, tau2=tau2)
results.append({
'tau2': tau2,
'BF10': r['bayes_factor'],
'P(H1|X)': r['P(H1|X)']
})
for r in results:
print(f"tau2={r['tau2']:.1f}: BF10={r['BF10']:.2f}, P(H1|X)={r['P(H1|X)']:.4f}")
# 사전 분산이 커질수록 (정보량 낮은 사전) 베이즈 인수가 어떻게 변하는지 확인9.4 R 코드: BayesFactor 패키지 활용
library(BayesFactor)
library(ggplot2)
# 단일 표본 베이즈 t-검정 (BayesFactor 패키지)
set.seed(42)
x <- rnorm(20, mean = 0.5, sd = 1.0)
# H0: mu = 0 vs H1: mu != 0 (Cauchy 사전 기반)
bf_result <- ttestBF(x = x, mu = 0)
print(bf_result)
# BF10: 데이터가 H1을 얼마나 더 지지하는지
# 단방향 검정
bf_onesided <- ttestBF(x = x, mu = 0, nullInterval = c(-Inf, 0))
print(bf_onesided) # H1: mu > 0
# 사후 분포 샘플링 (MCMC)
posterior_samples <- posterior(bf_result, iterations = 10000)
summary(posterior_samples)
# 포아송 베이즈 검정 (수동 계산)
bayesian_poisson_test <- function(x, lambda0, alpha_prior, beta_prior,
c_I = 1, c_II = 1) {
n <- length(x)
alpha_post <- alpha_prior + sum(x)
beta_post <- beta_prior + n
p_H0 <- pgamma(lambda0, shape = alpha_post, rate = beta_post)
p_H1 <- 1 - p_H0
# 최적 결정 (일반화 0-1 손실)
reject <- (c_I * p_H0) < (c_II * p_H1)
list(
posterior_mean = alpha_post / beta_post,
p_H0 = p_H0, p_H1 = p_H1,
reject = reject
)
}
x_pois <- rpois(15, lambda = 3)
res <- bayesian_poisson_test(x_pois, lambda0 = 2,
alpha_prior = 2, beta_prior = 1,
c_I = 3, c_II = 1)
cat("사후 평균:", res$posterior_mean, "\n")
cat("P(H0|X):", res$p_H0, "\n")
cat("P(H1|X):", res$p_H1, "\n")
cat("H0 기각:", res$reject, "\n")10 베이즈 검정의 한계와 주의사항
10.1 사전분포 민감도
베이즈 검정의 결론은 사전분포 선택에 달려 있다. 특히:
- 점 귀무가설 (\(H_0: \theta = \theta_0\), 즉 단순가설): 연속형 사전분포를 사용하면 \(P(H_0) = 0\) 이 되어 검정이 불가능하다. 이 경우 \(\theta_0\) 에 점 질량(point mass)을 부여하는 혼합 사전분포가 필요하다:
\[ \pi(\theta) = p_0 \cdot \delta(\theta - \theta_0) + (1 - p_0) \cdot g(\theta) \]
- 정보 없는 사전분포(non-informative prior): 분산이 큰 정규분포 등 “약한” 사전분포를 사용하면 베이즈 인수가 항상 \(H_0\) 를 지지하는 방향으로 편향될 수 있다 (린들리 역설, Lindley’s paradox).
10.2 린들리 역설 (Lindley’s Paradox)
표본이 커질수록 p-value는 작아지는 경향이 있지만, 베이즈 인수는 \(H_0\) 를 더 강하게 지지할 수 있다. 이 역설은 두 프레임워크의 근본적 차이를 보여준다.
예시: \(n = 50000\), \(\bar{X} = 0.01\), \(\sigma^2 = 1\), \(H_0: \mu = 0\) - p-value (Z-검정): \(p \approx 0.025\) → 기각 - 베이즈 인수 (약한 사전): \(BF_{10} \approx 0.3\) → \(H_0\) 지지
표본 크기가 커지면 통계적 유의성(p-value)과 실질적 유의성(효과 크기)의 간극이 벌어진다.
11 정리: 베이즈 검정의 세 가지 관점
| 관점 | 핵심 공식 | 해석 |
|---|---|---|
| 사후확률 비교 | \(P(H_1|\mathbf{x})\) vs \(P(H_0|\mathbf{x})\) | 어느 가설이 더 그럴듯한가 |
| 베이즈 인수 | \(BF_{10} = \frac{m_1(\mathbf{x})}{m_0(\mathbf{x})}\) | 데이터가 오즈를 얼마나 바꿨는가 |
| 손실 최소화 | \(\text{기각} \iff c_I P(H_0|\mathbf{x}) < c_{II} P(H_1|\mathbf{x})\) | 기대 비용을 최소화하는 결정 |
세 관점은 동일한 베이즈 패러다임에서 나오며, 적용 맥락에 따라 적합한 표현을 선택한다.
12 관련 주제
선행 지식
후속 주제
관련 개념