베이즈 검정 — 사후확률로 가설을 판단하는 방법

데이터를 관측한 후 귀무가설이 참일 확률을 직접 계산하는 검정 패러다임

베이즈 검정의 구조와 이론을 다룬다. 사전·사후분포 기반 의사결정, 베이즈 인수(Bayes Factor), 손실함수 최적성(0-1 손실, 일반화 손실), 빈도론 LRT와의 비교, 켤레 사전분포를 이용한 정규·포아송 모형 예시까지 직관과 수식을 함께 전개한다.

Statistics
저자

Kwangmin Kim

공개

2026년 04월 09일

1 빈도론 검정의 한계와 베이즈 패러다임

빈도론 가설검정은 강력하지만, 결과 해석에 개념적 불편함이 있다.

“p-value = 0.03이면 \(H_0\) 가 참일 확률이 3%인가?”

아니다. p-value는 \(H_0\) 가 참이라고 가정했을 때 현재 관측값만큼 극단적인 데이터가 나올 확률이다. 연구자가 실제로 알고 싶은 것, 즉 “\(H_0\) 가 참일 확률”은 직접 계산되지 않는다.

베이즈 검정은 이 질문에 직접 답한다.

“데이터를 관측한 후 \(H_0\) 가 참일 확률은 \(P(H_0 | \mathbf{x})\) 이다.”

이를 계산하기 위해 베이즈 정리와 사전분포 \(\pi(\theta)\) 를 활용한다 (Casella & Berger, 2002, §8.2.2).


2 베이즈 검정의 기본 구조

2.1 베이즈 추론의 출발점

빈도론에서 \(\theta\) 는 고정된 미지 상수이다. 베이즈에서 \(\theta\)확률변수이며, 사전분포 \(\pi(\theta)\) 로 불확실성을 표현한다.

데이터 \(\mathbf{x}\) 를 관측한 후 베이즈 정리로 사후분포를 계산한다:

\[ \pi(\theta | \mathbf{x}) = \frac{f(\mathbf{x}|\theta) \cdot \pi(\theta)}{m(\mathbf{x})}, \quad m(\mathbf{x}) = \int f(\mathbf{x}|\theta)\,\pi(\theta)\,d\theta \]

여기서: - \(f(\mathbf{x}|\theta)\): 우도함수 (데이터의 생성 모형) - \(\pi(\theta)\): 사전분포 (데이터 관측 전 \(\theta\) 에 대한 믿음) - \(m(\mathbf{x})\): 주변 우도 (normalizing constant) - \(\pi(\theta|\mathbf{x})\): 사후분포 (데이터 관측 후 갱신된 믿음)

2.2 베이즈 검정의 의사결정 규칙

\(H_0: \theta \in \Theta_0\) vs \(H_1: \theta \in \Theta_0^c\) 에서 사후확률을 직접 비교한다:

\[ P(H_0 \text{ 참} | \mathbf{x}) = P(\theta \in \Theta_0 | \mathbf{x}) = \int_{\Theta_0} \pi(\theta|\mathbf{x})\,d\theta \]

\[ P(H_1 \text{ 참} | \mathbf{x}) = P(\theta \in \Theta_0^c | \mathbf{x}) = \int_{\Theta_0^c} \pi(\theta|\mathbf{x})\,d\theta \]

기본 베이즈 의사결정 규칙

\(H_0\) 채택: \(P(\theta \in \Theta_0 | \mathbf{x}) \geq P(\theta \in \Theta_0^c | \mathbf{x})\)

\(H_0\) 기각: \(P(\theta \in \Theta_0^c | \mathbf{x}) > P(\theta \in \Theta_0 | \mathbf{x})\)

즉, 데이터를 보고 난 후 \(H_1\) 이 더 가능성 높다고 판단되면 \(H_0\) 를 기각한다.

직관: 법원에서 “증거를 고려했을 때 피고가 유죄일 확률이 50% 초과”이면 유죄 판결하는 것과 같다. 빈도론이 “무죄라고 가정 시 이 증거가 나올 확률”을 따지는 것과 대비된다.


3 예시 1: 정규분포 평균 검정

\(X_1, \ldots, X_n \overset{iid}{\sim} N(\theta, \sigma^2)\) (분산 \(\sigma^2\) 알려짐), 사전 \(\theta \sim N(\mu_0, \tau^2)\), \(H_0: \theta \leq \theta_0\) vs \(H_1: \theta > \theta_0\)

사후분포 계산: 정규-정규 켤레(conjugate) 결합이므로 사후분포도 정규이다:

\[ \pi(\theta|\bar{x}) \sim N\left(\mu_n,\, \sigma_n^2\right) \]

\[ \mu_n = \frac{n\tau^2\bar{x} + \sigma^2\mu_0}{n\tau^2 + \sigma^2}, \qquad \sigma_n^2 = \frac{\sigma^2\tau^2}{n\tau^2 + \sigma^2} \]

직관적 의미:

  • \(\mu_n\) 은 사전 평균 \(\mu_0\) 과 표본 평균 \(\bar{x}\)가중 평균이다
  • 가중치는 각각의 정밀도(precision = 1/분산)에 비례한다: 사전 정밀도 \(1/\tau^2\), 데이터 정밀도 \(n/\sigma^2\)
  • 표본이 많을수록 (\(n \to \infty\)) 사후 평균은 \(\bar{x}\) 로 수렴 → 데이터가 사전정보를 압도

의사결정: 사후분포가 정규이므로

\[ P(\theta \leq \theta_0 | \bar{x}) = \Phi\left(\frac{\theta_0 - \mu_n}{\sigma_n}\right) \]

\(\mu_0 = \theta_0\) (사전에 \(H_0\), \(H_1\) 각각 50% 확률)으로 놓으면:

\[ P(H_0 | \bar{x}) = P(\theta \leq \theta_0 | \bar{x}) \geq \frac{1}{2} \iff \mu_n \leq \theta_0 \iff \bar{x} \leq \theta_0 \]

이 경우 베이즈 검정 기각역 \(\{\bar{X} > \theta_0\}\) 은 빈도론 검정과 같지만, 해석이 다르다.

빈도론 해석: \(H_0\) 하에서 \(\bar{X}\) 가 이만큼 크게 나올 확률이 \(\alpha\) 이하 베이즈 해석: 데이터를 본 후 \(\theta > \theta_0\) 일 사후 확률이 50% 초과


4 베이즈 인수 (Bayes Factor)

베이즈 인수는 두 가설을 직접 비교하는 핵심 도구이다.

4.1 사전 오즈와 사후 오즈

사전 오즈(prior odds):

\[ \text{Prior Odds} = \frac{P(H_1)}{P(H_0)} = \frac{\pi(\theta \in \Theta_0^c)}{\pi(\theta \in \Theta_0)} \]

사후 오즈(posterior odds):

\[ \text{Posterior Odds} = \frac{P(H_1|\mathbf{x})}{P(H_0|\mathbf{x})} \]

베이즈 인수는 데이터가 오즈를 얼마나 바꾸는지를 나타낸다:

정의: 베이즈 인수 (Bayes Factor)

\[ BF_{10} = \frac{\text{Posterior Odds}}{\text{Prior Odds}} = \frac{P(H_1|\mathbf{x})/P(H_0|\mathbf{x})}{P(H_1)/P(H_0)} \]

동치 표현 (주변 우도의 비율):

\[ BF_{10} = \frac{m_1(\mathbf{x})}{m_0(\mathbf{x})} = \frac{\int_{\Theta_0^c} f(\mathbf{x}|\theta)\,\pi(\theta)\,d\theta}{\int_{\Theta_0} f(\mathbf{x}|\theta)\,\pi(\theta)\,d\theta} \]

따라서: 사후 오즈 = 사전 오즈 × 베이즈 인수

직관: \(BF_{10} = 10\) 이면, 데이터를 관측한 후 \(H_1\) 에 유리한 증거가 10배 강해졌다는 뜻이다.

4.2 베이즈 인수 해석 기준 (Jeffreys 척도)

\(BF_{10}\) 해석
1 미만 \(H_0\) 지지
1 ~ 3 \(H_1\) 에 대한 미약한 증거
3 ~ 10 상당한 증거
10 ~ 30 강한 증거
30 ~ 100 매우 강한 증거
100 이상 결정적 증거

이 척도는 절대적 기준이 아니라 연구 영역에 따라 조정된다.

4.3 베이즈 인수 vs p-value

베이즈 인수는 p-value와 근본적으로 다른 정보를 제공한다.

항목 p-value 베이즈 인수
측정 대상 \(H_0\) 하의 데이터 극단성 \(H_1\)\(H_0\) 의 상대적 증거
사전정보 사용 안 함 사전분포 필요
양방향 해석 \(H_1\) 에 유리한 방향만 \(H_0\), \(H_1\) 양방향 가능
연속 모니터링 불가 (다중검정 문제) 가능 (순차 업데이트)
직관적 해석 어려움 \(H_1\)\(k\) 배 더 잘 지지됨”

5 손실함수 기반 베이즈 검정 (§8.3.5)

5.1 결정이론 관점

가설검정을 결정이론(decision theory) 문제로 보면, 최적 베이즈 검정은 기대 손실(expected loss)을 최소화하는 결정 규칙이다.

행동 공간: \(\{a_0 = \text{H}_0 \text{ 채택},\; a_1 = \text{H}_0 \text{ 기각}\}\)

5.2 0-1 손실 (Symmetric Loss)

\[ L(\theta, a_0) = \begin{cases} 0 & \theta \in \Theta_0 \\ 1 & \theta \in \Theta_0^c \end{cases}, \qquad L(\theta, a_1) = \begin{cases} 1 & \theta \in \Theta_0 \\ 0 & \theta \in \Theta_0^c \end{cases} \]

두 오류가 동일한 비용을 가진다. 이 손실 하의 베이즈 결정 규칙:

사후 기대 손실은

\[ E[L(\theta, a_0)|\mathbf{x}] = P(\theta \in \Theta_0^c | \mathbf{x}) = P(H_1|\mathbf{x}) \]

\[ E[L(\theta, a_1)|\mathbf{x}] = P(\theta \in \Theta_0 | \mathbf{x}) = P(H_0|\mathbf{x}) \]

기대 손실을 최소화하므로:

\[ \text{기각} \iff E[L(\theta,a_1)|\mathbf{x}] < E[L(\theta,a_0)|\mathbf{x}] \iff P(H_0|\mathbf{x}) < P(H_1|\mathbf{x}) \]

즉, 0-1 손실에서 최적 베이즈 검정은 더 높은 사후확률을 가진 가설을 선택한다.

5.3 일반화 0-1 손실 (Asymmetric Loss)

두 오류의 비용이 다를 때 (Casella & Berger, 2002, eq. 8.3.11):

\[ L(\theta, a_0) = \begin{cases} 0 & \theta \in \Theta_0 \\ c_{II} & \theta \in \Theta_0^c \end{cases}, \qquad L(\theta, a_1) = \begin{cases} c_I & \theta \in \Theta_0 \\ 0 & \theta \in \Theta_0^c \end{cases} \]

  • \(c_I\): 제1종 오류 비용 (거짓 기각)
  • \(c_{II}\): 제2종 오류 비용 (거짓 채택)

최적 베이즈 결정:

\[ E[L(\theta,a_1)|\mathbf{x}] < E[L(\theta,a_0)|\mathbf{x}] \]

\[ c_I \cdot P(H_0|\mathbf{x}) < c_{II} \cdot P(H_1|\mathbf{x}) \]

\[ \text{기각} \iff \frac{P(H_1|\mathbf{x})}{P(H_0|\mathbf{x})} > \frac{c_I}{c_{II}} \iff BF_{10} \cdot \frac{P(H_1)}{P(H_0)} > \frac{c_I}{c_{II}} \]

직관: 제1종 오류 비용 \(c_I\) 이 클수록 (잘못된 기각이 심각할수록) 기각 임계값이 높아진다. 임상시험에서 신약 효과가 없는데 승인하는 오류(\(c_I\) 가 큼)보다 효과 있는데 거절하는 오류(\(c_{II}\))가 덜 심각할 수 있다.

5.4 위험 함수 (Risk Function)

일반화 0-1 손실의 위험 함수:

\[ R(\theta, \delta) = \begin{cases} c_I \cdot \beta(\theta) & \theta \in \Theta_0 \\ c_{II} \cdot (1 - \beta(\theta)) & \theta \in \Theta_0^c \end{cases} \]

여기서 \(\beta(\theta) = P_\theta(\mathbf{X} \in R)\) 는 검정력 함수이다.

\(\theta \in \Theta_0\) 에서 위험은 제1종 오류 확률에 비용을 곱한 것이고, \(\theta \in \Theta_0^c\) 에서는 제2종 오류 확률에 비용을 곱한 것이다.


6 예시 2: 포아송 모형 베이즈 검정

\(X_1, \ldots, X_n \overset{iid}{\sim} \text{Poisson}(\lambda)\), 켤레 사전 \(\lambda \sim \text{Gamma}(\alpha, \beta)\), \(H_0: \lambda \leq \lambda_0\) vs \(H_1: \lambda > \lambda_0\)

사후분포: 포아송-감마 켤레 관계에서

\[ \lambda | \mathbf{x} \sim \text{Gamma}\left(\alpha + \sum_{i=1}^n x_i,\; \beta + n\right) \]

베이즈 검정:

\[ P(H_1 | \mathbf{x}) = P\left(\lambda > \lambda_0 \,\Big|\, \lambda \sim \text{Gamma}\!\left(\alpha + \sum x_i,\; \beta + n\right)\right) \]

이를 감마 분포의 CDF로 계산한다.

직관적 업데이트: 사전 믿음 \((\alpha, \beta)\) 에서 출발하여, 데이터 \(\sum x_i\) 를 관측하면 형상(shape) 모수가 \(\alpha + \sum x_i\) 로, 율(rate) 모수가 \(\beta + n\) 으로 업데이트된다. 이 새로운 감마 분포가 사후에 \(\lambda\) 의 불확실성을 표현한다.


7 켤레 사전분포 요약

베이즈 검정에서 켤레 사전분포를 사용하면 사후분포를 닫힌 형태(closed form)로 구할 수 있다.

우도 사전분포 사후분포 업데이트 규칙
\(N(\theta, \sigma^2)\) \(N(\mu_0, \tau^2)\) \(N(\mu_n, \sigma_n^2)\) 정밀도 가중 평균
\(\text{Poisson}(\lambda)\) \(\text{Gamma}(\alpha, \beta)\) \(\text{Gamma}(\alpha+\sum x_i, \beta+n)\) 관측 합 누적
\(\text{Binomial}(n,p)\) \(\text{Beta}(\alpha, \beta)\) \(\text{Beta}(\alpha+s, \beta+n-s)\) 성공·실패 누적
\(\text{Exponential}(\lambda)\) \(\text{Gamma}(\alpha, \beta)\) \(\text{Gamma}(\alpha+n, \beta+\sum x_i)\) 관측 합 누적

8 빈도론 LRT vs 베이즈 검정: 비교 정리

항목 빈도론 LRT 베이즈 검정
\(\theta\) 관점 고정된 미지 상수 확률변수
사전정보 활용 없음 사전분포 \(\pi(\theta)\)
판단 근거 \(P_{\theta_0}(\text{극단적 데이터})\) \(P(H_1|\mathbf{x})\) vs \(P(H_0|\mathbf{x})\)
오류 통제 제1종 오류 \(\alpha\) 고정 손실 함수 기반 기대 손실 최소화
결과 보고 기각/채택 + p-value 사후 확률 또는 베이즈 인수
연속 업데이트 어려움 (다중검정 문제) 자연스러운 순차 업데이트
소표본 성질 정확한 분포에 의존 사전분포 선택에 의존
대표본 수렴 CLT + 점근 이론 사전 영향 감소, 데이터 지배

언제 각각을 사용하는가:

  • 빈도론 선호: 사전정보가 없거나 주관적 사전분포에 대한 거부감이 있을 때, 제1종 오류 통제가 엄격히 요구될 때 (규제 승인 등)
  • 베이즈 선호: 이전 연구, 전문가 지식 등 신뢰할 수 있는 사전정보가 있을 때, 불확실성을 확률로 직접 표현하고 싶을 때, 순차 실험/적응적 설계 등에서

9 코드 예시

9.1 Step 1: 정규 켤레 모형 베이즈 검정

import numpy as np
from scipy.stats import norm

def bayesian_test_normal(X, theta0, sigma2, mu0, tau2, alpha=0.05):
    """
    정규 켤레 베이즈 검정: H0: theta <= theta0 vs H1: theta > theta0

    사전: theta ~ N(mu0, tau2)
    우도: X_i | theta ~ N(theta, sigma2)
    사후: theta | X_bar ~ N(mu_n, sigma2_n)
    """
    n = len(X)
    x_bar = np.mean(X)

    # 사후 모수 계산 (정밀도 가중 평균)
    prec_prior = 1 / tau2
    prec_data  = n / sigma2
    prec_post  = prec_prior + prec_data

    mu_n    = (prec_prior * mu0 + prec_data * x_bar) / prec_post
    sigma2_n = 1 / prec_post

    # 사후 확률
    p_H0 = norm.cdf(theta0, loc=mu_n, scale=np.sqrt(sigma2_n))
    p_H1 = 1 - p_H0

    # 베이즈 인수 계산 (사전 오즈 = 1:1 가정)
    prior_odds  = (1 - norm.cdf(theta0, mu0, np.sqrt(tau2))) / \
                   norm.cdf(theta0, mu0, np.sqrt(tau2))
    post_odds   = p_H1 / p_H0
    bayes_factor = post_odds / prior_odds if prior_odds > 0 else np.inf

    return {
        'posterior_mean': mu_n,
        'posterior_std': np.sqrt(sigma2_n),
        'P(H0|X)': p_H0,
        'P(H1|X)': p_H1,
        'bayes_factor': bayes_factor,
        'reject_H0': p_H1 > p_H0
    }


# 예시: n=20, 실제 theta = 0.5, H0: theta <= 0
np.random.seed(42)
n = 20
true_theta = 0.5
X = np.random.normal(true_theta, 1.0, n)

result = bayesian_test_normal(
    X, theta0=0.0, sigma2=1.0,
    mu0=0.0, tau2=1.0      # 사전: N(0, 1)
)

print("=== 정규 켤레 베이즈 검정 ===")
print(f"표본 평균: {np.mean(X):.3f}")
print(f"사후 평균 μ_n: {result['posterior_mean']:.3f}")
print(f"사후 표준편차 σ_n: {result['posterior_std']:.3f}")
print(f"P(H0|X) = {result['P(H0|X)']:.4f}")
print(f"P(H1|X) = {result['P(H1|X)']:.4f}")
print(f"베이즈 인수 BF10 = {result['bayes_factor']:.2f}")
print(f"H0 기각: {result['reject_H0']}")

9.2 Step 2: 포아송 켤레 모형 + 손실함수 기반 결정

from scipy.stats import gamma as gamma_dist, poisson

def bayesian_test_poisson(X, lambda0, alpha_prior=1.0, beta_prior=1.0,
                           c_I=1.0, c_II=1.0):
    """
    포아송 켤레 베이즈 검정: H0: lambda <= lambda0 vs H1: lambda > lambda0
    손실함수: 일반화 0-1 손실 (c_I, c_II)

    사전: lambda ~ Gamma(alpha_prior, beta_prior)  [rate parametrization]
    사후: lambda | X ~ Gamma(alpha_prior + sum(X), beta_prior + n)
    """
    n = len(X)
    alpha_post = alpha_prior + sum(X)
    beta_post  = beta_prior  + n

    # 사후 확률: P(lambda <= lambda0 | X)
    # Gamma의 CDF (rate parametrization)
    p_H0 = gamma_dist.cdf(lambda0, a=alpha_post, scale=1/beta_post)
    p_H1 = 1 - p_H0

    # 최적 베이즈 결정 (일반화 0-1 손실)
    # 기각 조건: c_I * P(H0|X) < c_II * P(H1|X)
    reject = (c_I * p_H0) < (c_II * p_H1)

    # 사후 평균
    post_mean = alpha_post / beta_post

    return {
        'alpha_post': alpha_post,
        'beta_post': beta_post,
        'posterior_mean': post_mean,
        'P(H0|X)': p_H0,
        'P(H1|X)': p_H1,
        'reject_H0 (0-1 loss)': p_H1 > p_H0,
        f'reject_H0 (c_I={c_I}, c_II={c_II})': reject
    }


# 예시: 실제 lambda = 3, H0: lambda <= 2
np.random.seed(42)
X_pois = poisson.rvs(mu=3, size=15)

result_pois = bayesian_test_poisson(
    X_pois, lambda0=2.0,
    alpha_prior=2.0, beta_prior=1.0,   # 사전: Gamma(2,1), 평균 = 2
    c_I=3.0, c_II=1.0                  # 거짓 기각 비용이 3배
)

print("\n=== 포아송 켤레 베이즈 검정 ===")
print(f"표본 평균: {np.mean(X_pois):.2f}")
print(f"사후 평균 E[λ|X]: {result_pois['posterior_mean']:.3f}")
print(f"P(H0|X) = {result_pois['P(H0|X)']:.4f}")
print(f"P(H1|X) = {result_pois['P(H1|X)']:.4f}")
print(f"H0 기각 (0-1 손실): {result_pois['reject_H0 (0-1 loss)']}")
print(f"H0 기각 (c_I=3, c_II=1): {result_pois['reject_H0 (c_I=3, c_II=1)']}")
# c_I가 크면 기각에 더 신중해짐

9.3 Step 3: 베이즈 인수 시뮬레이션 (사전 민감도 분석)

import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt

# 사전 분산 tau2에 따른 베이즈 인수 변화
np.random.seed(42)
X = np.random.normal(0.5, 1.0, 20)  # 실제 theta = 0.5

tau2_values = [0.1, 0.5, 1.0, 2.0, 5.0, 10.0]
results = []
for tau2 in tau2_values:
    r = bayesian_test_normal(X, theta0=0.0, sigma2=1.0, mu0=0.0, tau2=tau2)
    results.append({
        'tau2': tau2,
        'BF10': r['bayes_factor'],
        'P(H1|X)': r['P(H1|X)']
    })

for r in results:
    print(f"tau2={r['tau2']:.1f}: BF10={r['BF10']:.2f}, P(H1|X)={r['P(H1|X)']:.4f}")

# 사전 분산이 커질수록 (정보량 낮은 사전) 베이즈 인수가 어떻게 변하는지 확인

9.4 R 코드: BayesFactor 패키지 활용

library(BayesFactor)
library(ggplot2)

# 단일 표본 베이즈 t-검정 (BayesFactor 패키지)
set.seed(42)
x <- rnorm(20, mean = 0.5, sd = 1.0)

# H0: mu = 0 vs H1: mu != 0 (Cauchy 사전 기반)
bf_result <- ttestBF(x = x, mu = 0)
print(bf_result)
# BF10: 데이터가 H1을 얼마나 더 지지하는지

# 단방향 검정
bf_onesided <- ttestBF(x = x, mu = 0, nullInterval = c(-Inf, 0))
print(bf_onesided)  # H1: mu > 0

# 사후 분포 샘플링 (MCMC)
posterior_samples <- posterior(bf_result, iterations = 10000)
summary(posterior_samples)

# 포아송 베이즈 검정 (수동 계산)
bayesian_poisson_test <- function(x, lambda0, alpha_prior, beta_prior,
                                   c_I = 1, c_II = 1) {
  n <- length(x)
  alpha_post <- alpha_prior + sum(x)
  beta_post  <- beta_prior + n

  p_H0 <- pgamma(lambda0, shape = alpha_post, rate = beta_post)
  p_H1 <- 1 - p_H0

  # 최적 결정 (일반화 0-1 손실)
  reject <- (c_I * p_H0) < (c_II * p_H1)

  list(
    posterior_mean = alpha_post / beta_post,
    p_H0 = p_H0, p_H1 = p_H1,
    reject = reject
  )
}

x_pois <- rpois(15, lambda = 3)
res <- bayesian_poisson_test(x_pois, lambda0 = 2,
                              alpha_prior = 2, beta_prior = 1,
                              c_I = 3, c_II = 1)
cat("사후 평균:", res$posterior_mean, "\n")
cat("P(H0|X):", res$p_H0, "\n")
cat("P(H1|X):", res$p_H1, "\n")
cat("H0 기각:", res$reject, "\n")

10 베이즈 검정의 한계와 주의사항

10.1 사전분포 민감도

베이즈 검정의 결론은 사전분포 선택에 달려 있다. 특히:

  1. 점 귀무가설 (\(H_0: \theta = \theta_0\), 즉 단순가설): 연속형 사전분포를 사용하면 \(P(H_0) = 0\) 이 되어 검정이 불가능하다. 이 경우 \(\theta_0\) 에 점 질량(point mass)을 부여하는 혼합 사전분포가 필요하다:

\[ \pi(\theta) = p_0 \cdot \delta(\theta - \theta_0) + (1 - p_0) \cdot g(\theta) \]

  1. 정보 없는 사전분포(non-informative prior): 분산이 큰 정규분포 등 “약한” 사전분포를 사용하면 베이즈 인수가 항상 \(H_0\) 를 지지하는 방향으로 편향될 수 있다 (린들리 역설, Lindley’s paradox).

10.2 린들리 역설 (Lindley’s Paradox)

표본이 커질수록 p-value는 작아지는 경향이 있지만, 베이즈 인수는 \(H_0\) 를 더 강하게 지지할 수 있다. 이 역설은 두 프레임워크의 근본적 차이를 보여준다.

예시: \(n = 50000\), \(\bar{X} = 0.01\), \(\sigma^2 = 1\), \(H_0: \mu = 0\) - p-value (Z-검정): \(p \approx 0.025\) → 기각 - 베이즈 인수 (약한 사전): \(BF_{10} \approx 0.3\)\(H_0\) 지지

표본 크기가 커지면 통계적 유의성(p-value)과 실질적 유의성(효과 크기)의 간극이 벌어진다.


11 정리: 베이즈 검정의 세 가지 관점

관점 핵심 공식 해석
사후확률 비교 \(P(H_1|\mathbf{x})\) vs \(P(H_0|\mathbf{x})\) 어느 가설이 더 그럴듯한가
베이즈 인수 \(BF_{10} = \frac{m_1(\mathbf{x})}{m_0(\mathbf{x})}\) 데이터가 오즈를 얼마나 바꿨는가
손실 최소화 \(\text{기각} \iff c_I P(H_0|\mathbf{x}) < c_{II} P(H_1|\mathbf{x})\) 기대 비용을 최소화하는 결정

세 관점은 동일한 베이즈 패러다임에서 나오며, 적용 맥락에 따라 적합한 표현을 선택한다.


12 관련 주제

선행 지식

후속 주제

관련 개념

Subscribe

Enjoy this blog? Get notified of new posts by email: