Kwangmin Kim - 베이즈 검정 — 사후확률로 가설을 판단하는 방법

1 빈도론 검정의 한계와 베이즈 패러다임

빈도론 가설검정은 강력하지만, 결과 해석에 개념적 불편함이 있다.

“p-value = 0.03이면 \(H_0\) 가 참일 확률이 3%인가?”

아니다. p-value는 \(H_0\) 가 참이라고 가정했을 때 현재 관측값만큼 극단적인 데이터가 나올 확률이다. 연구자가 실제로 알고 싶은 것, 즉 “\(H_0\) 가 참일 확률”은 직접 계산되지 않는다.

베이즈 검정은 이 질문에 직접 답한다.

“데이터를 관측한 후 \(H_0\) 가 참일 확률은 \(P(H_0 | \mathbf{x})\) 이다.”

이를 계산하기 위해 베이즈 정리와 사전분포 \(\pi(\theta)\) 를 활용한다 (Casella & Berger, 2002, §8.2.2).

2 베이즈 검정의 기본 구조

2.1 베이즈 추론의 출발점

빈도론에서 \(\theta\) 는 고정된 미지 상수이다. 베이즈에서 \(\theta\) 는 확률변수이며, 사전분포 \(\pi(\theta)\) 로 불확실성을 표현한다.

데이터 \(\mathbf{x}\) 를 관측한 후 베이즈 정리로 사후분포를 계산한다:

\[ \pi(\theta | \mathbf{x}) = \frac{f(\mathbf{x}|\theta) \cdot \pi(\theta)}{m(\mathbf{x})}, \quad m(\mathbf{x}) = \int f(\mathbf{x}|\theta)\,\pi(\theta)\,d\theta \]

여기서: - \(f(\mathbf{x}|\theta)\): 우도함수 (데이터의 생성 모형) - \(\pi(\theta)\): 사전분포 (데이터 관측 전 \(\theta\) 에 대한 믿음) - \(m(\mathbf{x})\): 주변 우도 (normalizing constant) - \(\pi(\theta|\mathbf{x})\): 사후분포 (데이터 관측 후 갱신된 믿음)

2.2 베이즈 검정의 의사결정 규칙

\(H_0: \theta \in \Theta_0\) vs \(H_1: \theta \in \Theta_0^c\) 에서 사후확률을 직접 비교한다:

\[ P(H_0 \text{ 참} | \mathbf{x}) = P(\theta \in \Theta_0 | \mathbf{x}) = \int_{\Theta_0} \pi(\theta|\mathbf{x})\,d\theta \]

\[ P(H_1 \text{ 참} | \mathbf{x}) = P(\theta \in \Theta_0^c | \mathbf{x}) = \int_{\Theta_0^c} \pi(\theta|\mathbf{x})\,d\theta \]

기본 베이즈 의사결정 규칙

\(H_0\) 채택: \(P(\theta \in \Theta_0 | \mathbf{x}) \geq P(\theta \in \Theta_0^c | \mathbf{x})\)

\(H_0\) 기각: \(P(\theta \in \Theta_0^c | \mathbf{x}) > P(\theta \in \Theta_0 | \mathbf{x})\)

즉, 데이터를 보고 난 후 \(H_1\) 이 더 가능성 높다고 판단되면 \(H_0\) 를 기각한다.

직관: 법원에서 “증거를 고려했을 때 피고가 유죄일 확률이 50% 초과”이면 유죄 판결하는 것과 같다. 빈도론이 “무죄라고 가정 시 이 증거가 나올 확률”을 따지는 것과 대비된다.

3 예시 1: 정규분포 평균 검정

\(X_1, \ldots, X_n \overset{iid}{\sim} N(\theta, \sigma^2)\) (분산 \(\sigma^2\) 알려짐), 사전 \(\theta \sim N(\mu_0, \tau^2)\), \(H_0: \theta \leq \theta_0\) vs \(H_1: \theta > \theta_0\)

사후분포 계산: 정규-정규 켤레(conjugate) 결합이므로 사후분포도 정규이다:

\[ \pi(\theta|\bar{x}) \sim N\left(\mu_n,\, \sigma_n^2\right) \]

\[ \mu_n = \frac{n\tau^2\bar{x} + \sigma^2\mu_0}{n\tau^2 + \sigma^2}, \qquad \sigma_n^2 = \frac{\sigma^2\tau^2}{n\tau^2 + \sigma^2} \]

직관적 의미:

\(\mu_n\) 은 사전 평균 \(\mu_0\) 과 표본 평균 \(\bar{x}\) 의 가중 평균이다
가중치는 각각의 정밀도(precision = 1/분산)에 비례한다: 사전 정밀도 \(1/\tau^2\), 데이터 정밀도 \(n/\sigma^2\)
표본이 많을수록 (\(n \to \infty\)) 사후 평균은 \(\bar{x}\) 로 수렴 → 데이터가 사전정보를 압도

의사결정: 사후분포가 정규이므로

\[ P(\theta \leq \theta_0 | \bar{x}) = \Phi\left(\frac{\theta_0 - \mu_n}{\sigma_n}\right) \]

\(\mu_0 = \theta_0\) (사전에 \(H_0\), \(H_1\) 각각 50% 확률)으로 놓으면:

\[ P(H_0 | \bar{x}) = P(\theta \leq \theta_0 | \bar{x}) \geq \frac{1}{2} \iff \mu_n \leq \theta_0 \iff \bar{x} \leq \theta_0 \]

이 경우 베이즈 검정 기각역 \(\{\bar{X} > \theta_0\}\) 은 빈도론 검정과 같지만, 해석이 다르다.

빈도론 해석: \(H_0\) 하에서 \(\bar{X}\) 가 이만큼 크게 나올 확률이 \(\alpha\) 이하 베이즈 해석: 데이터를 본 후 \(\theta > \theta_0\) 일 사후 확률이 50% 초과

4 베이즈 인수 (Bayes Factor)

베이즈 인수는 두 가설을 직접 비교하는 핵심 도구이다.

4.1 사전 오즈와 사후 오즈

사전 오즈(prior odds):

\[ \text{Prior Odds} = \frac{P(H_1)}{P(H_0)} = \frac{\pi(\theta \in \Theta_0^c)}{\pi(\theta \in \Theta_0)} \]

사후 오즈(posterior odds):

\[ \text{Posterior Odds} = \frac{P(H_1|\mathbf{x})}{P(H_0|\mathbf{x})} \]

베이즈 인수는 데이터가 오즈를 얼마나 바꾸는지를 나타낸다:

정의: 베이즈 인수 (Bayes Factor)

\[ BF_{10} = \frac{\text{Posterior Odds}}{\text{Prior Odds}} = \frac{P(H_1|\mathbf{x})/P(H_0|\mathbf{x})}{P(H_1)/P(H_0)} \]

동치 표현 (주변 우도의 비율):

\[ BF_{10} = \frac{m_1(\mathbf{x})}{m_0(\mathbf{x})} = \frac{\int_{\Theta_0^c} f(\mathbf{x}|\theta)\,\pi(\theta)\,d\theta}{\int_{\Theta_0} f(\mathbf{x}|\theta)\,\pi(\theta)\,d\theta} \]

따라서: 사후 오즈 = 사전 오즈 × 베이즈 인수

직관: \(BF_{10} = 10\) 이면, 데이터를 관측한 후 \(H_1\) 에 유리한 증거가 10배 강해졌다는 뜻이다.

4.2 베이즈 인수 해석 기준 (Jeffreys 척도)

\(BF_{10}\)	해석
1 미만	\(H_0\) 지지
1 ~ 3	\(H_1\) 에 대한 미약한 증거
3 ~ 10	상당한 증거
10 ~ 30	강한 증거
30 ~ 100	매우 강한 증거
100 이상	결정적 증거

이 척도는 절대적 기준이 아니라 연구 영역에 따라 조정된다.

4.3 베이즈 인수 vs p-value

베이즈 인수는 p-value와 근본적으로 다른 정보를 제공한다.

항목	p-value	베이즈 인수
측정 대상	\(H_0\) 하의 데이터 극단성	\(H_1\) 대 \(H_0\) 의 상대적 증거
사전정보	사용 안 함	사전분포 필요
양방향 해석	\(H_1\) 에 유리한 방향만	\(H_0\), \(H_1\) 양방향 가능
연속 모니터링	불가 (다중검정 문제)	가능 (순차 업데이트)
직관적 해석	어려움	“\(H_1\) 이 \(k\) 배 더 잘 지지됨”

5 손실함수 기반 베이즈 검정 (§8.3.5)

5.1 결정이론 관점

가설검정을 결정이론(decision theory) 문제로 보면, 최적 베이즈 검정은 기대 손실(expected loss)을 최소화하는 결정 규칙이다.

행동 공간: \(\{a_0 = \text{H}_0 \text{ 채택},\; a_1 = \text{H}_0 \text{ 기각}\}\)

5.2 0-1 손실 (Symmetric Loss)

\[ L(\theta, a_0) = \begin{cases} 0 & \theta \in \Theta_0 \\ 1 & \theta \in \Theta_0^c \end{cases}, \qquad L(\theta, a_1) = \begin{cases} 1 & \theta \in \Theta_0 \\ 0 & \theta \in \Theta_0^c \end{cases} \]

두 오류가 동일한 비용을 가진다. 이 손실 하의 베이즈 결정 규칙:

사후 기대 손실은

\[ E[L(\theta, a_0)|\mathbf{x}] = P(\theta \in \Theta_0^c | \mathbf{x}) = P(H_1|\mathbf{x}) \]

\[ E[L(\theta, a_1)|\mathbf{x}] = P(\theta \in \Theta_0 | \mathbf{x}) = P(H_0|\mathbf{x}) \]

기대 손실을 최소화하므로:

\[ \text{기각} \iff E[L(\theta,a_1)|\mathbf{x}] < E[L(\theta,a_0)|\mathbf{x}] \iff P(H_0|\mathbf{x}) < P(H_1|\mathbf{x}) \]

즉, 0-1 손실에서 최적 베이즈 검정은 더 높은 사후확률을 가진 가설을 선택한다.

5.3 일반화 0-1 손실 (Asymmetric Loss)

두 오류의 비용이 다를 때 (Casella & Berger, 2002, eq. 8.3.11):

\[ L(\theta, a_0) = \begin{cases} 0 & \theta \in \Theta_0 \\ c_{II} & \theta \in \Theta_0^c \end{cases}, \qquad L(\theta, a_1) = \begin{cases} c_I & \theta \in \Theta_0 \\ 0 & \theta \in \Theta_0^c \end{cases} \]

\(c_I\): 제1종 오류 비용 (거짓 기각)
\(c_{II}\): 제2종 오류 비용 (거짓 채택)

최적 베이즈 결정:

\[ E[L(\theta,a_1)|\mathbf{x}] < E[L(\theta,a_0)|\mathbf{x}] \]

\[ c_I \cdot P(H_0|\mathbf{x}) < c_{II} \cdot P(H_1|\mathbf{x}) \]

\[ \text{기각} \iff \frac{P(H_1|\mathbf{x})}{P(H_0|\mathbf{x})} > \frac{c_I}{c_{II}} \iff BF_{10} \cdot \frac{P(H_1)}{P(H_0)} > \frac{c_I}{c_{II}} \]

직관: 제1종 오류 비용 \(c_I\) 이 클수록 (잘못된 기각이 심각할수록) 기각 임계값이 높아진다. 임상시험에서 신약 효과가 없는데 승인하는 오류(\(c_I\) 가 큼)보다 효과 있는데 거절하는 오류(\(c_{II}\))가 덜 심각할 수 있다.

5.4 위험 함수 (Risk Function)

일반화 0-1 손실의 위험 함수:

\[ R(\theta, \delta) = \begin{cases} c_I \cdot \beta(\theta) & \theta \in \Theta_0 \\ c_{II} \cdot (1 - \beta(\theta)) & \theta \in \Theta_0^c \end{cases} \]

여기서 \(\beta(\theta) = P_\theta(\mathbf{X} \in R)\) 는 검정력 함수이다.

\(\theta \in \Theta_0\) 에서 위험은 제1종 오류 확률에 비용을 곱한 것이고, \(\theta \in \Theta_0^c\) 에서는 제2종 오류 확률에 비용을 곱한 것이다.

6 예시 2: 포아송 모형 베이즈 검정

\(X_1, \ldots, X_n \overset{iid}{\sim} \text{Poisson}(\lambda)\), 켤레 사전 \(\lambda \sim \text{Gamma}(\alpha, \beta)\), \(H_0: \lambda \leq \lambda_0\) vs \(H_1: \lambda > \lambda_0\)

사후분포: 포아송-감마 켤레 관계에서

\[ \lambda | \mathbf{x} \sim \text{Gamma}\left(\alpha + \sum_{i=1}^n x_i,\; \beta + n\right) \]

베이즈 검정:

\[ P(H_1 | \mathbf{x}) = P\left(\lambda > \lambda_0 \,\Big|\, \lambda \sim \text{Gamma}\!\left(\alpha + \sum x_i,\; \beta + n\right)\right) \]

이를 감마 분포의 CDF로 계산한다.

직관적 업데이트: 사전 믿음 \((\alpha, \beta)\) 에서 출발하여, 데이터 \(\sum x_i\) 를 관측하면 형상(shape) 모수가 \(\alpha + \sum x_i\) 로, 율(rate) 모수가 \(\beta + n\) 으로 업데이트된다. 이 새로운 감마 분포가 사후에 \(\lambda\) 의 불확실성을 표현한다.

7 켤레 사전분포 요약

베이즈 검정에서 켤레 사전분포를 사용하면 사후분포를 닫힌 형태(closed form)로 구할 수 있다.

우도	사전분포	사후분포	업데이트 규칙
\(N(\theta, \sigma^2)\)	\(N(\mu_0, \tau^2)\)	\(N(\mu_n, \sigma_n^2)\)	정밀도 가중 평균
\(\text{Poisson}(\lambda)\)	\(\text{Gamma}(\alpha, \beta)\)	\(\text{Gamma}(\alpha+\sum x_i, \beta+n)\)	관측 합 누적
\(\text{Binomial}(n,p)\)	\(\text{Beta}(\alpha, \beta)\)	\(\text{Beta}(\alpha+s, \beta+n-s)\)	성공·실패 누적
\(\text{Exponential}(\lambda)\)	\(\text{Gamma}(\alpha, \beta)\)	\(\text{Gamma}(\alpha+n, \beta+\sum x_i)\)	관측 합 누적

8 빈도론 LRT vs 베이즈 검정: 비교 정리

항목	빈도론 LRT	베이즈 검정
\(\theta\) 관점	고정된 미지 상수	확률변수
사전정보 활용	없음	사전분포 \(\pi(\theta)\)
판단 근거	\(P_{\theta_0}(\text{극단적 데이터})\)	\(P(H_1\|\mathbf{x})\) vs \(P(H_0\|\mathbf{x})\)
오류 통제	제1종 오류 \(\alpha\) 고정	손실 함수 기반 기대 손실 최소화
결과 보고	기각/채택 + p-value	사후 확률 또는 베이즈 인수
연속 업데이트	어려움 (다중검정 문제)	자연스러운 순차 업데이트
소표본 성질	정확한 분포에 의존	사전분포 선택에 의존
대표본 수렴	CLT + 점근 이론	사전 영향 감소, 데이터 지배

언제 각각을 사용하는가:

빈도론 선호: 사전정보가 없거나 주관적 사전분포에 대한 거부감이 있을 때, 제1종 오류 통제가 엄격히 요구될 때 (규제 승인 등)
베이즈 선호: 이전 연구, 전문가 지식 등 신뢰할 수 있는 사전정보가 있을 때, 불확실성을 확률로 직접 표현하고 싶을 때, 순차 실험/적응적 설계 등에서

9 코드 예시

9.1 Step 1: 정규 켤레 모형 베이즈 검정

import numpy as np
from scipy.stats import norm

def bayesian_test_normal(X, theta0, sigma2, mu0, tau2, alpha=0.05):
    """
    정규 켤레 베이즈 검정: H0: theta <= theta0 vs H1: theta > theta0

    사전: theta ~ N(mu0, tau2)
    우도: X_i | theta ~ N(theta, sigma2)
    사후: theta | X_bar ~ N(mu_n, sigma2_n)
    """
    n = len(X)
    x_bar = np.mean(X)

    # 사후 모수 계산 (정밀도 가중 평균)
    prec_prior = 1 / tau2
    prec_data  = n / sigma2
    prec_post  = prec_prior + prec_data

    mu_n    = (prec_prior * mu0 + prec_data * x_bar) / prec_post
    sigma2_n = 1 / prec_post

    # 사후 확률
    p_H0 = norm.cdf(theta0, loc=mu_n, scale=np.sqrt(sigma2_n))
    p_H1 = 1 - p_H0

    # 베이즈 인수 계산 (사전 오즈 = 1:1 가정)
    prior_odds  = (1 - norm.cdf(theta0, mu0, np.sqrt(tau2))) / \
                   norm.cdf(theta0, mu0, np.sqrt(tau2))
    post_odds   = p_H1 / p_H0
    bayes_factor = post_odds / prior_odds if prior_odds > 0 else np.inf

    return {
        'posterior_mean': mu_n,
        'posterior_std': np.sqrt(sigma2_n),
        'P(H0|X)': p_H0,
        'P(H1|X)': p_H1,
        'bayes_factor': bayes_factor,
        'reject_H0': p_H1 > p_H0
    }


# 예시: n=20, 실제 theta = 0.5, H0: theta <= 0
np.random.seed(42)
n = 20
true_theta = 0.5
X = np.random.normal(true_theta, 1.0, n)

result = bayesian_test_normal(
    X, theta0=0.0, sigma2=1.0,
    mu0=0.0, tau2=1.0      # 사전: N(0, 1)
)

print("=== 정규 켤레 베이즈 검정 ===")
print(f"표본 평균: {np.mean(X):.3f}")
print(f"사후 평균 μ_n: {result['posterior_mean']:.3f}")
print(f"사후 표준편차 σ_n: {result['posterior_std']:.3f}")
print(f"P(H0|X) = {result['P(H0|X)']:.4f}")
print(f"P(H1|X) = {result['P(H1|X)']:.4f}")
print(f"베이즈 인수 BF10 = {result['bayes_factor']:.2f}")
print(f"H0 기각: {result['reject_H0']}")

9.2 Step 2: 포아송 켤레 모형 + 손실함수 기반 결정

from scipy.stats import gamma as gamma_dist, poisson

def bayesian_test_poisson(X, lambda0, alpha_prior=1.0, beta_prior=1.0,
                           c_I=1.0, c_II=1.0):
    """
    포아송 켤레 베이즈 검정: H0: lambda <= lambda0 vs H1: lambda > lambda0
    손실함수: 일반화 0-1 손실 (c_I, c_II)

    사전: lambda ~ Gamma(alpha_prior, beta_prior)  [rate parametrization]
    사후: lambda | X ~ Gamma(alpha_prior + sum(X), beta_prior + n)
    """
    n = len(X)
    alpha_post = alpha_prior + sum(X)
    beta_post  = beta_prior  + n

    # 사후 확률: P(lambda <= lambda0 | X)
    # Gamma의 CDF (rate parametrization)
    p_H0 = gamma_dist.cdf(lambda0, a=alpha_post, scale=1/beta_post)
    p_H1 = 1 - p_H0

    # 최적 베이즈 결정 (일반화 0-1 손실)
    # 기각 조건: c_I * P(H0|X) < c_II * P(H1|X)
    reject = (c_I * p_H0) < (c_II * p_H1)

    # 사후 평균
    post_mean = alpha_post / beta_post

    return {
        'alpha_post': alpha_post,
        'beta_post': beta_post,
        'posterior_mean': post_mean,
        'P(H0|X)': p_H0,
        'P(H1|X)': p_H1,
        'reject_H0 (0-1 loss)': p_H1 > p_H0,
        f'reject_H0 (c_I={c_I}, c_II={c_II})': reject
    }


# 예시: 실제 lambda = 3, H0: lambda <= 2
np.random.seed(42)
X_pois = poisson.rvs(mu=3, size=15)

result_pois = bayesian_test_poisson(
    X_pois, lambda0=2.0,
    alpha_prior=2.0, beta_prior=1.0,   # 사전: Gamma(2,1), 평균 = 2
    c_I=3.0, c_II=1.0                  # 거짓 기각 비용이 3배
)

print("\n=== 포아송 켤레 베이즈 검정 ===")
print(f"표본 평균: {np.mean(X_pois):.2f}")
print(f"사후 평균 E[λ|X]: {result_pois['posterior_mean']:.3f}")
print(f"P(H0|X) = {result_pois['P(H0|X)']:.4f}")
print(f"P(H1|X) = {result_pois['P(H1|X)']:.4f}")
print(f"H0 기각 (0-1 손실): {result_pois['reject_H0 (0-1 loss)']}")
print(f"H0 기각 (c_I=3, c_II=1): {result_pois['reject_H0 (c_I=3, c_II=1)']}")
# c_I가 크면 기각에 더 신중해짐

9.3 Step 3: 베이즈 인수 시뮬레이션 (사전 민감도 분석)

import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt

# 사전 분산 tau2에 따른 베이즈 인수 변화
np.random.seed(42)
X = np.random.normal(0.5, 1.0, 20)  # 실제 theta = 0.5

tau2_values = [0.1, 0.5, 1.0, 2.0, 5.0, 10.0]
results = []
for tau2 in tau2_values:
    r = bayesian_test_normal(X, theta0=0.0, sigma2=1.0, mu0=0.0, tau2=tau2)
    results.append({
        'tau2': tau2,
        'BF10': r['bayes_factor'],
        'P(H1|X)': r['P(H1|X)']
    })

for r in results:
    print(f"tau2={r['tau2']:.1f}: BF10={r['BF10']:.2f}, P(H1|X)={r['P(H1|X)']:.4f}")

# 사전 분산이 커질수록 (정보량 낮은 사전) 베이즈 인수가 어떻게 변하는지 확인

9.4 R 코드: BayesFactor 패키지 활용

library(BayesFactor)
library(ggplot2)

# 단일 표본 베이즈 t-검정 (BayesFactor 패키지)
set.seed(42)
x <- rnorm(20, mean = 0.5, sd = 1.0)

# H0: mu = 0 vs H1: mu != 0 (Cauchy 사전 기반)
bf_result <- ttestBF(x = x, mu = 0)
print(bf_result)
# BF10: 데이터가 H1을 얼마나 더 지지하는지

# 단방향 검정
bf_onesided <- ttestBF(x = x, mu = 0, nullInterval = c(-Inf, 0))
print(bf_onesided)  # H1: mu > 0

# 사후 분포 샘플링 (MCMC)
posterior_samples <- posterior(bf_result, iterations = 10000)
summary(posterior_samples)

# 포아송 베이즈 검정 (수동 계산)
bayesian_poisson_test <- function(x, lambda0, alpha_prior, beta_prior,
                                   c_I = 1, c_II = 1) {
  n <- length(x)
  alpha_post <- alpha_prior + sum(x)
  beta_post  <- beta_prior + n

  p_H0 <- pgamma(lambda0, shape = alpha_post, rate = beta_post)
  p_H1 <- 1 - p_H0

  # 최적 결정 (일반화 0-1 손실)
  reject <- (c_I * p_H0) < (c_II * p_H1)

  list(
    posterior_mean = alpha_post / beta_post,
    p_H0 = p_H0, p_H1 = p_H1,
    reject = reject
  )
}

x_pois <- rpois(15, lambda = 3)
res <- bayesian_poisson_test(x_pois, lambda0 = 2,
                              alpha_prior = 2, beta_prior = 1,
                              c_I = 3, c_II = 1)
cat("사후 평균:", res$posterior_mean, "\n")
cat("P(H0|X):", res$p_H0, "\n")
cat("P(H1|X):", res$p_H1, "\n")
cat("H0 기각:", res$reject, "\n")

10 베이즈 검정의 한계와 주의사항

10.1 사전분포 민감도

베이즈 검정의 결론은 사전분포 선택에 달려 있다. 특히:

점 귀무가설 (\(H_0: \theta = \theta_0\), 즉 단순가설): 연속형 사전분포를 사용하면 \(P(H_0) = 0\) 이 되어 검정이 불가능하다. 이 경우 \(\theta_0\) 에 점 질량(point mass)을 부여하는 혼합 사전분포가 필요하다:

\[ \pi(\theta) = p_0 \cdot \delta(\theta - \theta_0) + (1 - p_0) \cdot g(\theta) \]

정보 없는 사전분포(non-informative prior): 분산이 큰 정규분포 등 “약한” 사전분포를 사용하면 베이즈 인수가 항상 \(H_0\) 를 지지하는 방향으로 편향될 수 있다 (린들리 역설, Lindley’s paradox).

10.2 린들리 역설 (Lindley’s Paradox)

표본이 커질수록 p-value는 작아지는 경향이 있지만, 베이즈 인수는 \(H_0\) 를 더 강하게 지지할 수 있다. 이 역설은 두 프레임워크의 근본적 차이를 보여준다.

예시: \(n = 50000\), \(\bar{X} = 0.01\), \(\sigma^2 = 1\), \(H_0: \mu = 0\) - p-value (Z-검정): \(p \approx 0.025\) → 기각 - 베이즈 인수 (약한 사전): \(BF_{10} \approx 0.3\) → \(H_0\) 지지

표본 크기가 커지면 통계적 유의성(p-value)과 실질적 유의성(효과 크기)의 간극이 벌어진다.

11 정리: 베이즈 검정의 세 가지 관점

관점	핵심 공식	해석
사후확률 비교	\(P(H_1\|\mathbf{x})\) vs \(P(H_0\|\mathbf{x})\)	어느 가설이 더 그럴듯한가
베이즈 인수	\(BF_{10} = \frac{m_1(\mathbf{x})}{m_0(\mathbf{x})}\)	데이터가 오즈를 얼마나 바꿨는가
손실 최소화	\(\text{기각} \iff c_I P(H_0\|\mathbf{x}) < c_{II} P(H_1\|\mathbf{x})\)	기대 비용을 최소화하는 결정

세 관점은 동일한 베이즈 패러다임에서 나오며, 적용 맥락에 따라 적합한 표현을 선택한다.

12 관련 주제

선행 지식

후속 주제

관련 개념