Kwangmin Kim - 이항분포 — Genesis·Cumulants·극한·변환

1 왜 이항분포를 GLM 관점에서 다시 보는가

이항분포 자체는 기초 통계의 표준 주제다. 평균 \(m\pi\), 분산 \(m\pi(1-\pi)\), 베르누이 합 — 익숙한 이야기. 그런데 McCullagh & Nelder §4.2 는 같은 분포를 GLM 모델링의 맥락 에서 다시 정리한다. 동기는 세 가지.

정준 모수화의 근거: 왜 logit 이 자연스러운가? 지수족 표현에서 \(\theta = \log\{\pi/(1-\pi)\}\) 가 정준 모수로 드러나는 구조적 이유.
점근 근사의 품질: 정규 근사 / Poisson 근사 각각의 오차 차수 를 명확히 해야 실무에서 어떤 근사를 언제 쓸지 판단 가능.
변환의 실용성: 경험 로짓 변환 (empirical logistic) 이 왜 \(c = 1/2\) 여야 편향이 \(O(m^{-2})\) 가 되는가 — GLM 이전 시대의 “작은 표본 회귀” 트릭의 수학적 근거.

이 포스트는 §4.2 의 다섯 하위절 (발생·cumulants·정규 극한·Poisson 극한·변환) 을 통과하며, 각 결과의 주장·유도 핵심·실무 의의 를 정리한다.

직관: 이항분포는 “범위가 \(\{0, 1, \dots, m\}\) 으로 갇힌 카운트”. 이 경계성이 모든 수학적 특수성의 뿌리다. 극한은 경계를 풀어내며 (\(m \to \infty\) 로 무한 또는 \(\pi \to 0\) 으로 희박), 변환은 유한 샘플에서도 경계 효과를 완화한다.

2 두 가지 발생 경로 (Genesis, §4.2.1)

이항분포는 실무에서 두 가지 경로로 등장한다. 각 경로가 다른 해석과 데이터 구조를 함의한다.

2.1 경로 1: 두 Poisson 의 조건부

\(Y_1 \sim \mathrm{Poi}(\mu_1)\), \(Y_2 \sim \mathrm{Poi}(\mu_2)\) 독립. 그러면

\[ Y_1 + Y_2 \sim \mathrm{Poi}(\mu_1 + \mu_2) \]

(Poisson 의 재현성). 조건부 분포

\[ P(Y_1 = y\,|\, Y_1 + Y_2 = m) \;=\; \binom{m}{y}\pi^y(1-\pi)^{m-y},\quad \pi = \frac{\mu_1}{\mu_1 + \mu_2} \]

놀라운 관찰: 조건부 분포는 \(\mu_1 + \mu_2\) 에 무관 하고 비율 \(\pi\) 에만 의존.

2.1.1 왜 중요한가

이 결과가 Poisson 로그선형 모형과 로지스틱 회귀의 수학적 동치성을 만든다. 총계 \(m = Y_1 + Y_2\) 를 조건으로 주면 Poisson 문제가 이항 문제로 환원된다. Ch.6 (로그선형) 과 Ch.4 (이항) 가 같은 framework 로 풀리는 이유.

2.1.2 실무 예시

분할표 분석: 행 총계를 고정한 조건부 분석.
Case-control: 전체 샘플 크기를 고정한 후 case 수의 분포.
Multinomial logit: \(K\) 범주 Poisson 의 조건부 → multinomial.

직관: “카운트 두 개의 합이 고정” 이라는 조건이 Poisson 의 척도 (\(\mu\) 의 절대 크기) 를 소거하고 비율만 남긴다. GLM 에서 offset 이나 주변 총계를 처리하는 방식의 이론적 근거.

2.2 경로 2: 동질 Bernoulli 의 합

\(Y_1, \dots, Y_m\) 이 iid \(\mathrm{Bern}(\pi)\) 이면 \(Y = \sum Y_i \sim \mathrm{Bin}(m, \pi)\).

2.2.1 Covariate Class 의 자연스러운 구조

§4.1.2 의 covariate class 집계가 이 경로. 같은 공변량 값을 공유하는 개체들이 동질 + 독립 이면 그 합이 이항. 이는 GLM 의 데이터 축소 의 수학적 보장.

2.2.2 동질성 가정의 강도

“동질 Bernoulli” 라는 가정이 중요하다. 실제로는 같은 공변량 값이라도 관측되지 않은 이질성 이 존재할 수 있다 (유전자형, 환경, 행동 등). 이 경우 분포가 이항에서 벗어나 과산포로 이어진다 (§4.5 참조).

직관: 경로 1 은 “조건부 해석”, 경로 2 는 “집계 해석”. 실무에서는 둘 다 자주 동시에 나타난다 — Poisson 카운트 두 개의 조건부가 동질 Bernoulli 집계와 같은 구조.

3 Cumulants 와 그 구조 (§4.2.2)

3.1 MGF 로부터의 유도

Bernoulli \(Y \sim \mathrm{Bern}(\pi)\) 의 MGF

\[ M_Y(\xi) \;=\; E[\exp(\xi Y)] \;=\; (1-\pi) + \pi e^\xi \]

이항 \(Y = \sum_{i=1}^m Y_i\) 의 MGF 는 이것의 \(m\) 제곱:

\[ M_{Y_1+\dots+Y_m}(\xi) \;=\; \{(1-\pi) + \pi e^\xi\}^m \]

Cumulant 생성함수 \(K(\xi) = \log M(\xi)\):

\[ K(\xi) \;=\; m \log\{(1-\pi) + \pi e^\xi\} \]

3.2 첫 네 cumulants

\(K(\xi)\) 를 \(\xi = 0\) 에서 테일러 전개하면

\[ \begin{aligned} \kappa_1 &= m\pi \\ \kappa_2 &= m\pi(1-\pi) \\ \kappa_3 &= m\pi(1-\pi)(1-2\pi) \\ \kappa_4 &= m\pi(1-\pi)\{1 - 6\pi(1-\pi)\} \end{aligned} \]

3.3 주목할 구조 — “\(m \times\) polynomial in \(\pi\)”

모든 cumulant 가 \(m\) 배 \(\pi\) 의 다항식. 이 구조가 세 가지 중요한 사실을 낳는다.

\(m\) 에 대해 선형 스케일링: 샘플 크기 \(m\) 을 바꿔도 “단위 당” cumulant 는 \(\pi\) 에만 의존. 따라서 이항의 “분포 모양” 은 \(\pi\) 로, “규모” 는 \(m\) 으로 분리.
고차 cumulant 의 상대 크기: \(\kappa_r\) 의 차수는 모두 \(m\). 표준화하면 \(r\) 차 cumulant 의 표준화 형태는 \(m^{1-r/2}\) 로 \(r\) 증가에 따라 감소.
분산 함수 \(V(\mu) = \mu(1-\mu/m)\): \(\kappa_2 = V(\mu)\) 로 GLM 에서 직접 사용.

3.4 \(\pi = 1/2\) 의 특수성

\(\kappa_3 = m\pi(1-\pi)(1-2\pi)\) 에서 \(\pi = 1/2\) 이면 \(\kappa_3 = 0\). 이항이 대칭 분포가 되는 유일한 경우. 이것이 “\(\pi = 1/2\) 에서 정규 근사가 가장 빠르다” 의 수학적 근거.

3.5 이질성 역설 (Heterogeneity paradox)

\(Y_i \sim \mathrm{Bern}(\pi_i)\) 로 이질 이면 (각 개체가 다른 성공률), cumulant 가

\[ \kappa_2 \;=\; \sum \pi_i(1-\pi_i) \;=\; m\bar\pi(1-\bar\pi) - (m-1) s^2(\pi) \]

where \(s^2(\pi) = \sum(\pi_i - \bar\pi)^2/(m-1)\). 관측된 \(\pi\) 분산이 이항 분산보다 작다 (\(- (m-1)s^2\) 때문).

이는 직관과 반대. “이질성은 분산을 증가시켜야 한다” 는 통념과 어긋난다.

3.5.1 해결

실무에서는 \(\pi_i\) 가 미지의 확률변수 (예: Beta 분포) 로 가정하는 것이 맞다. 그러면 marginal 하게 \(Y \sim \mathrm{Bin}(m, \bar\pi)\) 로 되돌아가며 marginal 분산은 이항 분산 — 과산포가 발생하는 정확한 상황.

직관: “\(\pi_i\) 는 고정이되 알려지지 않음” vs “\(\pi_i\) 는 무작위” 의 두 모델이 다르다. 전자는 분산 감소, 후자는 분산 증가 (과산포). McCullagh 는 후자가 실무적 현실임을 지적.

4 정규 극한 (§4.2.3)

4.1 CLT 의 이항 버전

표준화 변수

\[ Z \;=\; \frac{Y - m\pi}{\sqrt{m\pi(1-\pi)}} \]

의 cumulant:

\(\kappa_1(Z) = 0\)
\(\kappa_2(Z) = 1\)
\(\kappa_r(Z) = O(m^{1-r/2})\) for \(r \ge 3\)

\(m \to \infty\) 일 때 \(r \ge 3\) 의 cumulant 가 0 으로 수렴 → \(Z \overset{d}{\to} \mathcal N(0, 1)\).

4.2 연속성 보정

이산 → 연속 근사 시 반 단위 보정.

\[ P(Y \ge y) \approx 1 - \Phi(z^-),\qquad z^- = \frac{y - m\pi - 1/2}{\sqrt{m\pi(1-\pi)}} \]

\[ P(Y \le y) \approx \Phi(z^+),\qquad z^+ = \frac{y - m\pi + 1/2}{\sqrt{m\pi(1-\pi)}} \]

연속성 보정의 효과는 \(O(m^{-1/2})\) — 점근적으로는 무시 가능하지만 중간 크기 샘플에서 정확도 개선.

4.3 오차 차수와 실무 기준

절대 오차: \(O(m^{-1/2})\). \(\pi = 1/2\) 에서는 \(\kappa_3 = 0\) 덕에 \(O(m^{-1})\) 로 개선.

실무 기준: 정규 근사가 수용 가능하려면

\[ m\pi(1-\pi) \ge 2\qquad \text{AND}\qquad |z^\pm| \le 2.5 \]

첫 조건은 분산이 충분히 커야 한다는 요구 (Edgeworth 전개의 필요). 두 번째는 꼬리 확률에서 상대 오차 제한.

4.4 상대 오차 경고

\(P(Y \ge y)\) 가 작으면 절대 오차 \(O(m^{-1/2})\) 가 작아도 상대 오차는 클 수 있다. 극단 꼬리에서는 정규 근사 대신 saddlepoint approximation 또는 Edgeworth 확장 필요.

직관: 정규 근사는 “중앙” 에서 잘 맞고 “꼬리” 에서 나쁘다. 모수 검정의 \(p\) 값이 0.01 이하로 작을 때는 근사 오류를 의심해야.

5 Poisson 극한 (§4.2.4)

5.1 극한 설정

\(m \to \infty\), \(\pi \to 0\), 곱 \(m\pi \to \mu\) (고정 상수). 즉 “많은 시행, 희귀한 성공” 의 극한.

5.2 Cumulant 의 수렴

\(K(\xi) = m\log\{1 + \pi(e^\xi - 1)\} \approx m\pi(e^\xi - 1) = \mu(e^\xi - 1)\).

이것이 Poisson(\(\mu\)) 의 cumulant 생성함수. 따라서

\[ \mathrm{Bin}(m, \pi) \;\overset{d}{\to}\; \mathrm{Poi}(\mu),\quad \mu = m\pi \]

5.3 오차 차수

Poisson 근사의 오차는 \(O(m^{-1})\). 정규 근사 (\(O(m^{-1/2})\)) 보다 빠르게 수렴.

이는 중요한 실무 지침 — \(\pi\) 가 매우 작으면 정규 근사보다 Poisson 근사가 낫다.

5.4 언제 Poisson 을 쓰는가

전형적 상황:

응용	\(m\)	\(\pi\)	근사
보험 청구 (희귀 사고)	10만 가구	\(\sim 10^{-3}\)	Poisson
품질 관리 (불량률)	만 개	\(\sim 10^{-4}\)	Poisson
희귀 유전 변이	수십만 명	\(\sim 10^{-5}\)	Poisson
동전 던지기	100	\(0.5\)	정규
약물 효과 (일반 반응)	1000	\(\sim 0.3\)	정규

경계: \(m\pi(1-\pi) \gg m\pi\) 이면 정규 우위, 반대면 Poisson 우위. 대략 \(\pi < 0.1\) 이면 Poisson, \(\pi > 0.3\) 이면 정규.

직관: 이항은 “큰 \(m\) + 중간 \(\pi\)” 에서 정규로, “큰 \(m\) + 작은 \(\pi\)” 에서 Poisson 으로 변한다. 두 극한은 서로 배타적이며 \(\pi\) 의 크기가 결정한다.

6 변환 (§4.2.5)

이항의 비표준적 분포 특성을 “변환으로 완화” 하는 전통적 전략. 현대 GLM 은 변환 대신 링크 함수를 쓰지만, 변환의 이해는 여전히 가치 있다.

6.1 부호 있는 이탈도 변환

정규 근사를 개선하는 고급 변환.

\[ W \;=\; \mathrm{sign}(Y-\mu)\sqrt{2Y\log(Y/\mu) + 2(m-Y)\log\{(m-Y)/(m-\mu)\}} \]

추가로 편향 보정 항 \((1-2\pi)/\{6\sqrt{m\pi(1-\pi)}\}\) 을 더하면 cumulant 가 표준정규의 cumulant 와 \(O(m^{-1})\) 차이.

\(W\) 의 분산은

\[ \sigma_W^2 \;=\; 1 + \frac{5 - 2\pi(1-\pi)}{36 m\pi(1-\pi)} + O(m^{-2}) \]

\(W/\sigma_W\) 는 거의 완벽한 정규. \(O(m^{-3/2})\) 정확도.

이는 단순 CLT \(Z\) 보다 우수. Edgeworth 전개에 쓰이는 연속성 보정 + Sheppard 보정이 결합된 형태. Appendix B 의 discrete Edgeworth 가 상세.

6.2 경험 로짓 변환 (Empirical Logistic Transformation)

GLM 이전 시대의 “간단한 회귀” 트릭. 변환

\[ Z \;=\; \log\frac{Y + \tfrac12}{m - Y + \tfrac12} \]

이 변환은 로그 오즈 \(\lambda = \log\{\pi/(1-\pi)\}\) 의 \(O(m^{-2})\) 편향 추정.

6.2.1 왜 \(c = 1/2\) 인가

일반 형태 \(\log\{(Y+c)/(m-Y+c)\}\) 에서 어떤 \(c\) 를 쓰든 \(O(m^{-1})\) 편향. 오직 \(c = 1/2\) 에서만 1 차 편향이 상쇄되어 \(O(m^{-2})\) 로 개선. 테일러 전개의 계수 구조에서 나오는 구조적 결과.

\(c = 0\) 은 MLE 와 일치. 하지만 \(Y = 0\) 또는 \(m\) 일 때 \(\log\) 에 0 진입 → 발산.
\(c = 1/2\) 는 경계값 회피와 편향 최소화를 동시 달성.

6.2.2 분산 추정

Gart & Zweifel (1967)

\[ \mathrm{Var}(Z) \;\approx\; v \;=\; \frac{1}{Y + \tfrac12} + \frac{1}{m - Y + \tfrac12} \]

이 분산 근사가 가중치 \(1/v\) 로 경험 로짓에 가중 선형 회귀 가능케 한다.

6.2.3 실무 활용

\(Z\) 를 반응, \(1/v\) 를 가중치로 선형 회귀 \(Z = \mathbf{x}^\top\boldsymbol\beta + \varepsilon\). 이것이 GLM 등장 이전의 “작은 표본 로지스틱 회귀” 표준이었다. 현대에는 glm(..., family=binomial) 이 MLE 직접 계산으로 이 우회가 불필요해졌지만, 빠른 예비 분석 이나 교육적 목적 으로 여전히 유용.

6.2.4 한계

점근 결과라 모든 \(m_i\) 가 충분히 커야 함 (\(m_i \ge 20\) 권장). \(m_i\) 작은 희소 자료에서는 MLE (Firth penalized) 직접 사용이 안전.

직관: 경험 로짓은 “로그 오즈를 평균으로 추정” 하는 고전적 트릭. \(+1/2\) 의 작은 보정이 편향을 한 차수 낮추는 우아한 결과.

7 코드 예시

7.1 Step 1: Cumulant 의 \(m \times\) polynomial 구조 검증

import numpy as np
from scipy.stats import binom

# 여러 (m, pi) 에서 cumulant 확인
configs = [(10, 0.3), (10, 0.5), (100, 0.3), (100, 0.5)]
for m, pi in configs:
    samples = binom.rvs(m, pi, size=500000)
    k1 = samples.mean()
    k2 = samples.var()
    k3 = np.mean((samples - k1)**3)
    k4 = np.mean((samples - k1)**4) - 3*k2**2    # 중심 4차 - 3 sigma^4

    # 이론값
    k1_th = m * pi
    k2_th = m * pi * (1 - pi)
    k3_th = m * pi * (1 - pi) * (1 - 2*pi)
    k4_th = m * pi * (1 - pi) * (1 - 6*pi*(1-pi))

    print(f"m={m}, pi={pi}")
    print(f"  k1: {k1:6.2f} (이론 {k1_th})")
    print(f"  k2: {k2:6.2f} (이론 {k2_th})")
    print(f"  k3: {k3:7.3f} (이론 {k3_th})")
    print(f"  k4: {k4:7.3f} (이론 {k4_th:.3f})")

모든 cumulant 가 \(m\) 에 선형 스케일되는 것과 \(\pi = 0.5\) 에서 \(\kappa_3 = 0\) 임을 확인.

7.2 Step 2: 정규 vs Poisson 근사의 오차 비교

from scipy.stats import norm, poisson

# 중간 π
m, pi = 50, 0.3
# 정규 근사
mu, sigma = m*pi, np.sqrt(m*pi*(1-pi))
# Poisson 근사 (부적합한 영역)
lam = m * pi

# 실제 확률 vs 두 근사
k_vals = np.arange(0, m+1)
exact = binom.pmf(k_vals, m, pi)
normal_approx = norm.pdf(k_vals, mu, sigma)
poisson_approx = poisson.pmf(k_vals, lam)

err_normal = np.max(np.abs(exact - normal_approx))
err_poisson = np.max(np.abs(exact - poisson_approx))
print(f"m={m}, pi={pi}")
print(f"  정규 근사 최대 오차:   {err_normal:.4f}")
print(f"  Poisson 근사 최대 오차: {err_poisson:.4f}")

# 희소 π
m, pi = 1000, 0.005
mu, sigma = m*pi, np.sqrt(m*pi*(1-pi))
lam = m * pi
k_vals = np.arange(0, 30)
exact = binom.pmf(k_vals, m, pi)
normal_approx = norm.pdf(k_vals, mu, sigma)
poisson_approx = poisson.pmf(k_vals, lam)
err_normal = np.max(np.abs(exact - normal_approx))
err_poisson = np.max(np.abs(exact - poisson_approx))
print(f"\nm={m}, pi={pi} (희소)")
print(f"  정규 근사 최대 오차:   {err_normal:.4f}")
print(f"  Poisson 근사 최대 오차: {err_poisson:.6f}")

중간 \(\pi\) 에서는 정규 우위, 희소 \(\pi\) 에서는 Poisson 이 압도적. 실무 선택 기준의 수치 검증.

7.3 Step 3: 경험 로짓 변환과 편향

# 여러 c 값에서 편향 비교
rng = np.random.default_rng(0)
pi_true = 0.3
lambda_true = np.log(pi_true / (1 - pi_true))

n_reps = 10000
for m in [10, 30, 100]:
    results = {}
    for c in [0, 0.25, 0.5, 1.0]:
        y = rng.binomial(m, pi_true, size=n_reps).astype(float)
        z = np.log((y + c) / (m - y + c + 1e-10))      # eps 로 0 분모 회피
        results[c] = z.mean() - lambda_true
    print(f"m={m}, λ_true={lambda_true:.3f}")
    for c, bias in results.items():
        order = "O(m^{-2})" if c == 0.5 else "O(m^{-1})"
        print(f"  c={c:.2f}: 편향 = {bias:+.4f}  ({order})")

\(c = 1/2\) 에서 편향이 다른 \(c\) 보다 작은 것을 수치로 확인. \(m\) 증가에 따른 감소 속도도 비교 가능.

7.4 Step 4: 부호 있는 이탈도 변환

def signed_deviance(y, m, pi):
    """
    W = sign(y - mπ) * sqrt(2 y log(y/μ) + 2 (m-y) log((m-y)/(m-μ)))
    y=0, y=m 경계는 극한 처리.
    """
    mu = m * pi
    y = np.where(y > 0, y, 1e-10)              # 경계 방지
    m_minus_y = np.where(m - y > 0, m - y, 1e-10)
    term1 = np.where(y > 0, y * np.log(y/mu), 0)
    term2 = np.where(m_minus_y > 0, m_minus_y * np.log(m_minus_y/(m-mu)), 0)
    D = 2 * (term1 + term2)
    return np.sign(y - mu) * np.sqrt(np.maximum(D, 0))

m, pi = 50, 0.3
rng = np.random.default_rng(0)
y_samples = rng.binomial(m, pi, size=100000)

# 단순 표준화 Z
Z = (y_samples - m*pi) / np.sqrt(m*pi*(1-pi))
# 부호 있는 이탈도 W
W = signed_deviance(y_samples, m, pi)

from scipy.stats import kstest
ks_Z, _ = kstest(Z, "norm")
ks_W, _ = kstest(W, "norm")
print(f"KS 통계 (정규성)")
print(f"  Z (표준화):      {ks_Z:.4f}")
print(f"  W (부호 이탈도): {ks_W:.4f}  ← 더 정규에 가까움")

KS 통계가 \(W\) 에서 더 작다 — 부호 있는 이탈도가 단순 표준화보다 정규 근사가 우수함을 확인.

8 흔한 실수

실수	처방
작은 \(m\) 에서 정규 근사 CI	\(m\pi(1-\pi) < 5\) 면 exact (Clopper-Pearson) 또는 Edgeworth
\(\pi\) 가 매우 작을 때 정규 근사	Poisson 근사로. 근사 오차 차수에서 우월
이질성 역설을 “분산 감소” 로 수용	\(\pi_i\) 가 무작위 라고 가정하면 오히려 과산포 (§4.5)
경험 로짓에서 \(c = 0\) 사용	\(Y = 0\) 또는 \(m\) 에서 \(\log\) 발산. \(c = 1/2\) 가 표준
경험 로짓을 작은 \(m\) 에서 사용	점근 결과라 \(m \ge 20\) 권장. 작으면 MLE 직접
극단 꼬리에서 정규 근사 \(p\) 값 보고	상대 오차 클 수 있음. Saddlepoint 또는 exact

9 요약

두 발생 경로: (1) 두 Poisson 의 조건부, (2) 동질 Bernoulli 의 합. 전자는 로그선형-로지스틱 동치의 근거, 후자는 covariate class 집계의 근거.
Cumulants: \(\kappa_r = m \times\) polynomial(\(\pi\)). 모두 \(m\) 선형, 표준화 후 \(r\) 차 cumulant 는 \(O(m^{1-r/2})\).
정준 모수: \(\theta = \log\{\pi/(1-\pi)\}\) — 지수족 표준형에서 logit 이 자연 정준.
정규 극한: \(m \to \infty\), \(\pi\) 고정. 오차 \(O(m^{-1/2})\), \(\pi = 1/2\) 에서 \(O(m^{-1})\).
Poisson 극한: \(\pi \to 0\), \(m\pi \to \mu\). 오차 \(O(m^{-1})\) 로 정규보다 빠름.
변환:
- 부호 있는 이탈도 \(W\): \(O(m^{-3/2})\) 정규성 근사.
- 경험 로짓 \(\log\{(Y+\tfrac12)/(m-Y+\tfrac12)\}\): \(c = 1/2\) 에서 \(O(m^{-2})\) 편향.
이질성 역설: 고정 이질은 분산 감소, 무작위 이질은 분산 증가 (과산포로 이어짐).

한 줄 요약: §4.2 는 이항분포의 “기초 성질” 을 GLM 의 정준 모수화·근사 오차·변환 관점에서 재구성한다. logit 이 왜 자연스러운지, 언제 정규 근사 대신 Poisson 근사를 써야 하는지, 경험 로짓의 \(+1/2\) 가 왜 마법인지 — 이 세 질문의 수학적 답이 §4.2 안에 있다.

10 관련 주제

선행 지식

관련 개념

Poisson 분포 — Poisson 극한
GLM 심화 결과와 연습 — Exponential Tilting — cumulant 항등식의 지수족 구조
Logistic Regression: The Model — 로짓 링크의 GLM 응용

후속 주제

Models for binary responses (McCullagh §4.3) — logit/probit/cloglog 비교
Likelihood functions (McCullagh §4.4) — 로그가능도·편향·희소성
Over-dispersion (McCullagh §4.5) — 이질성 역설의 무작위 모형