Ch.8 감마 GLM의 심화 결과와 연습문제를 재구성한다. log Y 의 표준편차와 CV 근사, 감마 CGF, 표본 평균과 Dirichlet 통계량의 독립성, MLE 의 mu-nu 독립성, 산포 추정의 편향 보정, 보리-잡초 경쟁 실험, 로그 변환 최소제곱의 점근 효율, 감마 복합 가설의 정확 검정을 다룬다.
Statistics
GLM
저자
Kwangmin Kim
공개
2026년 04월 18일
1 이 장의 위치
McCullagh §8.5는 감마 모형의 문헌적 맥락을 짧게 정리하고, §8.6은 16개의 연습문제를 제시한다. 단순 계산 문제가 아니라, 감마 분포와 감마 GLM의 핵심 성질과 확장을 담고 있다:
Exercise 8.1: \(\log Y\) 의 표준편차와 \(Y\) 의 변동계수(CV) 사이의 근사 관계
Exercise 8.2: 감마 분포의 누율생성함수(CGF)와 CLT 연결
Exercise 8.3: \(\log Y\) 의 정확한 평균·분산 — 디감마·트리감마 함수
Exercise 8.4: 표본 평균과 비율 벡터의 독립성, 대칭 Dirichlet 분포
Exercise 8.5: \(\hat{\mu}\) 와 \(\hat{\nu}\) 의 MLE 독립성, 조건부 MLE
Exercises 8.6-8.10: 보험 청구·혈액 응고·초파리 데이터의 실습 확장
Exercise 8.11-8.12: 산포 MLE의 점근 전개와 편향 보정 근사식
Exercise 8.13-8.14: 보리-잡초 경쟁 실험의 역이차 반응과 로그비 분석
Exercise 8.15: 로그 변환 OLS 대 감마 GLM — 점근 효율의 정확한 비교
Exercise 8.16: 감마 복합 가설의 정확 검정 — 완비 충분통계량과 조건부 분포
이 포스트에서는 연습문제를 주제별로 묶어 풀이하고, 각 결과의 직관적 의미와 실무적 연결을 설명한다.
2 문헌적 배경 (§8.5 Bibliographic Notes)
McCullagh는 감마 모형의 역사적 맥락을 세 가지 흐름으로 정리한다.
산업 신뢰성(Industrial Reliability): 지수 분포 모형은 산업 수명 데이터 분석의 핵심 도구이다. 감마 분포는 지수 분포의 일반화이므로, 수명 분포 모형의 자연스러운 확장이 된다. Barlow & Proschan (1965, 1975)과 Nelson (1982)이 대표적 참고 문헌이다.
생존 분석(Survival Analysis): 동일한 감마 모형이 임상 의학에서 생존 시간 분석에 사용된다. Ch.13에서 비례 위험 모형과의 연결을 다룬다.
역선형 모형(Inverse Linear Models): Nelder (1966)가 도입한 역선형 모형 \(1/\mu = \alpha + \beta x\) 는 감마 분포의 정준 연결을 사용하는 GLM의 초기 형태이다. 이는 생화학의 Michaelis-Menten 포화 동역학에서 자연스럽게 등장한다.
정규족과의 유사성: 감마족은 정규족과 많은 성질을 공유한다. 단일 표본에서 \(\mu\) 에 대한 복합 가설의 정확한 유사 영역(exact similar region)을 구성할 수 있다. 원리적으로는 정확한 신뢰구간도 구성 가능하나, 표본 크기가 3-4를 넘으면 계산이 지나치게 복잡해진다 (Exercise 8.16).
양변에 제곱근을 취하면 \(\text{sd}(\log Y) \approx \text{CV}(Y)\) 를 얻는다.
직관적 해석. 이 근사가 말하는 것은 다음과 같다: 로그 변환은 “곱셈적 변동”을 “덧셈적 변동”으로 변환한다. 원래 변수의 변동계수(곱셈적 산포)가 로그 변환된 변수의 표준편차(덧셈적 산포)로 보존되는 것이다. 감마 분포에서 \(\text{CV}(Y) = 1/\sqrt{\nu}\) 이므로, \(\nu\) 가 크면(CV가 작으면) 근사가 매우 정확하다.
3.2 감마 분포에서의 수치 검증
\(Y \sim G(\mu, \nu)\) 일 때:
정확한 CV: \(\text{CV}(Y) = 1/\sqrt{\nu}\)
정확한 sd(log Y): \(\text{sd}(\log Y) = \sqrt{\psi'(\nu)}\) (트리감마 함수)
여기서 \(\psi'(\nu) = \sum_{k=0}^{\infty} 1/(\nu + k)^2\) 는 트리감마(trigamma) 함수이다.
이는 \(W = \nu Y/\mu \sim \text{Gamma}(\nu, 1)\) 에 대해 \(E(\log W) = \psi(\nu)\) 이고 \(E[\log(Y/\mu)] = E[\log W] - \log \nu\) 에서 나온다.
직관. 디감마 함수 \(\psi(\nu) \approx \log \nu - 1/(2\nu)\) 이므로, \(\nu\) 가 크면 \(E[\log(Y/\mu)] \approx -1/(2\nu)\) 로 0에 가까워진다. 즉, \(\nu \to \infty\) 에서 \(\log Y\) 의 기대값이 \(\log \mu\) 에 수렴하며, 이는 감마 분포가 점차 대칭적(정규적)으로 되는 것과 일치한다.
직관. 감마의 형태 모수 \(\nu\) 는 “합산 횟수”의 역할을 한다: \(G(\mu, \nu)\) 는 \(\nu\) 개의 독립 \(G(\mu/\nu, 1)\) 변수의 합처럼 행동한다 (정확히는 \(\nu\) 가 정수일 때). 따라서 \(\nu \to \infty\) 에서의 CLT는 자연스러운 결과이다. 이것은 곧 “데이터의 변동계수가 매우 작으면, 감마 모형과 정규 모형이 사실상 구분되지 않는다”는 실무적 함의를 갖는다.
5 표본 평균과 Dirichlet 독립성 (Exercise 8.4)
Exercise 8.4 — 독립성과 대칭 Dirichlet
\(Y_1, \ldots, Y_n \overset{\text{iid}}{\sim} G(\mu, \nu)\) 일 때:
\(\bar{Y} = Y_\cdot/n\) 과 \(T = (Y_1/Y_\cdot, \ldots, Y_n/Y_\cdot)\) 는 독립이다.
\(T\) 는 인덱스 \(\nu\) 인 대칭 Dirichlet 분포를 따른다.
유도 전략.\(W_i = \nu Y_i / \mu \overset{\text{iid}}{\sim} \text{Gamma}(\nu, 1)\) 로 재모수화한다. 감마-Dirichlet 관계에 의해, \(W_\cdot = \sum W_i \sim \text{Gamma}(n\nu, 1)\) 이고, \((W_1/W_\cdot, \ldots, W_n/W_\cdot) \sim \text{Dir}(\nu, \ldots, \nu)\) 이며, 이 둘은 독립이다.
이 결과는 변수 변환의 야코비안으로 직접 보일 수도 있다: \((W_1, \ldots, W_n) \to (W_\cdot, W_1/W_\cdot, \ldots, W_{n-1}/W_\cdot)\) 변환 후 결합 밀도가 곱으로 분해되는 것을 확인하면 된다.
\(Y_i/Y_\cdot = W_i/W_\cdot\) 이므로 원래 변수에서도 동일한 독립성이 성립한다.
직관. 이 결과는 정규 분포에서 \(\bar{X}\) 와 \(S^2\) 의 독립성과 정확히 대응한다. 정규에서는 \(\bar{X} \perp S^2\) 이고 \(S^2\) 는 카이제곱을 따른다. 감마에서는 \(\bar{Y} \perp (Y_1/Y_\cdot, \ldots, Y_n/Y_\cdot)\) 이고 비율 벡터는 Dirichlet를 따른다.
이 유사성은 §8.5에서 언급한 “감마족과 정규족의 많은 공통 성질” 중 하나이다. 실무적으로, 이 독립성 덕분에 \(\mu\) 의 추론과 \(\nu\) 의 추론을 분리할 수 있다(Exercise 8.5).
\(y_i/\bar{y} = (Y_i/Y_\cdot) \cdot n\) 이므로 \(\bar{D}\) 는 비율 벡터의 함수이다. 따라서 \(\hat{\nu}\) (비율 벡터의 함수) \(\perp\)\(\hat{\mu}\) (합의 함수)이다.
직관. 정규 분포에서 \(\hat{\mu} = \bar{X}\) 와 \(\hat{\sigma}^2 = S^2\) 가 독립인 것과 동일한 구조이다. 두 경우 모두 충분통계량의 분해에 기반한다: 위치 모수의 추정량은 합에, 척도 모수의 추정량은 비율에 의존한다.
6.3 조건부 MLE
\(Y_\cdot = y_\cdot\) 가 주어졌을 때, 비율 벡터 \(T\) 의 조건부 분포는 \(\text{Dir}(\nu, \ldots, \nu)\) 로서 \(\mu\) 에 무관하다. 따라서 \(\nu\) 의 조건부 MLE는 Dirichlet 밀도를 최대화하여 얻는다:
McCullagh가 제시하는 형태는 보다 간결한 근사이다. \(\psi(\nu) \approx \log \nu - 1/(2\nu)\) 까지만 취하면 \(1/(2\hat{\nu}) = \bar{D}/2\), 즉 \(1/\hat{\nu} = \bar{D}\) 이다. 2차 항까지 포함하면
여기서 \(\gamma \approx 0.5772\) 는 오일러-마스케로니 상수이다. 이 값을 근사식에 대입하면 \(1/\hat{\nu} \approx 0.846 \times 6.846 / (6 + 1.692) \approx 0.753\) , 즉 \(\hat{\nu} \approx 1.33\) 으로, 참값 \(\nu = 1\) 에 대해 상향 편향을 보인다. 이 편향이 Exercise 8.12의 보정 동기가 된다.
자유도 보정: \(n\) 을 \(n - p\) 로 교체한다. \(p\) 는 평균 모형의 모수 수이다. 이는 정규 모형에서 \(\hat{\sigma}^2 = \text{RSS}/(n-p)\) 로 보정하는 것과 동일한 논리이다.
Stirling 보정: 근사식의 분자·분모에서 \(6\) 에 곱해지는 \(n\) 이 \(n - p\) 로 바뀐다.
실무적 중요성. 감마 GLM에서 산포 모수 \(\phi = 1/\nu\) 의 추정은 표준오차 계산과 가설 검정에 직접 영향을 미친다. \(\phi\) 를 과소추정하면 표준오차가 줄어들어 유의 판정이 지나치게 관대해진다. 특히 표본이 작거나 모수가 많은 경우 편향 보정이 중요하다.
Exercise 8.6은 §8.4.1의 자동차 보험 데이터를 로그선형 모형\(\text{PA} + \text{CG} + \text{VA}\) 로 적합하도록 요구한다. 이는 주효과만 포함하는 가법(additive) 모형으로, §8.4.1의 분석에서 2차·3차 교호작용을 제거한 것이다.
로그 연결 감마 모형에서 이 주효과 모형의 의미는 “각 요인의 효과가 독립적으로 곱셈적으로 작용한다”는 것이다:
따라서 운전자 연령(PA)의 효과는 차량 그룹(CG)이나 차량 연식(VA)에 무관하게 동일한 배율(multiplier)로 작용한다.
8.2 혈액 응고 Arrhenius 검증 (Exercise 8.7)
Exercise 8.7은 \(\log(\text{duration})\) 을 절대온도의 역수 \(1/T\) 에 대해 그리도록 요구한다. Arrhenius 법칙이 성립한다면 이 그래프가 직선이어야 한다. §8.4.4의 Drosophila 데이터에서 이 관계가 비선형임을 확인하면, 단순 Arrhenius 모형이 생물학적 발달률을 설명하지 못함을 보이는 것이다.
8.3 다항식 대안과 링크 비교 (Exercises 8.8-8.9)
Exercise 8.8은 유리 함수 (8.4) 대신 다항식을 사용하도록 요구한다. 3차 또는 4차 다항식이 유사한 적합을 제공하지만, 외삽(extrapolation) 행동이 유리 함수와 크게 다르다. 유리 함수는 점근선을 가지므로 물리적으로 합리적인 반면, 다항식은 범위 밖에서 발산하거나 음수가 된다.
이 비교는 감마 GLM에서 링크 함수 선택과 선형 예측자의 함수 형태 선택이 독립적인 모형화 결정임을 잘 보여준다.
8.4 초파리 발달 단계 확장 (Exercise 8.10)
Exercise 8.10은 embryonic period 외에 egg-larval, larval, pupal 기간까지 확장한다. Table 8.9와 8.10의 데이터를 사용하여:
각 발달 단계에서 온도에 대한 반응 곡선의 형태
최대 발달률이 동일한 온도에서 나타나는지
암수 간 발달률 차이의 존재와 온도 의존성
을 검토한다. 수컷이 암컷보다 발달이 빠른 경향이 일부 단계에서 관찰되며, 이 차이는 온도에 따라 변할 수 있다.
9 보리-잡초 경쟁 실험 (Exercises 8.13-8.14)
9.1 역이차 반응곡선 (Exercise 8.13)
Exercise 8.13 — 핵심 주장
보리(barley)와 잡초(Sinapis alba)의 단작(monoculture) 수확량은 종자 밀도에 대해 근사적으로 역이차(inverse quadratic) 관계를 따른다.
Table 8.11의 데이터에서 한 종만 심은 관측(monoculture)을 추출한다. 수확량 \(Y\) 를 반응, 종자 밀도 \(N\) 을 설명변수로 놓으면, 감마 오차 + 역수 연결에서
이 역이차 모형은 Nelder (1966)의 역다항식 반응면의 한 형태이다. 밀도가 매우 클 때 \(1/\mu \to \alpha\), 즉 \(\mu \to 1/\alpha\) 로 수확량이 포화한다. 밀도가 0에 가까우면 \(1/\mu \to \infty\), 즉 \(\mu \to 0\) 이다.
직관. 식물 경쟁에서 종자 밀도가 증가하면 수확량이 처음에는 증가하지만, 결국 자원 경쟁(빛, 물, 양분)으로 인해 포화에 도달한다. 역이차 모형은 이 포화 행동을 자연스럽게 포착하며, Michaelis-Menten 포화 모형의 일반화로 볼 수 있다.
9.2 로그비 경쟁 모��� (Exercise 8.14)
두 종이 함께 심어진 경우, 반응변수로 \(\log(Y_B / Y_S)\) (보리 대 잡초의 로그 수확량비)를 사용한다. 모형은
\(\beta = 1\) 은 “종자 수를 두 배로 늘리면 수확량도 두 배”라는 선형 스케일링을 의미하며, 이 경우 두 종의 경쟁 능력이 본질적으로 동등하다. \(\beta < 1\) 이면 다수 종의 효과가 감쇠하며, 이는 밀도 의존적 사멸(density-dependent mortality)을 시사한다.
10 로그 변환 OLS의 점근 효율 (Exercise 8.15)
Exercise 8.15 — 핵심 결과
\(Y_i \sim G(\mu_i, \nu)\) 에서 \(\log \mu_i = \alpha + x_i^T \beta\) 일 때:
\(\log Y_i\) 의 평균: \(E(\log Y_i) = \alpha^* + x_i^T \beta\) 여기서 \(\alpha^* = \alpha + \psi(\nu) - \log \nu\)
\(\log Y_i\) 의 분산: \(\text{var}(\log Y_i) = \psi'(\nu)\) (상수)
\(\tilde{\beta}_{OLS}\) 의 \(\hat{\beta}_{MLE}\) 대비 점근 효율: \(\text{ARE} = 1/\{\nu \psi'(\nu)\}\)
핵심 직관.\(\log Y_i\) 에 대한 OLS는 감마 GLM의 경쟁 대안이다. 두 접근의 차이를 이해하려면 두 가지를 구분해야 한다:
평균 모형: 둘 다 \(x_i^T \beta\) 를 동일하게 추정한다. \(\tilde{\beta}_{OLS}\) 는 \(\beta\) 에 대해 일치추정량이다.
가중 방식: 감마 GLM(로그 연결)의 IRLS 가중치는 모두 1이므로, 비가중 최소제곱과 동일한 정규방정식을 사용한다. 반면 \(\log Y_i\) 에 대한 OLS도 비가중이다. 차이는 반응변수의 변환 여부에 있다: GLM은 \(Y_i\) 를 직접 사용하고 로그 연결로 평균을 모형화하는 반면, OLS는 \(\log Y_i\) 를 반응으로 사용한다.
효율 비교 유도. 감마 로그-연결 GLM의 스코어 함수에서 \(\beta\) 에 대한 피셔 정보는 \(I_{GLM} = \nu X^T X\) 이다.
\(\log Y_i\) 에 대한 OLS의 피셔 정보는 \(I_{OLS} = X^T X / \psi'(\nu)\) 이다.
\(Z_i = \log(Y_i/\mu_0)\) 로 변환하면, \(S_0\) 가 주어진 조건 하에서 \((Z_1, \ldots, Z_n)\) 은 곡면
\[
\sum_{i=1}^n \bigl(z_i - e^{z_i}\bigr) = n S_0
\]
위에서 균등 분포를 따른다. 이 조건부 분포는 \(\nu\) 에 무관하므로, \(H_0\) 의 정확 검정을 구성할 수 있다.
검정 구성 방법(i):\(S_0\) 의 관측값이 주어졌을 때, \(H_0\) 하에서 \(S_0\) 의 분포를 이용하여 p-값을 계산한다. 그러나 \(S_0\) 의 분포는 \(\nu\) 에 의존하므로, 조건부 접근이 \(\nu\) 를 제거하는 데 필수적이다. 적절한 검정통계량 \(T(Z_1, \ldots, Z_n)\) 을 선택하고, 조건부 곡면 위에서의 분포를 (시뮬레이션으로) 구하면 정확 검정이 된다.
신뢰구간 구성 방법(ii):\(\mu_0\) 를 변화시키면서 검정의 기각 여부를 확인하면 \(\mu\) 에 대한 정확 신뢰구간을 구성할 수 있다. 이는 “기각되지 않는 \(\mu_0\) 의 집합 = 신뢰구간”이라는 Neyman 역전 원리를 적용한 것이다.
실무적 한계. McCullagh가 지적했듯이, \(n > 3\) 이면 이 정확 계산이 지나치게 복잡해진다. \(n - 1\) 차원 곡면 위에서의 적분이 필요하기 때문이다. 따라서 실무에서는 우도비 검정의 \(\chi^2\) 근사나 부트스트랩 방법을 사용하는 것이 일반적이다.
코드
import numpy as np# Exercise 8.16: 조건부 곡면 시뮬레이션 (개념 시연)np.random.seed(42)n, mu0, nu =5, 1.0, 2.0# H0 하에서 표본 생성y = np.random.gamma(shape=nu, scale=mu0 / nu, size=n)z = np.log(y / mu0)# S0 계산S0 = np.mean(z) - np.mean(y) / mu0surface_val = np.sum(z - np.exp(z))print(f"표본 크기: n = {n}")print(f"참 모수: mu = {mu0}, nu = {nu}")print(f"기하평균/mu0: {np.exp(np.mean(z)):.4f}")print(f"산술평균/mu0: {np.mean(y) / mu0:.4f}")print(f"S0 = {S0:.4f}")print(f"곡면 값 sum(z_i - exp(z_i)) = {surface_val:.4f}")print(f"n * S0 = {n * S0:.4f}")print(f"일치 확인: {np.isclose(surface_val, n * S0)}")
12 종합: Ch.8 연습문제의 구조
Ch.8의 16개 연습문제는 세 가지 층위로 구조화된다.
Layer 1 — 분포론적 기초 (Exercises 8.1-8.5)
문제
핵심 결과
정규족 대응물
8.1
sd(log Y) \(\approx\) CV(Y)
log 변환 안정화
8.2
CGF, CLT
\(\bar{X}\) 의 CLT
8.3
\(E(\log Y), \text{var}(\log Y)\) 정확 공식
\(E(X), \text{var}(X)\)
8.4
\(\bar{Y} \perp (Y_i/Y_\cdot)\), Dirichlet
\(\bar{X} \perp S^2\), 카이제곱
8.5
\(\hat{\mu} \perp \hat{\nu}\), 조건부 MLE
\(\hat{\mu} \perp \hat{\sigma}^2\)
이 다섯 문제는 감마 분포가 정규 분포의 “양수 버전”으로서 얼마나 풍부한 구조를 공유하는지를 체계적으로 보여준다.