Kwangmin Kim - The Gamma Distribution

1 왜 감마 분포인가

Ch.8은 변동계수가 일정한 자료, 즉 \(\operatorname{var}(Y) = \sigma^2 \mu^2\) 인 연속 측정값을 다룬다. 이 분산-평균 관계를 정확히 재현하는 지수족 분포가 감마 분포이다.

일상적 비유로, 보험 청구금이나 혈액 응고 시간처럼 “큰 값은 흔들림도 크고, 작은 값은 흔들림도 작은” 양의 연속 자료를 상상하면 된다. 표준편차가 아니라 변동계수 \(\sigma = \text{SD}(Y)/E(Y)\) 가 일정하다는 것은, “퍼센트 단위의 상대적 불확실성이 평균 수준에 무관하다”는 뜻이다. 감마 분포는 이 성질을 지수족 프레임워크 안에서 자연스럽게 구현한다.

2 밀도 함수

2.1 McCullagh & Nelder의 \((\mu,\nu)\) 매개변수화

감마 밀도의 표준 교과서 표현은 형태(shape)-비율(rate) 매개변수 \((\alpha, \lambda)\) 를 쓰지만, McCullagh & Nelder는 GLM 분석에 최적화된 평균-정밀도 매개변수 \((\mu, \nu)\) 를 사용한다.

\[ f(y;\mu,\nu) = \frac{1}{\Gamma(\nu)} \left(\frac{\nu y}{\mu}\right)^{\!\nu} \exp\!\left(-\frac{\nu y}{\mu}\right) \frac{1}{y}, \qquad y \ge 0,\;\nu > 0,\;\mu > 0. \]

약기로 \(Y \sim G(\mu, \nu)\) 라 쓴다.

모수의 의미:

모수	이름	역할
\(\mu\)	평균(mean)	\(E(Y) = \mu\)
\(\nu\)	지표(index) / 정밀도(precision)	\(\nu = 1/\sigma^2\), 클수록 분포가 좁다

직관. \(\mu\) 는 분포의 “위치”를, \(\nu\) 는 “집중도”를 제어한다. 정규 분포의 \((\mu, 1/\sigma^2)\) 과 구조적으로 동일하다. \(\nu\) 가 커질수록 감마 분포는 평균 \(\mu\) 주위로 집중되며, 극한에서 정규 분포로 수렴한다.

2.2 밀도 미분 원소의 선택

밀도 정의에서 미분 원소가 \(dy\) 가 아닌 \(d(\log y)\) 인 점에 주목한다.

\[ f(y;\mu,\nu)\,d(\log y) = \frac{1}{\Gamma(\nu)} \left(\frac{\nu y}{\mu}\right)^{\!\nu} \exp\!\left(-\frac{\nu y}{\mu}\right) \frac{dy}{y}. \]

직관. 양의 변량에서 \(d(\log y) = dy/y\) 로 놓으면 밀도가 “상대적 크기”를 기준으로 측정된다. 이는 변동계수가 일정한 자료의 본성에 부합한다. \(dy\) 기준 밀도의 최빈값은 \(y = \mu(1 - 1/\nu)\) 이지만, \(d(\log y)\) 기준 밀도의 최빈값은 모든 \(\nu\) 에 대해 \(y = \mu\) 이다. 즉 로그 스케일에서 보면 감마 분포의 중심이 항상 평균에 위치한다.

2.3 표준 매개변수화와의 관계

통계 소프트웨어에서 흔히 쓰는 형태-비율 매개변수 \((\alpha, \lambda)\) 또는 형태-척도 \((\alpha, \theta)\) 와의 대응은 다음과 같다.

\[ \alpha = \nu, \qquad \lambda = \nu/\mu, \qquad \theta = \mu/\nu. \]

매개변수화	밀도 형태	장점
\((\alpha, \lambda)\): 형태-비율	\(\frac{\lambda^\alpha}{\Gamma(\alpha)} y^{\alpha-1} e^{-\lambda y}\)	포아송 과정, 베이지안 켤레 사전분포
\((\alpha, \theta)\): 형태-척도	\(\frac{1}{\Gamma(\alpha)\theta^\alpha} y^{\alpha-1} e^{-y/\theta}\)	scipy, R `dgamma` 기본값
\((\mu, \nu)\): 평균-정밀도	위의 McCullagh 형태	GLM 분석: 평균과 산포를 직접 모형화

McCullagh 매개변수화의 최대 장점은 평균 \(\mu\) 와 산포 \(\sigma^2 = 1/\nu\) 가 분리되어, GLM에서 체계적 부분(\(\mu\) 의 모형)과 산포 추정을 독립적으로 다룰 수 있다는 점이다.

3 지수족 표현

감마 밀도를 지수족 정준형(canonical form)으로 전개하면 GLM 이론과 직접 연결된다.

로그 밀도를 정리하면

\[ \log f(y;\mu,\nu) = \nu\!\left(-\frac{y}{\mu} - \log\mu\right) + \nu\log\nu + \nu\log y - \log y - \log\Gamma(\nu). \]

\(\mu\) 에 관한 부분만 추출하면

\[ \ell(\mu;y) = \nu\!\left(-\frac{y}{\mu} - \log\mu\right) \]

이다. 이를 Ch.2의 지수족 표준형 \(\ell = \{y\theta - b(\theta)\}/a(\phi) + c(y,\phi)\) 과 대조하면

\[ \theta = -\frac{1}{\mu}, \qquad b(\theta) = -\log(-\theta) = \log\mu, \qquad a(\phi) = \frac{1}{\nu} = \sigma^2. \]

여기서 핵심 결과가 도출된다.

평균: \(b'(\theta) = 1/(-\theta) = \mu\)
분산 함수: \(V(\mu) = b''(\theta) = \mu^2\)

직관. 정준 모수 \(\theta = -1/\mu\) 는 역수(reciprocal)이다. 이것이 왜 감마 GLM의 정준 연결이 역수 연결 \(\eta = 1/\mu\) 인지를 설명한다. 분산 함수 \(V(\mu) = \mu^2\) 는 “분산이 평균의 제곱에 비례”한다는 변동계수 일정 조건을 지수족 언어로 정확히 표현한 것이다.

3.1 GLM 분산 함수 계층에서의 위치

분포	\(V(\mu)\)	분산-평균 관계	연결
정규	\(1\)	등분산	항등
포아송	\(\mu\)	\(\operatorname{var} \propto \mu\)	로그
감마	\(\mu^2\)	\(\operatorname{var} \propto \mu^2\) (일정 CV)	역수
역가우스	\(\mu^3\)	\(\operatorname{var} \propto \mu^3\)	\(1/\mu^2\)

이 계층은 Tweedie 분포족 \(V(\mu) = \mu^p\) 로 일반화되며, \(p = 0\)(정규) \(\to\) \(p = 1\)(포아송) \(\to\) \(p = 2\)(감마) \(\to\) \(p = 3\)(역가우스)으로 분산의 평균 의존도가 점점 강해진다. 감마는 이 스펙트럼의 한 가운데에 위치한다.

4 누율 생성 함수와 적률

4.1 누율 생성 함수(CGF)

\(Y \sim G(\mu,\nu)\) 의 누율 생성 함수는

\[ K(t) = \log E(e^{tY}) = -\nu \log\!\left(1 - \frac{\mu t}{\nu}\right), \qquad t < \nu/\mu. \]

유도 과정. 적률 생성 함수 \(M(t) = E(e^{tY})\) 를 직접 계산한다.

\[ M(t) = \int_0^\infty e^{ty}\, \frac{1}{\Gamma(\nu)} \left(\frac{\nu}{\mu}\right)^{\!\nu} y^{\nu-1} \exp\!\left(-\frac{\nu y}{\mu}\right) dy. \]

지수 부분을 합치면

\[ M(t) = \frac{(\nu/\mu)^\nu}{\Gamma(\nu)} \int_0^\infty y^{\nu-1} \exp\!\left(-\left(\frac{\nu}{\mu} - t\right)y\right) dy. \]

\(\nu/\mu - t > 0\) 일 때 적분은 \(\Gamma(\nu)/(\nu/\mu - t)^\nu\) 이므로

\[ M(t) = \left(\frac{\nu/\mu}{\nu/\mu - t}\right)^{\!\nu} = \left(1 - \frac{\mu t}{\nu}\right)^{-\nu}. \]

로그를 취하면 CGF \(K(t) = -\nu\log(1 - \mu t/\nu)\) 를 얻는다.

4.2 누율의 일반 공식

CGF를 \(t\) 에 대해 반복 미분하면

\[ K^{(r)}(t) = (r-1)!\,\mu^r\,\nu\!\left(\nu - \mu t\right)^{-r}. \]

\(t = 0\) 에서 평가하면 제 \(r\) 누율은

\[ \boxed{ \kappa_r = (r-1)!\;\frac{\mu^r}{\nu^{r-1}}. } \]

직관. 이 공식은 간결하고 아름답다. \(r\) 이 커질수록 \(\nu^{r-1}\) 이 분모에서 빠르게 커지므로, \(\nu\) 가 크면(정밀도가 높으면) 고차 누율이 급격히 소멸한다. 이것이 \(\nu \to \infty\) 에서 감마 분포가 정규 분포(모든 3차 이상 누율이 0)로 수렴하는 메커니즘이다.

4.3 처음 네 누율과 해석

\[ \begin{aligned} \kappa_1 &= E(Y) = \mu && \text{— 평균, 분포의 중심} \\ \kappa_2 &= \operatorname{var}(Y) = \mu^2/\nu && \text{— 분산, CV} = 1/\sqrt{\nu} \\ \kappa_3 &= 2\mu^3/\nu^2 && \text{— 3차 중심적률, 왜도 방향} \\ \kappa_4 &= 6\mu^4/\nu^3 && \text{— 4차 누율, 꼬리 무거움} \end{aligned} \]

표준화 왜도와 첨도:

\[ \gamma_1 = \frac{\kappa_3}{\kappa_2^{3/2}} = \frac{2}{\sqrt{\nu}}, \qquad \gamma_2 = \frac{\kappa_4}{\kappa_2^2} = \frac{6}{\nu}. \]

\(\nu\)	CV (\(\sigma\))	왜도 \(\gamma_1\)	초과 첨도 \(\gamma_2\)	해석
0.5	1.41	2.83	12	극도로 비대칭, 무거운 꼬리
1	1.00	2.00	6	지수 분포 수준
5	0.45	0.89	1.2	뚜렷한 단봉, 약간 비대칭
25	0.20	0.40	0.24	거의 정규에 가까움
100	0.10	0.20	0.06	사실상 정규

직관. 왜도 \(\gamma_1 = 2/\sqrt{\nu}\) 는 \(\nu\) 하나로 결정된다. 정밀도가 4배가 되면 왜도는 반으로 줄고, 100배가 되면 1/10로 줄어 정규에 수렴한다. 이것이 감마 분포가 “유연한 양의 연속 분포”로 널리 쓰이는 이유이다 – \(\nu\) 하나로 지수 분포의 극단적 비대칭부터 거의 정규까지 전체 스펙트럼을 커버한다.

5 형태 모수 \(\nu\) 의 역할

\(\nu\) 의 값에 따라 감마 밀도의 정성적 형태가 근본적으로 달라진다.

5.1 \(0 < \nu < 1\): 원점에서 극(pole)

\(dy\) 기준 밀도 \(f(y) \propto y^{\nu-1} e^{-\nu y/\mu}\) 에서 \(\nu - 1 < 0\) 이므로 \(y \to 0^+\) 일 때 \(f(y) \to \infty\) 이다. 밀도는 원점에서 무한대로 치솟고 단조 감소한다.

직관. \(\nu < 1\) 인 감마 분포는 “대부분의 관측값이 0에 매우 가깝지만, 드물게 매우 큰 값이 나온다”는 자료에 적합하다. 일일 강수량(비 온 날만)이나 소액 보험 청구금이 이런 형태를 보인다.

5.2 \(\nu = 1\): 지수 분포

\(G(\mu, 1) = \text{Exp}(\mu)\) 이다. 밀도는 \(f(y) = (1/\mu)e^{-y/\mu}\) 로 원점에서 시작하여 단조 감소한다. 포아송 과정에서 연속된 사건 사이의 대기 시간이 지수 분포를 따른다.

5.3 \(\nu > 1\): 단봉(unimodal) 분포

\(y^{\nu-1}\) 항이 원점에서 0이 되므로 밀도는 \(y = 0\) 에서 0이다. \(dy\) 기준 최빈값은

\[ \text{mode} = \mu\!\left(1 - \frac{1}{\nu}\right) = \mu\,\frac{\nu - 1}{\nu}. \]

직관. 최빈값이 평균보다 항상 작다 (\(\text{mode} < \mu\)). 이 격차는 \(1/\nu\) 에 비례하므로 \(\nu\) 가 커질수록 줄어든다. 양의 왜도(오른쪽 꼬리가 길다)의 직접적 결과이다.

5.4 \(d(\log y)\) 기준의 특별한 성질

\(d(\log y)\) 기준 밀도에서는 \(y^{\nu-1}\) 대신 \(y^\nu\) 가 나타나므로, 미분하면 최빈값이

\[ \text{mode}_{d(\log y)} = \mu, \qquad \forall\,\nu > 0 \]

로 항상 평균과 일치한다.

직관. 로그 스케일에서 감마 분포는 항상 \(\mu\) 를 중심으로 대칭에 가까운 형태를 보인다. 이것이 McCullagh & Nelder가 밀도를 \(d(\log y)\) 기준으로 정의한 이유이다. 변동계수가 일정한 자료에서는 “절대 크기”보다 “상대 크기”가 자연스러운 척도이기 때문이다.

5.5 \(\nu \to \infty\): 정규 극한

\(\nu \to \infty\) 이면 \(\operatorname{var}(Y) = \mu^2/\nu \to 0\) 이고, 표준화 변량 \(\sqrt{\nu}(Y/\mu - 1)\) 은 \(N(0,1)\) 로 수렴한다. 더 정확히는

\[ Y \;\overset{d}{\longrightarrow}\; N\!\left(\mu,\;\frac{\mu^2}{\nu}\right), \qquad \nu \to \infty. \]

왜도 \(2/\sqrt{\nu} \to 0\), 초과 첨도 \(6/\nu \to 0\) 이므로 모든 고차 누율이 소멸한다.

6 가중 감마 관측과 분산 성분

대부분의 응용에서 정밀도 \(\nu\) 는 모든 관측에 대해 동일하다고 가정한다. 그러나 가중 선형 최소제곱과의 유추로, 관측별로 \(\nu\) 를 달리할 수 있다.

\[ \nu_i = \nu \cdot w_i, \]

여기서 \(w_i\) 는 알려진 가중치이고 비례상수 \(\nu\) 가 공통 모수이다.

직관. 이는 “각 관측의 정밀도가 다르지만, 그 비율은 알려져 있다”는 설정이다. 가중 최소제곱에서 \(\operatorname{var}(Y_i) = \sigma^2/w_i\) 라고 놓는 것의 감마 버전이다.

6.1 분산 성분 추정에서의 응용

독립 정규 변량의 제곱합(또는 평균 제곱)은 자유도의 절반을 지표로 갖는 감마 분포를 따른다.

\[ Y_i = \text{(평균 제곱)} \sim G(\mu_i,\; w_i), \qquad w_i = f_i / 2, \]

여기서 \(f_i\) 는 자유도이다. ANOVA에서 평균 제곱을 분산 성분의 일차 결합으로 등치하는 고전적 방법은, 정확히 감마 분포에 항등 연결(\(\eta = \mu\))을 결합한 GLM이다. 이 관계는 §8.3.5에서 상세히 다룬다.

7 합성 성질(Closure under Convolution)

7.1 정리

\(Y_1, \ldots, Y_n\) 이 독립이고 \(Y_i \sim G(\mu, \nu)\) 이면

\[ \bar{Y} = \frac{1}{n}\sum_{i=1}^n Y_i \sim G(\mu,\; n\nu). \]

즉 표본 평균은 같은 평균을 갖되 정밀도가 \(n\) 배가 된 감마 분포를 따른다.

증명. CGF의 가법성에서 직접 따른다. \(\sum Y_i\) 의 CGF는

\[ K_{\sum Y_i}(t) = \sum_{i=1}^n K_{Y_i}(t) = -n\nu \log\!\left(1 - \frac{\mu t}{\nu}\right), \]

이는 \(G(n\mu, n\nu)\) 의 CGF이다. \(\bar{Y} = (\sum Y_i)/n\) 이므로 \(\bar{Y} \sim G(\mu, n\nu)\) 이다.

직관. 표본 크기가 \(n\) 배가 되면 정밀도도 \(n\) 배가 된다 – 이는 정규 분포에서 \(\operatorname{var}(\bar{Y}) = \sigma^2/n\) 인 것의 감마 버전이다. 감마족이 합성에 닫혀 있다는 것은, 표본 평균이 같은 분포족 안에 머문다는 뜻이므로 정확한 유한표본 추론이 가능하다.

7.2 에를랑 분포와 포아송 과정

정수 지표 \(\nu = k \in \mathbb{N}\) 인 감마 분포를 에를랑 분포(Erlangian distribution)라 한다. 단위 시간당 비율 \(\lambda = \nu/\mu\) 인 포아송 과정에서 \(k\) 번째 사건까지의 대기 시간 \(T_k\) 는

\[ T_k = \sum_{i=1}^k X_i, \qquad X_i \overset{\text{iid}}{\sim} \text{Exp}(\mu/\nu), \]

이므로 \(T_k \sim G(k\mu/\nu,\; k) = G(\mu,\; k)\) (재매개변수화하면)이다.

직관. 포아송 과정의 대기 시간이 감마 분포인 것은, “독립 지수 대기 시간의 합이 감마”라는 합성 성질의 직접적 결과이다. 이 연결은 감마 분포가 단순한 수학적 구성물이 아니라 현실 세계의 누적 대기 과정을 자연스럽게 기술한다는 것을 보여준다.

8 로그 우도와 세제곱근 정규화 변환

8.1 단일 관측의 로그 우도

단일 관측 \(y\) 에 대한 \(\mu\) 의 로그 우도(\(\nu\) 상수)는

\[ \ell(\mu) = -\nu\!\left(\frac{y}{\mu} + \log\mu\right) + \text{const}(\nu, y). \]

\(\mu\) 에 관한 부분만 추출하면

\[ \ell(\mu) \propto -\frac{y}{\mu} - \log\mu. \]

8.2 네 가지 스케일에서의 이차성

McCullagh & Nelder는 이 로그 우도를 네 가지 \(\mu\) 스케일 – \(\mu\), \(\log\mu\), \(\mu^{-1/3}\), \(\mu^{-1}\) – 에서 그린다 (Fig. 8.2). 결과:

스케일	이차성(quadraticity)
\(\mu\)	비대칭, 우측 꼬리가 매우 김
\(\log\mu\)	개선되었으나 여전히 비대칭
\(\mu^{-1/3}\)	거의 완벽한 이차식
\(\mu^{-1}\) (정준)	역방향 비대칭

직관. 우도 함수가 어떤 스케일에서 이차식에 가까우면, 그 스케일에서 MLE의 정규 근사가 정확하다. 감마 우도에 대해 이 최적 스케일이 역세제곱근 \(\mu^{-1/3}\) 이라는 것은 우연이 아니라, 감마 분포의 왜도-분산 구조에서 수학적으로 결정되는 결과이다.

8.3 이차 근사

\(\mu^{-1/3}\) 스케일에서 로그 우도의 이차 근사는

\[ \ell(\mu) - \ell(\hat\mu) \;\approx\; -\frac{9}{2}\,y^{2/3} \left(y^{-1/3} - \mu^{-1/3}\right)^2. \]

유도의 핵심. 로그 우도비가 \(\mu^{-1/3}\) 의 이차식이라는 것은, 변환 \(g(\mu) = \mu^{-1/3}\) 에서의 관측 정보 \(\mathcal{I}_{g}\) 가 \(\mu\) 에 거의 무관하다는 뜻이다. 이는 \(g\) 가 분산 안정화 변환의 역할을 겸하기 때문이다.

8.4 정규화 변환

우도비 통계량의 제곱근이 근사 정규라는 Wilks 정리와 위의 이차 근사를 결합하면, 감마 변량의 정규화 변환은

\[ \boxed{ Z = 3\left\{(Y/\mu)^{1/3} - 1\right\} \;\dot{\sim}\; N\!\left(0,\;\frac{1}{\nu}\right). } \]

이 변환은 Wilson & Hilferty (1931)가 카이제곱 분포(\(\chi^2_{2\nu} = 2\mu G(1, \nu)/1\))의 정규 근사 맥락에서 유도한 고전적 결과이다.

직관. 왜 하필 세제곱근인가?

감마 분포의 왜도는 \(\gamma_1 = 2/\sqrt{\nu} > 0\) (양의 왜도)이다
오목 변환 \(y \mapsto y^{1/3}\) 은 오른쪽 꼬리를 압축하고 왼쪽 꼬리를 늘여서 대칭에 가깝게 만든다
지수 \(1/3\) 은 3차 누율(왜도)과 4차 누율(첨도)을 동시에 최소화하는 최적값이다
일반적으로 \(\operatorname{var}(Y) \propto \mu^p\) 인 분포에서 최적 거듭제곱 변환의 지수는 \(1 - p/2\) 이다. 감마의 \(p = 2\) 를 대입하면 \(1 - 2/2 = 0\), 즉 로그 변환이 분산 안정화에 최적이지만, 정규화(왜도 제거)에 최적인 변환은 세제곱근(\(1/3\) 승)이다. 분산 안정화와 정규화의 최적 지수가 다르다는 점이 감마 분포의 독특한 특성이다

8.5 실용적 의미

\(\chi^2_k\) 분포의 정규 근사에서 \(Z = ((\chi^2/k)^{1/3} - 1 + 1/(9k)) / \sqrt{2/(9k)}\) 를 쓰는 Wilson-Hilferty 근사는 \(k \ge 10\) 이면 4자리 이상의 정밀도를 보이며, \(k = 2\)(\(\nu = 1\), 지수 분포) 정도의 극단적 경우에서도 중심 확률의 오차가 1% 미만이다. 이는 세제곱근 변환의 정규화 능력이 대단히 강력함을 보여준다.

9 감마 분포의 특수 경우와 관련 분포

9.1 카이제곱 분포

\(Y \sim G(\mu, \nu)\) 에서 \(W = 2\nu Y/\mu\) 로 놓으면 \(W \sim \chi^2_{2\nu}\) 이다. 역으로, 자유도 \(k\) 인 카이제곱은 \(\chi^2_k \sim G(k, k/2)\) 이다 (여기서 \(\mu = k\)).

9.2 지수 분포

\(\nu = 1\) 이면 \(G(\mu, 1) = \text{Exp}(\mu)\) 이다. 포아송 과정의 기본 빌딩 블록이다.

9.3 역감마 분포

\(Y \sim G(\mu, \nu)\) 이면 \(1/Y \sim \text{Inv-Gamma}\) 이다. 베이지안 분석에서 정규 분포의 분산 \(\sigma^2\) 에 대한 켤레 사전분포로 쓰인다.

9.4 베타 분포와의 관계

\(Y_1 \sim G(\mu_1, \nu_1)\), \(Y_2 \sim G(\mu_2, \nu_2)\) 이 독립이면

\[ \frac{Y_1/\mu_1}{Y_1/\mu_1 + Y_2/\mu_2} \sim \text{Beta}(\nu_1, \nu_2). \]

이 관계는 F 분포의 구성으로 이어진다.

10 Python 코드 예시

10.1 Step 1: 순수 Python으로 감마 밀도와 누율 직접 계산

import math

def gamma_pdf_mccullagh(y, mu, nu):
    """McCullagh (mu, nu) 매개변수화의 감마 밀도 (dy 기준)."""
    log_f = (
        nu * math.log(nu * y / mu)
        - nu * y / mu
        - math.log(y)
        - math.lgamma(nu)
    )
    return math.exp(log_f)

def gamma_cumulants(mu, nu, max_r=4):
    """처음 max_r개의 누율 반환."""
    return {
        r: math.factorial(r - 1) * mu**r / nu**(r - 1)
        for r in range(1, max_r + 1)
    }

# 예시: mu=10, nu=4 (CV = 0.5)
mu, nu = 10, 4
cums = gamma_cumulants(mu, nu)
print(f"kappa_1 (mean) = {cums[1]:.2f}")   # 10.00
print(f"kappa_2 (var)  = {cums[2]:.2f}")   # 25.00
print(f"skewness       = {2 / nu**0.5:.3f}")  # 1.000
print(f"excess kurt    = {6 / nu:.3f}")        # 1.500

# Wilson-Hilferty 정규화 변환
y = 12.5  # 관측값
z = 3 * ((y / mu)**(1/3) - 1)
print(f"정규화 변환 Z  = {z:.4f}")

10.2 Step 2: scipy 활용

import numpy as np
from scipy.stats import gamma as gamma_dist

# McCullagh (mu, nu) -> scipy (a=nu, scale=mu/nu)
mu, nu = 10, 4
a = nu
scale = mu / nu

rv = gamma_dist(a=a, scale=scale)

print(f"mean = {rv.mean():.2f}")
print(f"var  = {rv.var():.2f}")
print(f"skew = {rv.stats(moments='s'):.4f}")

# 밀도 플롯용 값
y = np.linspace(0.01, 30, 300)
pdf_vals = rv.pdf(y)

# Wilson-Hilferty 정규화 확인
samples = rv.rvs(size=10000, random_state=42)
z_samples = 3 * ((samples / mu)**(1/3) - 1)
print(f"Z mean = {z_samples.mean():.4f} (expect ~0)")
print(f"Z std  = {z_samples.std():.4f} (expect ~{1/nu**0.5:.4f})")

10.3 R 코드 참고

# R에서 shape-rate 매개변수화: dgamma(y, shape=nu, rate=nu/mu)
mu <- 10; nu <- 4
curve(dgamma(x, shape = nu, rate = nu / mu), from = 0, to = 30,
      ylab = "density", main = "Gamma(mu=10, nu=4)")

# 누율 확인
cat("mean =", mu, "\n")
cat("var  =", mu^2 / nu, "\n")
cat("skew =", 2 / sqrt(nu), "\n")

11 요약

항목	내용
매개변수	\((\mu, \nu)\): 평균, 정밀도. \(\sigma^2 = 1/\nu\) 는 변동계수의 제곱
지수족	\(\theta = -1/\mu\), \(b(\theta) = -\log(-\theta)\), \(V(\mu) = \mu^2\)
누율	\(\kappa_r = (r-1)!\,\mu^r/\nu^{r-1}\)
왜도/첨도	\(\gamma_1 = 2/\sqrt{\nu}\), \(\gamma_2 = 6/\nu\)
합성	\(\bar{Y} \sim G(\mu, n\nu)\) — 정밀도가 \(n\) 배
정규화	\(3\{(Y/\mu)^{1/3} - 1\} \;\dot\sim\; N(0, 1/\nu)\)
특수 경우	\(\nu=1\): 지수, \(\nu=k/2\): \(\chi^2_k/k\), \(\nu\to\infty\): 정규
GLM 위치	\(V(\mu)=\mu^2\), 정규(\(V=1\))와 역가우스(\(V=\mu^3\)) 사이

감마 분포는 §8.3에서 세 가지 연결 함수(역수, 로그, 항등)와 결합되어 감마 GLM의 확률 성분이 된다.