Kwangmin Kim - Non-Linear Mixed Models (GLMM) — 식별 불가 설계에서 랜덤효과의 구원 (McCullagh §14.3)

1 서론 — §14.2 와 §14.3 의 핵심 차이

§14.2 의 선형 혼합 모형 (13-2) 은 로그 스케일 에서 작동했다:

\[\log Y_{ij(k)} = \alpha_i + \gamma_j + \tau_k + \epsilon_{ijk}.\]

이는 “먼저 데이터를 로그 변환 → 변환된 척도에서 정규 선형 모형” 접근. 로그 변환이 분산 안정화 + 가산성 확보 두 역할을 겸한다.

§14.3 의 접근은 다르다. 원 척도에서 GLM 으로 직접 다룬다:

조건부 평균 \(E(Y | \gamma) = M\) — 로그 링크로 모형화.
조건부 분산 \(\text{var}(Y | \gamma) = \sigma^2 V(M)\) — 분산 함수 \(V(\cdot)\) 직접 지정.
랜덤효과 \(\gamma_j \sim N(0, \sigma_b^2)\) — 정규 분포 가정.

왜 이것이 나은가: 원 척도 해석이 자연스럽고, 카운트·비율 데이터에 적절한 분산 함수 (Poisson, Binomial, Gamma) 를 직접 쓸 수 있다. 로그 변환의 근사 (특히 0 관측치 있을 때) 가 필요 없다.

이 구조가 GLMM (Generalized Linear Mixed Model) 의 원형이다. 이번 글은 §14.3 의 구성과 가장 교훈적 응용 — Table 14.2 의 식별 불가 설계 — 을 통해 랜덤효과 가정의 수학적 작용을 해부한다.

2 조건부 구조 — GLM 이 조건부로 작동

2.1 설정

조건부 1차·2차 모멘트:

\[ E(Y_{ij(k)} \mid \text{cow-class assignment}) = M_{ij(k)}, \]

\[ \text{var}(Y_{ij(k)} \mid \text{cow-class assignment}) = \sigma^2 V(M_{ij(k)}). \]

\(V(\cdot)\) 는 알려진 조건부 분산 함수. 모든 관측치는 조건부 독립 — 같은 cow class 든 다른 class 든 \(\gamma_j\) 가 주어진 상태에서는 독립.

2.2 로그선형 조건부 평균 (14.2)

\[\log M_{ij(k)} = \alpha_i + \gamma_j + \tau_k. \tag{14.2}\]

이 구조에서 각 조건부 평균은:

\[M_{ij(k)} = e^{\alpha_i} \cdot e^{\gamma_j} \cdot e^{\tau_k}.\]

세 곱셈 인자로 분해 됨. cow class \(j\) 의 효과가 상수 배율 \(e^{\gamma_j}\) 로 나타남 — 로그 링크 덕분에 가산 효과가 곱셈 효과로 번역.

2.3 분산 함수 \(V(\cdot)\) 선택

McCullagh-Nelder 는 두 가지 선택 을 비교한다.

\(V(M) = M\) (Poisson): 카운트 데이터의 표준. 조건부 분산 = 조건부 평균 × \(\sigma^2\). Ch.6 (§6.3) 의 분석이 이에 해당.

\(V(M) = M^2\) (Gamma): 조건부 CV = \(\sigma\) 가 일정. §14.2 의 로그 변환 분석이 이에 근사적으로 해당.

두 선택의 차이는 조건부 변동이 \(M\) 과 어떤 관계 인가의 물리적 가정에 있다. 카운트형 반응은 전자, 연속 양성 반응은 후자.

2.4 조건부 GLM 은 “추가 가정 없이” 추정 가능

핵심 관찰: 이 구조에서 모든 모수 (\(\alpha, \gamma, \tau\)) 를 조건부 GLM 으로 직접 추정 가능하다. \(\gamma_j\) 를 고정효과 로 취급해도 된다.

즉 아직 랜덤효과 가정이 필요하지 않다. §6.3 의 Table 6.1 분석 (Poisson + log link, \(V(M) = M\)) 이 바로 이 예.

왜 추가 가정 없이 가능한가

§14.2 와 달리 §14.3 은 로그 변환을 하지 않고 GLM 프레임으로 직접 처리한다. 4×4 라틴 정방의 모든 16 cell 이 관측됨 이 핵심 — 각 \(\gamma_j\) 에 4 관측치 (다른 \(\alpha_i, \tau_k\) 조합) 가 있어서 \(\gamma_j\) 각각을 추정할 정보가 충분.

GLM 의 IRLS 알고리즘이 \(\alpha, \gamma, \tau\) 모두를 동시에 조정하며 수렴 — 고전적 고정효과 분석.

따라서 “랜덤효과 = 추가 효율” 이지 “랜덤효과 = 필수” 가 아니다. 현 설계에서는 선택 사항.

3 랜덤효과 가정 (14.3) — 언제 필수가 되는가

3.1 가정

\[\gamma_j \sim N(0, \sigma_b^2) \quad \text{i.i.d.} \tag{14.3}\]

정규 분포 + 독립 동일. 실무에서 가장 흔한 선택 — 로그 척도의 대칭성과 편의성 때문.

3.2 가정이 효율을 올리는 메커니즘

기존 고정효과 추정도 일치성이 있지만: - \(\gamma_j\) 각각에 1 d.f. 씩 소비. - 4 cow class 면 3 d.f. 낭비. - 처치 · 부위 효과의 SE 가 그만큼 커짐.

랜덤효과로 처리하면: - \(\gamma_j\) 전체에 1 d.f. (단일 분산 \(\sigma_b^2\)) 만 소비. - 나머지 자유도가 처치 · 부위 SE 를 개선.

이 개선분이 랜덤효과 도입의 대가. 현 balanced 설계에서는 개선이 크지 않지만, unbalanced 또는 소규모 cluster 설계에서는 상당할 수 있다.

3.3 그러나 진짜 필수가 되는 순간 — 식별 불가 설계

McCullagh-Nelder 의 핵심 교훈이 등장하는 지점. 어떤 설계에서는 고정효과 모형으로 처치 효과가 추정 불가능. 이때 랜덤효과가 대안이 아니라 유일한 해결책.

4 Table 14.2 — Alternative Design 의 aliasing 문제

4.1 설계 구조

4 cow class + 4 처치 + 4 부위. 그러나 각 cow class 가 단 하나의 처치만 받음:

Cow class	I	II	III	IV	V	VI	VII	VIII
처치	A	B	C	D	A	B	C	D

8 cow class (2 반복). 각 class 의 4 부위 모두 같은 처치 적용.

4.2 고정효과 모형에서의 추정 불가성

\(\log M_{ij(k)} = \alpha_i + \gamma_j + \tau_k\) 에서 cow class \(j\) 와 처치 \(k\) 의 완전 공선:

Cow class I → 처치 A
Cow class II → 처치 B
…

\(\gamma_1 = \gamma_A\), \(\gamma_2 = \gamma_B\) 등이 구분 불가능. 어떤 cow class 효과를 증가시키고 해당 처치 효과를 감소시켜도 같은 예측값.

수식으로: 대조 \(\tau_A - \tau_B\) 가 \(\gamma_I - \gamma_{II}\) 와 합쳐진 형태 로만 추정 가능. 두 성분을 분리할 정보가 데이터에 없다.

이것이 aliasing (또는 confounding).

직관: “정보의 보존 법칙”

Table 14.2 설계에서 처치 대조 \(\tau_A - \tau_B\) 는 \(Y\) 자료에서 직접 관측 할 수 없다. 관측되는 건 “class I 평균 − class II 평균” 인데, 이 값은

\[(\tau_A - \tau_B) + (\gamma_I - \gamma_{II})\]

의 합. 두 성분이 같은 선형 조합에 겹쳐져 있다.

\(\gamma_I, \gamma_{II}\) 를 고정된 미지 모수 로 두면: 8 cow class → 8 \(\gamma\) + 4 \(\tau\) + 4 \(\alpha\) + 1 intercept = 17 모수. 32 관측치 (8 × 4) 와 비교해 자유도는 있지만, rank deficiency 로 \(\tau_k\) 와 \(\gamma_j\) 의 대조가 해체되지 않음.

정보량을 늘리지 않고 rank 를 높이는 유일한 방법이 “\(\gamma\) 에 분포 가정을 부과” 하는 것이다.

4.3 랜덤효과 가정이 해결하는 방식

\(\gamma_j \sim N(0, \sigma_b^2)\) 로 두면 \(\gamma\) 들이 더 이상 자유 모수가 아니다. 대신 \(\sigma_b^2\) 라는 단일 모수로 요약된 확률변수.

\(\tau_k\) 4 개 자유 모수.
\(\alpha_i\) 4 개 자유 모수.
\(\gamma_j\) — 자유 모수 아님. \(\sigma_b^2\) 하나로 요약.

\(\gamma\) 의 자유도가 사라지면서 \(\tau\) 의 자유도가 복원. 처치 대조가 추정 가능해진다.

5 주변 평균 (14.4) — \(e^{\sigma_b^2/2}\) 보정

5.1 유도

조건부 평균 \(M_{ij(k)} = e^{\alpha_i + \gamma_j + \tau_k}\). cow class 합계:

\[M_{\cdot j(k)} = \sum_i M_{ij(k)} = e^{\gamma_j} \cdot \sum_i e^{\alpha_i} \cdot e^{\tau_k}.\]

주변 평균 (랜덤효과 적분):

\[ \mu_{\cdot j(k)} = E(M_{\cdot j(k)}) = \sum_i e^{\alpha_i} \cdot E(e^{\gamma_j}) \cdot e^{\tau_k}. \]

5.2 로그-정규 적률 공식

\(\gamma \sim N(0, \sigma_b^2)\) 이면 \(e^\gamma\) 은 로그-정규 분포:

\[E(e^\gamma) = e^{\sigma_b^2/2}, \qquad \text{var}(e^\gamma) = e^{\sigma_b^2}(e^{\sigma_b^2} - 1).\]

이것은 정규 MGF \(M_\gamma(t) = e^{\mu t + \sigma^2 t^2/2}\) 에서 \(t = 1\) 대입 결과. \(\mu = 0, \sigma^2 = \sigma_b^2\) 에서 \(E(e^\gamma) = e^{\sigma_b^2/2}\).

직관: 왜 평균이 \(e^0 = 1\) 이 아닌가

\(\gamma \sim N(0, \sigma_b^2)\) 의 평균 은 0. 그러나 \(e^\gamma\) 의 평균은 \(e^{\sigma_b^2/2} > 1\).

이유: 지수 함수가 볼록 (convex). Jensen 부등식에 의해 \(E(e^\gamma) > e^{E(\gamma)} = e^0 = 1\).

수치 감각: \(\sigma_b = 1\) 이면 \(E(e^\gamma) = e^{0.5} \approx 1.65\) — 65% 높은 평균 이 나온다. 이 편향이 “\(\gamma\) 이 로그 스케일에서 평균 0 이지만 원 스케일에서는 평균 > 1” 라는 현상의 원천.

실무적 함의: 로그-정규 데이터의 산술 평균을 보고할 때 분산 \(\sigma_b^2\) 이 크면 “로그 평균 × \(e^{\sigma_b^2/2}\)” 의 편향을 유의. 작은 \(\sigma_b^2\) 에서는 무시 가능.

5.3 주변 평균 (14.4)

로그 스케일로 옮기면:

\[ \log \mu_{\cdot j(k)} = \tau_k + \underbrace{\log\left(\sum_i e^{\alpha_i}\right) + \sigma_b^2/2}_{\text{const}} = \tau_k + \text{const}. \tag{14.4} \]

주변 평균의 로그가 \(\tau_k\) 에만 의존. cow class \(j\) 는 사라진다 — 이것이 랜덤효과 적분의 효과.

5.4 의미

Table 14.2 설계에서 8 cow class 합계 \(Y_{\cdot j(k)}\) 는 8 개 독립 관측치. 그 중 2 개씩 같은 처치 → 4 처치 각 2 반복. 로그 평균이 \(\tau_k + \text{const}\) 이므로 4 처치 효과를 4 d.f. 로 추정 가능.

처치 효과의 대조 \(\tau_A - \tau_B\) 는 고정효과 모형에서 추정 불가 였지만, 랜덤효과 가정 하의 주변 모형에서는 직접 추정 가능 — “로그 평균 차이 = \(\tau_A - \tau_B\)” 로 간단.

6 주변 분산 (14.5) — 이차항의 출현

6.1 분산 분해 공식

조건부 분산 공식:

\[ \text{var}(Y_{\cdot j(k)}) = E[\text{var}(Y|\gamma)] + \text{var}[E(Y|\gamma)] \]

첫 항 = within-cluster 변동, 둘째 항 = cluster 평균 변동.

\(Y_{\cdot j(k)} = \sum_i Y_{ij(k)}\) 의 조건부 분산 = \(\sigma^2 \sum_i V(M_{ij(k)})\) (조건부 독립 가정):

\[ \text{var}(Y_{\cdot j(k)}) = \sigma^2 \sum_i E[V(M_{ij(k)})] + \text{var}(M_{\cdot j(k)}). \tag{14.5} \]

6.2 Case 1: \(V(M) = M\) (Poisson)

\(E[V(M_{ij(k)})] = E[M_{ij(k)}] = \mu_{ij(k)}\).

\(\text{var}(M_{\cdot j(k)}) = \text{var}(e^{\gamma_j}) \cdot (\sum_i e^{\alpha_i} \cdot e^{\tau_k})^2 = (e^{\sigma_b^2} - 1) e^{\sigma_b^2} \cdot C^2\)

여기서 \(C = \sum e^{\alpha} e^\tau\). \(\mu_{\cdot j(k)} = e^{\sigma_b^2/2} \cdot C\) 이므로 \(C^2 e^{\sigma_b^2} = \mu_{\cdot j(k)}^2\):

\[ \text{var}(Y_{\cdot j(k)}) = \sigma^2 \mu_{\cdot j(k)} + \mu_{\cdot j(k)}^2 (e^{\sigma_b^2} - 1). \]

(첫 항에서 \(e^{\sigma_b^2/2}\) 상수가 \(\mu\) 에 흡수된 형태로 조정.)

6.3 Case 2: \(V(M) = M^2\) (Gamma)

\(E[V(M_{ij(k)})] = E[M_{ij(k)}^2] = \mu_{ij(k)}^2 \cdot \{1 + \text{CV}^2(e^\gamma)\}\) — 로그-정규의 2 차 적률.

\(\text{var}(M_{\cdot j(k)}) = \mu_{\cdot j(k)}^2 \cdot \text{CV}^2(e^\gamma)\).

전체:

\[ \text{var}(Y_{\cdot j(k)}) = \mu_{\cdot j(k)}^2 \left\{\text{CV}^2(e^\gamma) + \frac{\sigma^2}{4}(1 + \text{CV}^2(e^\gamma))(1 + \text{CV}^2(e^\alpha))\right\}. \]

정확히 이차 — \(\mu^2\) 에 비례하는 분산 함수.

6.4 공통 해석 — 이차 과산포

두 경우 모두 주변 분산에 \(\mu^2\) 항이 등장.

Case 1 (Poisson 조건부): 주변이 Poisson 과 이차 과산포의 혼합. \(\sigma_b^2 \bar\mu \gg \sigma^2\) 이면 근사적 이차, 실무에서 음이항과 유사.
Case 2 (Gamma 조건부): 주변 분산도 정확히 이차 — Gamma 분산 함수 유지.

왜 주변이 이차인가 — 랜덤효과의 구조적 과산포

조건부 평균 \(M\) 이 \(\gamma\) 에 의해 지수적으로 scaling 되므로, \(M\) 의 주변 분산이 \(\mu^2\) 규모 로 커짐.

직관: “cluster 평균이 \(e^\gamma\) 배율로 흔들림 → 관측치도 그 배율로 흔들림 → 관측치 분산이 \(\mu^2\) 배율로 커짐.”

이것이 GLMM 이 자연스럽게 과산포를 모형화 하는 메커니즘. 음이항 회귀·Dirichlet-multinomial 같은 과산포 분포들이 실은 “Poisson + Gamma 랜덤효과” 같은 혼합 구조의 주변화 결과라는 통찰과 연결된다 (§10.2 음이항 = Poisson-Gamma 혼합).

6.5 실무 추정

주변 모형은 로그 링크 + 이차 분산 함수 GLM 으로 적합 가능. Gamma GLM 이 정확히 이 구조다.

따라서 Table 14.2 데이터 분석: 1. 각 cow class 합계 \(Y_{\cdot j(k)}\) 를 관측치로. 2. 로그 링크 + \(V(\mu) = \mu^2\) (Gamma) GLM 적합. 3. 처치 효과 \(\tau_k\) 가 추정됨. 4. CV 는 4 d.f. (8 관측치 - 4 처치 모수) 로 추정.

7 이원 분산 분해 — \(\sigma^2\) 와 \(\sigma_b^2\) 를 다른 부분에서 추정

7.1 두 산포의 분리

\(\sigma_b^2\) 추정 — cow class 합계의 분산 에서. 8 관측치의 CV 가 \(\sqrt{\text{CV}^2(e^\gamma) + \text{small}}\) 로 추정됨. 4 d.f. (반복 설계).

\(\sigma^2\) 추정 — 부위 내 변동 에서. 각 cow class 안의 4 부위 관측치가 조건부 분산 \(\sigma^2 V(M)\) 을 가짐. 각 cow class 에서 3 d.f., 8 cow class 총 21 d.f. (balanced 설계 8×3 에서 일부는 site/treatment 구조에 흡수).

이 21 d.f. 잔차 이탈도 가 \(\sigma^2\) 의 안정 추정치를 준다.

7.2 왜 이 분리가 중요한가

부위 효과 \(\alpha_i\) 의 SE 는 \(\sigma^2\) 만의 함수 (라틴 정방 직교성, 13-2 참조). \(\sigma_b^2\) 추정치가 부정확해도 \(\alpha_i\) 추정은 견고.

처치 효과 \(\tau_k\) 의 SE 는 Table 14.2 설계에서 \(\sigma_b^2\) 에 의존. cow class 간 변동이 처치 대조에 섞이기 때문.

실무적 함의: - 부위 효과 는 설계 세부와 무관하게 안정 추정. - 처치 효과 는 설계에 따라 SE 가 달라짐. Table 14.2 는 라틴 정방보다 훨씬 덜 효율적 — \(\sigma_b^2\) 가 SE 를 키움.

7.3 라틴 정방과의 대비

설계	\(\tau\) SE	\(\sigma_b^2\) 의 역할
4×4 라틴 정방 (§14.2)	\(\sigma/\sqrt{60}\)	완전 상쇄
Table 14.2 alternative (§14.3)	\(\sigma_b\) 관여	지배적

6 배 효율 차이를 낳는 것이 바로 이 \(\sigma_b^2\) 관여 여부. 짝 맞춤 설계의 정량적 가치.

8 Python 실전 — Table 14.2 시뮬레이션

import numpy as np
import statsmodels.api as sm
import pandas as pd

np.random.seed(42)

# 참 모수
alpha = np.array([0.0, 0.09, 0.13, -0.05])    # 부위 효과
tau = np.array([0.0, 0.15, -0.08, 0.25])      # 처치 효과
sigma_b = 0.5                                   # between-cow class SD (log scale)
sigma = 0.1                                     # within (조건부) SD

# Table 14.2 설계: 8 cow class, 각 class 가 한 처치만
# Class I,V → A; II,VI → B; III,VII → C; IV,VIII → D
n_classes = 8
treatments_per_class = ['A', 'B', 'C', 'D', 'A', 'B', 'C', 'D']
trt_map = {'A': 0, 'B': 1, 'C': 2, 'D': 3}

# cow class 랜덤효과
gamma = np.random.normal(0, sigma_b, n_classes)

# 데이터 생성
rows = []
for j in range(n_classes):
    trt = treatments_per_class[j]
    k = trt_map[trt]
    for i in range(4):  # sites
        # 조건부 평균 M
        log_M = alpha[i] + gamma[j] + tau[k]
        # 조건부 분포: Gamma (V(M)=M²)
        # shape = 1/σ², scale = M·σ²
        shape = 1 / sigma**2
        scale = np.exp(log_M) * sigma**2
        y = np.random.gamma(shape, scale)
        rows.append({
            'cow_class': j+1,
            'site': i+1,
            'treatment': trt,
            'y': y
        })

df = pd.DataFrame(rows)
print(df.head(12))

# 1. 고정효과 모형 시도 → 추정 실패 확인
print("\n=== 고정효과 모형 시도 (식별 불가) ===")
from statsmodels.formula.api import glm
try:
    m_fixed = glm('y ~ C(site) + C(cow_class) + C(treatment)',
                  data=df, family=sm.families.Gamma(link=sm.families.links.log())).fit()
    # 처치와 cow_class 가 aliased 이므로 성공해도 처치 계수가 NaN/unidentified
    print(m_fixed.params)
except Exception as e:
    print(f"적합 실패: {e}")

# 2. 주변 모형: cow_class 합계 사용
print("\n=== 주변 모형 (cow_class 합계, 이차 분산) ===")
df_sum = df.groupby(['cow_class', 'treatment'])['y'].sum().reset_index()
print(df_sum)

# Gamma GLM + log link: μ = exp(τ_k + const)
m_marg = glm('y ~ C(treatment)', data=df_sum,
             family=sm.families.Gamma(link=sm.families.links.log())).fit()
print(m_marg.summary().tables[1])

# 3. 또는 MixedLM 로 원자료에서 직접
print("\n=== MixedLM (원자료 + 로그 링크 근사) ===")
# log y 를 반응으로 (근사), cow_class 랜덤 intercept
df['log_y'] = np.log(df['y'])
md = sm.MixedLM.from_formula(
    'log_y ~ C(site) + C(treatment)',
    groups=df['cow_class'],
    data=df
)
mdf = md.fit()
print(mdf.summary().tables[1])
print(f"\nσ_b² 추정: {mdf.cov_re.iloc[0,0]:.4f} (참: {sigma_b**2:.4f})")

기대 관찰:

고정효과 모형: cow_class 와 treatment 가 완전 공선이므로 일부 계수가 singular 또는 NaN.
주변 모형 (cow_class 합계): Gamma GLM 으로 4 처치 효과 추정 성공. \(\tau_A - \tau_B\) 등의 대조 가능.
MixedLM (원자료): cow_class 를 랜덤 intercept 로 처리해 \(\tau\) 직접 추정. \(\sigma_b^2\) 도 추정됨.

8.1 주변 vs 조건부 접근의 동등성

Table 14.2 설계에서 두 접근이 점근적으로 동등: - 주변: cow class 합계를 관측치로, Gamma GLM. - 조건부: 원자료 + cow class 랜덤 intercept, MixedLM 또는 GLMM.

소표본에서는 차이 있을 수 있음. 실무는 MixedLM/GLMM 이 기본 (데이터 더 많이 활용).

9 요약 — §14.3 의 세 가지 교훈

9.1 교훈 1 — 로그 변환 대신 GLM 직접 적용

§14.2 와 §14.3 의 차이는 수학적이라기보다 철학적: - §14.2: 데이터를 변환해 정규 선형 모형으로 환원. - §14.3: 원 척도에서 GLM 프레임 유지, 조건부 분산 함수로 분포 구조 흡수.

두 접근이 동등한 결과를 낼 때도 있지만, 0 관측치 · 이산 반응 · 제로-인플레이션 같은 상황에서는 §14.3 접근이 분석적으로 깔끔 하다.

9.2 교훈 2 — 랜덤효과는 가끔 “유일한 해결책”

Table 14.2 는 고정효과 모형으로 추정 불가 한 대표 사례. 랜덤효과 가정이 “데이터 없는 정보” 를 만드는 것이 아니라 \(\gamma\) 의 자유도를 \(\sigma_b^2\) 하나로 흡수 해 \(\tau\) 의 rank 를 복원한다.

일반 원칙: unbalanced · nested · crossed 설계에서 aliasing 이 발생하면 랜덤효과 가정이 유일한 해결책 이 되는 경우가 많다. 이것이 다단계 임상시험 · 교차 설계 · 군집 무작위화 분석에서 GLMM 이 기본인 이유.

9.3 교훈 3 — 주변 분산의 이차 과산포 구조

랜덤효과의 지수적 영향이 주변 분산에 \(\mu^2\) 항 을 자동 도입. 이것이 음이항 회귀가 GLMM 의 특수 사례 라는 통찰의 일반화.

실무적 함의: “과산포 잡으려 음이항 사용” 과 “계층 구조 인정하고 GLMM 사용” 이 수학적으로 같은 일. 도메인 맥락에 따라 선택 — 계층이 뚜렷하면 GLMM, 단순 과산포면 음이항.

10 관련 주제

선행 지식

관련 개념 — 과산포와 혼합

Over-dispersion in Binomial (McCullagh §4.5)
Parameters in the Variance Function — 음이항 \(k\) · Poisson-Gamma 혼합 (McCullagh §11.2) — \(V(M) = M\) + Gamma 랜덤효과 = 음이항
Extended Quasi-Likelihood (McCullagh §9.6)

관련 개념 — 로그-정규

후속 주제