Kwangmin Kim - Log-linear Models 과 Multinomial Response Models

1 왜 쌍대성이 Ch.6 의 정수인가

§6.1 에서 이미 예고했듯, 로그선형 모형(Ch.6) 과 다항 반응 모형(Ch.4, Ch.5) 은 같은 수학의 두 얼굴이다. 이 사실이 통계학 실무에 주는 파급은 생각보다 크다.

소프트웨어 관점: 로지스틱 회귀와 로그선형 회귀를 별도 함수로 기억할 필요가 없다. 소프트웨어 하나 (glm(..., family=poisson)) 로 둘 다 적합 가능
이론 관점: 다항 우도의 제약 (\(\sum_j \pi_j = 1\)) 처리가 번거로운데, 포아송으로 올려서 제약 없는 최적화 한 뒤 장해 모수를 소거하면 동일한 답이 나옴
검정 관점: 포아송 평균 비교가 자동으로 다항 검정이 됨. Fisher 의 정확검정부터 로지스틱까지 모두 이 쌍대성 위에 서 있음

§6.4 의 한 줄

독립 포아송의 총합을 고정 조건으로 두면, 조건부 우도는 다항 우도이고, 남은 장해 모수는 소거된다. 이 단순한 사실이 Ch.4~6 전체를 하나의 기계로 묶는다.

이 포스트는 §6.4 의 세 소절을 따라간다.

§6.4.1: 가장 단순한 경우 — 두 개 이상 포아송 평균 비교
§6.4.2: 일반화된 다항 반응 모형 (식 6.6→6.7)
§6.4.3: 요약 — 쌍대성의 범위와 한계

2 §6.4.1 두 개 이상의 포아송 평균 비교

2.1 기본 설정

\(Y_1, \ldots, Y_k\) 가 독립 포아송, 평균 \(\mu_1, \ldots, \mu_k\). 검정할 가설:

\[ H_0: \mu_1 = \cdots = \mu_k = e^{\beta_0} \]

대안:

\[ H_A: \log \mu_j = \beta_0 + \beta_1 x_j \]

여기서 \(x_j\) 는 알려진 상수(예: 용량, 시간, 처리 수준). 장해 모수 는 \(\beta_0\), 관심 모수 는 \(\beta_1\).

2.2 충분통계량과 조건화

포아송 로그우도:

\[ \ell(\beta_0, \beta_1) = \beta_0 \sum_j y_j + \beta_1 \sum_j x_j y_j - \sum_j \exp(\beta_0 + \beta_1 x_j). \]

\(\beta_0\) 에 대한 충분통계량은 총합 \(Y_\bullet = \sum_j Y_j\), \(\beta_1\) 에 대한 충분통계량은 \(T = \sum_j x_j Y_j\).

Lehmann (1986) 의 원리: 장해 모수 \(\beta_0\) 를 제거하려면 그 충분통계량 \(Y_\bullet = m\) 을 조건으로 고정한다. 그러면 조건부 분포가 \(\beta_0\) 에 의존하지 않는다.

\[ (Y_1, \ldots, Y_k) \mid Y_\bullet = m \;\sim\; \text{Mult}(m, \boldsymbol{\pi}), \quad \pi_j = \frac{e^{\beta_1 x_j}}{\sum_i e^{\beta_1 x_i}}. \]

\(H_0\) 하에서 \(\beta_1 = 0\) 이면 \(\pi_j = 1/k\) 로 균일 다항.

직관 — 왜 조건화가 \(\beta_0\) 를 지우는가: \(\beta_0\) 는 “전체 기대 이벤트 수”를 결정한다. 총합을 관측 값으로 고정하면 “총합을 얼마나 기대했는가” 는 더 이상 질문이 아니다. 남은 질문은 “이 총합이 \(k\) 개 범주에 어떻게 분배되었는가” — 이것이 정확히 다항.

2.3 조건부 모멘트

조건부 \(T = \sum x_j Y_j \mid Y_\bullet = m\) 의 모멘트:

\[ \mathrm{E}(T \mid Y_\bullet = m) = m \bar{x}, \qquad \mathrm{Var}(T \mid Y_\bullet = m) = m \cdot \frac{1}{k}\sum_j (x_j - \bar{x})^2. \]

여기서 \(\bar{x} = \sum_j x_j / k\).

비교 — 무조건부 모멘트 추정치:

\[ \mathrm{Var}(T) \approx \sum_j x_j^2 y_\bullet / k = \sum_j x_j^2 \cdot m/k. \]

핵심 차이: 무조건부 분산은 \(x_j^2\) 의 합, 조건부 분산은 \((x_j - \bar{x})^2\) 의 합. 두 값이 일반적으로 매우 다르다. 특히 \(x_j\) 에 상수를 더해도 조건부 분산은 불변 (조건화가 상수 방향 정보를 제거하기 때문).

2.4 로그우도의 가법적 분해

파라미터 변환 \(\tau = \sum_j \exp(\beta_0 + \beta_1 x_j)\) 를 도입하면 포아송 로그우도가 두 독립 부분으로 깔끔하게 쪼개진다.

\[ \ell_Y(\tau, \beta_1) = \underbrace{y_\bullet \log \tau - \tau}_{\ell_m(\tau; m)} + \underbrace{\beta_1 \sum_j x_j y_j - m \log\!\left(\sum_j e^{\beta_1 x_j}\right)}_{\ell_{Y|m}(\beta_1; \mathbf{y})}. \]

\(\ell_m(\tau; m)\): 총합 \(Y_\bullet \sim \text{Poisson}(\tau)\) 의 주변 로그우도, \(\tau\) 만의 함수
\(\ell_{Y|m}(\beta_1; \mathbf{y})\): \(Y_\bullet = m\) 조건 하 다항 로그우도, \(\beta_1\) 만의 함수

의미 — 완전 정보 분리: \(\beta_1\) 에 관한 모든 정보가 조건부 로그우도에 들어있다. 주변 우도는 \(\beta_1\) 와 무관하므로, 최대우도 적합·검정·신뢰구간 모두 조건부 다항만 쓰면 된다.

2.5 피셔 정보행렬의 직교성

\((\tau, \beta_1)\) 의 피셔 정보행렬은 대각:

\[ \mathbf{i}_{\tau\beta} = \mathrm{diag}\!\left\{1/\tau, \; m \sum_j \pi_j (x_j - \bar{x})^2\right\}. \]

직교성(orthogonality) 의 의미: \(\hat\tau\) 와 \(\hat\beta_1\) 이 점근 독립. 두 모수의 추정이 서로 간섭하지 않는다. 이것은 파라미터 변환 \(\beta_0 \to \tau\) 가 수학적으로 특별한 선택이었기 때문에 가능하다 — 임의 변환으로는 이 직교성을 얻을 수 없다.

실무 함의: 검정통계량 \(T = \sum x_j y_j\) 의 분산을 총합의 변동 \(\mathrm{Var}(Y_\bullet)\) 과 독립적으로 추정할 수 있다. 분할표 검정의 전통적 형식이 이 직교성 덕분에 성립.

2.6 해석 — 샘플링 관점

\(T = \sum x_j Y_j\) 는 “크기 \(m\) 의 복원 추출 표본의 \(x\) 값 합”.

\(H_0\): \(k\) 값이 모두 같은 확률 \(1/k\) 로 선택됨
\(H_A\): \(x_j\) 큰 값이 \(\beta_1 > 0\) 이면 지수적으로 가중 되어 더 자주 선택됨

이것이 다항 지수 가족(exponential tilting) 의 원형. \(\beta_1\) 의 부호가 편향 방향을 정함.

3 §6.4.2 일반화된 다항 반응 모형

3.1 이원 데이터 구조

관측을 \(n \times k\) 표로 정렬. \(i = 1, \ldots, n\) 이 “행”(예: 공변량 조합), \(j = 1, \ldots, k\) 가 “열”(반응 범주).

로그선형 모형 (행별 장해 \(\phi_i\) 허용):

\[ \log \mu_{ij} = \phi_i + \mathbf{x}_{ij}^\top \boldsymbol{\beta} \tag{6.6} \]

\(\phi_1, \ldots, \phi_n\): 행별 장해 모수(incidental parameters) — 행 합을 결정
\(\boldsymbol{\beta}\): \(p\) 차원 관심 모수
\(\mathbf{x}_{ij}\): \(i\) 행 \(j\) 열의 \(p\) 차원 공변량 벡터

3.2 왜 \(\phi_i\) 가 문제인가 — 일관성의 위기

\(\phi_i\) 의 개수가 \(n\) 에 따라 증가한다. 고정된 \(p\) 와 \(n \to \infty\) 극한에서 모수 공간 자체가 확장되므로 표준 점근이론이 깨질 수 있다. Neyman–Scott 문제(1948) 의 고전적 형태다.

Neyman–Scott 문제란 무엇인가

MLE 의 점근 이론(일관성·정규성·효율성)은 표본 크기가 커져도 모수 개수는 고정 이라는 전제에서 성립한다. Neyman & Scott (1948) 은 그 전제가 깨지는 경우 — 관측치마다 별도의 모수가 딸려 와 \(n\) 이 커지면 모수 개수도 함께 증가하는 상황 — 에서 무조건부 MLE 가 일관성조차 잃을 수 있음 을 보였다. 고전 사례는 정규 쌍 \((Y_{i1}, Y_{i2}) \sim \mathcal N(\mu_i, \sigma^2)\) 에서 관측 쌍마다 \(\mu_i\) 가 다를 때 \(\hat\sigma^2\) 의 점근 편향이 고정되는 것. 여기서 \(\phi_i\) 가 행마다 독립이라는 구조가 바로 이 문제의 로그선형 버전이다.

해결책: 행 합 \(m_i = y_{i\bullet}\) 을 조건으로 고정. 그러면 조건부 우도에서 \(\phi_i\) 가 자동 소거되어 \(\beta\) 만 남고 일관성·효율성이 회복된다.

3.3 로그우도의 분해 — §6.4.1 의 일반화

\(\tau_i = \sum_j \mu_{ij} = \sum_j \exp(\phi_i + \mathbf{x}_{ij}^\top \boldsymbol{\beta})\) 로 파라미터 변환:

\[ \ell_Y(\boldsymbol{\tau}, \boldsymbol{\beta}) = \underbrace{\sum_i (m_i \log \tau_i - \tau_i)}_{\text{행별 포아송 우도}} + \underbrace{\sum_i \!\left\{\sum_j y_{ij} \mathbf{x}_{ij}^\top \boldsymbol{\beta} - m_i \log\!\left(\sum_j e^{\mathbf{x}_{ij}^\top \boldsymbol{\beta}}\right)\right\}}_{\text{행별 다항 우도}}. \]

두 부분으로 깨끗하게 분리. \(\boldsymbol{\beta}\) 는 두 번째 부분에만 등장.

3.4 다항 반응 모형 — 식 (6.7)

조건부 우도의 \(\pi_{ij}\) 를 읽어내면:

\[ \pi_{ij} = \frac{\exp(\mathbf{x}_{ij}^\top \boldsymbol{\beta})}{\sum_j \exp(\mathbf{x}_{ij}^\top \boldsymbol{\beta})}. \tag{6.7} \]

이것이 소프트맥스(softmax) 또는 기준범주 로짓(baseline-category logit) 모형 — §5.2.4 에서 명목형 반응에 쓴 바로 그 모형.

핵심 결과 (Palmgren, 1981):

동치성 정리

로그선형 모형 (6.6) 과 다항 반응 모형 (6.7) 은 \(\hat{\boldsymbol{\beta}}\) 와 \(\mathrm{Cov}(\hat{\boldsymbol{\beta}})\) 에 대해 완전히 동치이다. 행 합을 조건화하든 안 하든 수치적으로 같은 답을 준다 (적절한 장해 모수가 로그선형 모형에 포함된 경우).

3.5 왜 이것이 실무에서 중요한가

측면	로그선형 관점	다항 관점
모수 수	\(n + p\) (많음)	\(p\) (적음)
제약	없음	\(\sum_j \pi_{ij} = 1\) (다루기 번거로움)
소프트웨어	`glm(..., family=poisson)` 한 줄	전용 다항 라이브러리
수치 안정성	행이 많으면 \(\phi_i\) 가 polluting	안정
확장성	3원, 4원 분할표로 자연스레	범주 수 늘면 복잡

실무 패턴: “다항 데이터를 포아송 모형으로 풀기” — 특히 희소하고 범주 수 많은 분할표에서 표준 관행. statsmodels, glm 모두 내부적으로 이 변환을 쓴다.

3.6 식 (6.8) — 도마뱀 데이터의 구체적 동치

§4.6 에서 로지스틱으로 다룬 Schoener (1970) 도마뱀 데이터. 종(species) \(R\) 이 이항 반응, 서식지 요인 \(H\) (perch height), \(D\) (perch diameter), \(S\) (sun), \(T\) (time of day) 가 공변량.

로지스틱 회귀 R ~ H + D + S + T 에 대응하는 로그선형 모형:

\[ H.D.S.T + R.(H + D + S + T) \tag{6.8} \]

독해:

\(H.D.S.T\): 네 요인의 4차 완전 교호작용. 이것이 바로 다항 주변합 \(m_i\) 에 해당하는 장해 모수 \(\phi_i\)
\(R.(H + D + S + T)\): 반응 \(R\) 과 각 공변량의 2차 교호작용. 이것이 로지스틱 회귀의 공변량 주효과에 해당

핵심 규칙: 로그선형 모형이 로지스틱과 동치가 되려면 모든 공변량 사이의 완전 교호작용 (\(H.D.S.T\)) 이 반드시 포함되어야 한다. 그것이 유의하지 않아 보여도 뺄 수 없다 — 빼면 주변합이 자유 모수가 되어 \(\phi_i\) 소거가 깨진다.

왜 “유의하지 않아도 포함”인가: 조건부 다항 해석에서 \(H.D.S.T\) 주변합은 관측된 \(m_i\) 값으로 고정 되어 있다. 이 고정은 “데이터가 주어졌다” 는 조건이지 검정할 대상이 아니다. 통상적 검정 논리와 다른 관점이 필요.

3.7 주변합 고정과 검정의 관계

“\(H.D.S.T\) 교호작용이 유의한가?” 는 “주변합 분포가 공변량 구조에 의존하는가?” 를 묻는 것이다. 실험 설계가 주변합을 고정했다면(예: 각 셀에 같은 수의 개체 할당) 이 질문은 의미가 없다. 관측 연구에서는 질문 자체는 가능하지만, 다항 해석에서는 그 질문에 답하기보다 조건화하는 것이 표준 관행.

이 미묘함은 §6.4.3 의 핵심 경고 로 이어진다.

4 §6.4.3 요약 — 쌍대성의 범위와 한계

4.1 쌍대성이 성립하는 경우

관심이 포아송 평균의 비율(ratio) 또는 총합 대비 비율 이면 조건화가 자연스럽다
다항 반응 모형이 식 (6.7) 형태 (소프트맥스 / 기준범주 로짓) 이면 로그선형과 동치
적절한 장해 모수 (\(\phi_i\)) 를 포함한 로그선형 은 다항 반응 모형과 수치적으로 같은 점추정·공분산을 준다

4.2 쌍대성이 깨지는 경우

McCullagh 가 명시적으로 지적하는 예외:

비례 오즈는 로그선형과 동치가 아니다

§5.2.2 의 비례 오즈 모형

\[ \text{logit}\,\gamma_j(\mathbf{x}) = \theta_j - \boldsymbol{\beta}^\top \mathbf{x} \]

은 일반적인 로그선형 모형의 조건부로 유도될 수 없다. 누적 확률 \(\gamma_j\) 에 링크를 걸기 때문이며, 이 구조는 로그선형 프레임 바깥에 있다.

마찬가지로 다음도 로그선형-다항 쌍대성의 밖:

비례 위험 모형 (보완로그로그 링크) — §5.2.2
연속 비율 모형 — §5.2.5
스케일이 공변량에 의존하는 일반화 비례 오즈 (식 5.4)

이들은 모두 누적 또는 조건부 확률에 기반 하므로, 개별 셀 확률 \(\pi_{ij}\) 에 soft-max 를 쓰는 (6.7) 과 구조적으로 다르다.

4.3 조건화의 “선택적” 성격 (Ch.7 과 대조)

McCullagh 의 흥미로운 관찰:

“이 장의 조건화는 거의 선택적(almost optional) 이다. 조건화하든 안 하든 \(\hat{\boldsymbol{\beta}}\) 와 공분산이 같다. 반면 Ch.7 의 조건부 우도는 전체 우도를 바꾸고, 최댓값 위치와 정밀도까지 달라진다.”

이 말의 의미: §6.4 에서 \(\phi_i\) 를 “포함한” 로그선형 MLE 와 “조건화한” 다항 MLE 가 같지만, 정확 검정(exact test) 을 쓰려면 조건화가 필수이다. 점추정은 같아도 참조 분포 가 달라지기 때문.

4.4 실무적 함의 정리

상황	무엇을 쓰나
간단한 소프트맥스 분류	다항 로지스틱 직접 적합
3원 이상 분할표 독립성 검정	로그선형 (Poisson GLM)
희소 범주 + 많은 공변량	로그선형 — 수치 안정
정확 검정	조건화 필수 (Fisher·Monte Carlo)
비례 오즈·연속비율	쌍대성 밖 — 전용 구현 사용
상호 링크된 분석	같은 데이터를 양쪽 해석 모두 제시

4.5 알고리즘 관점

반복 비례 적합(Iterative Proportional Fitting, IPF) (Bishop et al., 1975, p. 83) 는 로그선형 모형 전용 알고리즘으로, 장해 모수가 많아 연립방정식이 풀리지 않을 때 쓴다. 표준 IRLS (뉴턴-라프슨) 는 \(n + p\) 모수에 대해 \(O((n+p)^3)\) 행렬 연산이 필요하지만, IPF 는 주변합을 직접 맞추는 반복으로 \(O(nkp)\) 정도의 비용.

현대 컴퓨팅에서는 IPF 의 특혜가 줄었고, 보통 직접 다항 적합이 가능하지만, 수백만 셀을 가진 희소 분할표 (예: NLP, 지리 데이터) 에서는 여전히 IPF 가 실용적이다.

5 응용 — 쌍대성의 실제 사용

분야	쌍대성 활용
의학·역학	사례-대조 연구를 로지스틱 회귀로 변환 (Breslow–Day 검정)
자연어처리	문맥 × 단어 분할표 → log-linear 언어 모형
사회과학	교차분류 패널 데이터의 로그선형 분석 = 다항 로짓
유전학	유전자형 × 표현형 분할표 → logit 회귀
마케팅	브랜드 선택 (choice set) 로지스틱 = 로그선형
생태학	종 × 서식지 선호 → 도마뱀 예제 재현

가장 중요한 실무 패턴: “로지스틱 회귀를 돌렸는데 수렴이 안 된다 / 셀이 너무 희소하다” 는 경우 로그선형 파라미터화로 재적합하는 것만으로 해결되는 경우가 많다.

6 코드 예시

6.1 Step 1: 포아송 ↔︎ 다항 수치 동치성

import numpy as np
import pandas as pd
import statsmodels.api as sm
from statsmodels.discrete.discrete_model import MNLogit

rng = np.random.default_rng(0)
n, k = 8, 3           # 8 행(공변량 조합), 3 범주
# 공변량 하나
x_rows = rng.normal(size=n)
beta_true = np.array([0.0, 0.7, -0.4])   # 범주별 기울기 (범주 1 = 기준)
phi_true = rng.normal(loc=2.5, size=n)   # 행별 장해 모수

# 포아송 평균
mu = np.exp(phi_true[:, None] + x_rows[:, None] * beta_true[None, :])
counts = rng.poisson(mu)

# (A) 포아송 GLM — phi_i 를 행 factor 로 포함
df = pd.DataFrame(
    [(i, j, x_rows[i], counts[i, j]) for i in range(n) for j in range(k)],
    columns=["row", "col", "x", "y"],
)
df["row"] = df["row"].astype(str)   # factor 로
df["col"] = df["col"].astype(str)
df["xcol"] = df["x"] * (df["col"] != "0")  # col 1, 2 에만 x 효과
# 더 세련된 방식: col × x 교호작용
fit_pois = sm.GLM.from_formula(
    "y ~ C(row) + C(col) + C(col):x",
    data=df, family=sm.families.Poisson()
).fit()
print("=== 포아송 GLM: C(col):x 계수 (= 다항의 beta_j) ===")
coefs_pois = [p for name, p in zip(fit_pois.params.index, fit_pois.params)
              if "C(col)[T." in name and ":x" in name]
print(np.array(coefs_pois).round(3))

# (B) 다항 로지스틱 — 같은 데이터를 개별 관측 레벨로 expand
rows_expand = []
for i in range(n):
    for j in range(k):
        rows_expand.extend([{"x": x_rows[i], "y": j}] * int(counts[i, j]))
df_exp = pd.DataFrame(rows_expand)
X = sm.add_constant(df_exp[["x"]])
fit_mnl = MNLogit(df_exp["y"], X).fit(disp=False)
print("\n=== 다항 로지스틱: x 계수 (범주 1, 2 대 기준) ===")
print(fit_mnl.params.loc["x"].values.round(3))

관찰: 두 접근의 \(\hat\beta\) 가 거의 동일. 미세한 차이는 수치 최적화 허용오차. 이것이 §6.4.2 의 동치성 정리의 직접 확인.

6.2 Step 2: 식 (6.8) 도마뱀 모형 구조

import numpy as np
import pandas as pd
import statsmodels.api as sm

# 2x2x2x2 4원 분할표 + 종(R) = 2범주
# 간단한 시뮬 — Schoener 도마뱀 구조 모방
rng = np.random.default_rng(1)
factors = pd.DataFrame(
    [(h, d, s, t) for h in (0, 1) for d in (0, 1)
                   for s in (0, 1) for t in (0, 1)],
    columns=["H", "D", "S", "T"],
)
n_cells = len(factors)
m_per_cell = 30
# 각 셀에 2개 종의 개체 수 (이항)
prob_gr = 1 / (1 + np.exp(-(0.2 + 0.5 * factors["H"] - 0.3 * factors["D"]
                             + 0.4 * factors["S"])))
y_gr = rng.binomial(m_per_cell, prob_gr)
y_op = m_per_cell - y_gr

# long-format
df = factors.assign(grahami=y_gr, opalinus=y_op)
df_long = df.melt(id_vars=["H", "D", "S", "T"],
                  value_vars=["grahami", "opalinus"],
                  var_name="species", value_name="count")

# 식 (6.8) 로그선형 모형: H.D.S.T + R.(H+D+S+T)
# species = R (2 수준)
# 4차 교호작용 H.D.S.T 는 반드시 포함
fit_loglin = sm.GLM.from_formula(
    "count ~ C(H) * C(D) * C(S) * C(T) + C(species) * (C(H) + C(D) + C(S) + C(T))",
    data=df_long, family=sm.families.Poisson()
).fit()

# 대응하는 로지스틱 회귀
df_bin = factors.assign(y=y_gr, m=y_gr + y_op)
fit_logit = sm.GLM.from_formula(
    "y + I(m - y) ~ C(H) + C(D) + C(S) + C(T)",
    data=df_bin, family=sm.families.Binomial()
).fit()

# 두 모형의 관심 계수(H, D, S, T 주효과) 비교
print("=== 로지스틱 ===")
print(fit_logit.params.round(3))
print("\n=== 로그선형 에서 R:H, R:D, R:S, R:T ===")
keys = [k for k in fit_loglin.params.index
        if "species" in k and ":" in k and "D" not in k.split(":")[1] + "x"]
print(fit_loglin.params[
    [k for k in fit_loglin.params.index
     if k.startswith("C(species)[T.opalinus]:") and ":C(" not in k[26:]]
].round(3))

두 적합의 공변량 주효과가 부호 반대 또는 동일하게 (기준 설정에 따라) 일치함을 확인.

6.3 R 대응

# 포아송 GLM (로그선형) = 다항 로지스틱
library(nnet)
fit_mnl <- multinom(y ~ x, data = df)
fit_pois <- glm(count ~ row + col + col:x, data = df_long,
                family = poisson())

# 식 (6.8) 도마뱀
fit_logit <- glm(cbind(grahami, opalinus) ~ H + D + S + T,
                 data = df, family = binomial())
fit_loglin <- glm(count ~ H * D * S * T + species * (H + D + S + T),
                  data = df_long, family = poisson())

# 두 모형의 공변량 주효과가 정확히 같음을 확인
coef(fit_logit)
coef(fit_loglin)[grep("species", names(coef(fit_loglin)))]

7 자주 걸리는 함정

함정	증상	처방
식 (6.8) 에서 H.D.S.T 누락	로그선형 \(\beta\) 가 로지스틱과 다름	완전 교호작용 \(\phi_i\) 항 필수
\(\phi_i\) 유의 검정 시도	자유 모수가 아니라 고정 조건	장해 모수 검정은 무의미
비례 오즈를 로그선형으로 풀려고 시도	수렴 실패 또는 잘못된 답	전용 구현 사용
무조건부 분산을 조건부 분산과 동일시	SE 과소/과대 평가	조건부 \(\sum(x-\bar{x})^2\) 공식 사용
희소 분할표에 로지스틱 직접 적합	수렴 실패, 분리(separation)	로그선형 + IPF 또는 벌점화
쌍대성만 믿고 해석을 혼용	계수의 기준·단위 혼동	“포아송 \(\beta\)” vs “다항 \(\beta\)” 명시
행 합 변화를 모형 요인으로 처리	쌍대성 깨짐	행 합은 조건 (주변 분포의 모수)
\(\phi_i\) 를 랜덤 효과로 재해석	Ch.14 GLMM 과 혼동	§6.4 는 고정 장해, 혼합효과는 다름

8 관련 주제

선행 지식

Log-linear Models — 개관
Likelihood Functions for Log-linear Models
Log-linear Examples
The Multinomial Distribution — 포아송 조건부 → 다항
Measurement Scales — 비례 오즈가 쌍대성 밖인 이유

후속 주제 (placeholder)

관련 개념

Conditional Likelihoods (Ch.7) — 참된 조건화 vs §6.4 의 “선택적” 조건화
Neyman–Scott 문제 — 장해 모수 일관성
Iterative Proportional Fitting
Fisher’s Exact Test — 조건화의 극한 사례
사례-대조 연구와 로지스틱

9 참고문헌

McCullagh, P. & Nelder, J. A. (1989). Generalized Linear Models (2nd ed.), §6.4. Chapman & Hall.
Palmgren, J. (1981). The Fisher information matrix for log linear models arguing conditionally on observed explanatory variables. Biometrika, 68, 563–566.
Lehmann, E. L. (1986). Testing Statistical Hypotheses (2nd ed.). Wiley.
Neyman, J. & Scott, E. L. (1948). Consistent estimates based on partially consistent observations. Econometrica, 16, 1–32.
Bishop, Y. M. M., Fienberg, S. E., & Holland, P. W. (1975). Discrete Multivariate Analysis. MIT Press.
Breslow, N. E. & Day, N. E. (1980). Statistical Methods in Cancer Research, Vol. I: The Analysis of Case-Control Studies. IARC.
Agresti, A. (2013). Categorical Data Analysis (3rd ed.). Wiley.