1 왜 쌍대성이 Ch.6 의 정수인가
§6.1 에서 이미 예고했듯, 로그선형 모형(Ch.6) 과 다항 반응 모형(Ch.4, Ch.5) 은 같은 수학의 두 얼굴이다. 이 사실이 통계학 실무에 주는 파급은 생각보다 크다.
- 소프트웨어 관점: 로지스틱 회귀와 로그선형 회귀를 별도 함수로 기억할 필요가 없다. 소프트웨어 하나 (
glm(..., family=poisson)) 로 둘 다 적합 가능 - 이론 관점: 다항 우도의 제약 (\(\sum_j \pi_j = 1\)) 처리가 번거로운데, 포아송으로 올려서 제약 없는 최적화 한 뒤 장해 모수를 소거하면 동일한 답이 나옴
- 검정 관점: 포아송 평균 비교가 자동으로 다항 검정이 됨. Fisher 의 정확검정부터 로지스틱까지 모두 이 쌍대성 위에 서 있음
독립 포아송의 총합을 고정 조건으로 두면, 조건부 우도는 다항 우도이고, 남은 장해 모수는 소거된다. 이 단순한 사실이 Ch.4~6 전체를 하나의 기계로 묶는다.
이 포스트는 §6.4 의 세 소절을 따라간다.
- §6.4.1: 가장 단순한 경우 — 두 개 이상 포아송 평균 비교
- §6.4.2: 일반화된 다항 반응 모형 (식 6.6→6.7)
- §6.4.3: 요약 — 쌍대성의 범위와 한계
2 §6.4.1 두 개 이상의 포아송 평균 비교
2.1 기본 설정
\(Y_1, \ldots, Y_k\) 가 독립 포아송, 평균 \(\mu_1, \ldots, \mu_k\). 검정할 가설:
\[ H_0: \mu_1 = \cdots = \mu_k = e^{\beta_0} \]
대안:
\[ H_A: \log \mu_j = \beta_0 + \beta_1 x_j \]
여기서 \(x_j\) 는 알려진 상수(예: 용량, 시간, 처리 수준). 장해 모수 는 \(\beta_0\), 관심 모수 는 \(\beta_1\).
2.2 충분통계량과 조건화
포아송 로그우도:
\[ \ell(\beta_0, \beta_1) = \beta_0 \sum_j y_j + \beta_1 \sum_j x_j y_j - \sum_j \exp(\beta_0 + \beta_1 x_j). \]
\(\beta_0\) 에 대한 충분통계량은 총합 \(Y_\bullet = \sum_j Y_j\), \(\beta_1\) 에 대한 충분통계량은 \(T = \sum_j x_j Y_j\).
Lehmann (1986) 의 원리: 장해 모수 \(\beta_0\) 를 제거하려면 그 충분통계량 \(Y_\bullet = m\) 을 조건으로 고정한다. 그러면 조건부 분포가 \(\beta_0\) 에 의존하지 않는다.
\[ (Y_1, \ldots, Y_k) \mid Y_\bullet = m \;\sim\; \text{Mult}(m, \boldsymbol{\pi}), \quad \pi_j = \frac{e^{\beta_1 x_j}}{\sum_i e^{\beta_1 x_i}}. \]
\(H_0\) 하에서 \(\beta_1 = 0\) 이면 \(\pi_j = 1/k\) 로 균일 다항.
직관 — 왜 조건화가 \(\beta_0\) 를 지우는가: \(\beta_0\) 는 “전체 기대 이벤트 수”를 결정한다. 총합을 관측 값으로 고정하면 “총합을 얼마나 기대했는가” 는 더 이상 질문이 아니다. 남은 질문은 “이 총합이 \(k\) 개 범주에 어떻게 분배되었는가” — 이것이 정확히 다항.
2.3 조건부 모멘트
조건부 \(T = \sum x_j Y_j \mid Y_\bullet = m\) 의 모멘트:
\[ \mathrm{E}(T \mid Y_\bullet = m) = m \bar{x}, \qquad \mathrm{Var}(T \mid Y_\bullet = m) = m \cdot \frac{1}{k}\sum_j (x_j - \bar{x})^2. \]
여기서 \(\bar{x} = \sum_j x_j / k\).
비교 — 무조건부 모멘트 추정치:
\[ \mathrm{Var}(T) \approx \sum_j x_j^2 y_\bullet / k = \sum_j x_j^2 \cdot m/k. \]
핵심 차이: 무조건부 분산은 \(x_j^2\) 의 합, 조건부 분산은 \((x_j - \bar{x})^2\) 의 합. 두 값이 일반적으로 매우 다르다. 특히 \(x_j\) 에 상수를 더해도 조건부 분산은 불변 (조건화가 상수 방향 정보를 제거하기 때문).
2.4 로그우도의 가법적 분해
파라미터 변환 \(\tau = \sum_j \exp(\beta_0 + \beta_1 x_j)\) 를 도입하면 포아송 로그우도가 두 독립 부분으로 깔끔하게 쪼개진다.
\[ \ell_Y(\tau, \beta_1) = \underbrace{y_\bullet \log \tau - \tau}_{\ell_m(\tau; m)} + \underbrace{\beta_1 \sum_j x_j y_j - m \log\!\left(\sum_j e^{\beta_1 x_j}\right)}_{\ell_{Y|m}(\beta_1; \mathbf{y})}. \]
- \(\ell_m(\tau; m)\): 총합 \(Y_\bullet \sim \text{Poisson}(\tau)\) 의 주변 로그우도, \(\tau\) 만의 함수
- \(\ell_{Y|m}(\beta_1; \mathbf{y})\): \(Y_\bullet = m\) 조건 하 다항 로그우도, \(\beta_1\) 만의 함수
의미 — 완전 정보 분리: \(\beta_1\) 에 관한 모든 정보가 조건부 로그우도에 들어있다. 주변 우도는 \(\beta_1\) 와 무관하므로, 최대우도 적합·검정·신뢰구간 모두 조건부 다항만 쓰면 된다.
2.5 피셔 정보행렬의 직교성
\((\tau, \beta_1)\) 의 피셔 정보행렬은 대각:
\[ \mathbf{i}_{\tau\beta} = \mathrm{diag}\!\left\{1/\tau, \; m \sum_j \pi_j (x_j - \bar{x})^2\right\}. \]
직교성(orthogonality) 의 의미: \(\hat\tau\) 와 \(\hat\beta_1\) 이 점근 독립. 두 모수의 추정이 서로 간섭하지 않는다. 이것은 파라미터 변환 \(\beta_0 \to \tau\) 가 수학적으로 특별한 선택이었기 때문에 가능하다 — 임의 변환으로는 이 직교성을 얻을 수 없다.
실무 함의: 검정통계량 \(T = \sum x_j y_j\) 의 분산을 총합의 변동 \(\mathrm{Var}(Y_\bullet)\) 과 독립적으로 추정할 수 있다. 분할표 검정의 전통적 형식이 이 직교성 덕분에 성립.
2.6 해석 — 샘플링 관점
\(T = \sum x_j Y_j\) 는 “크기 \(m\) 의 복원 추출 표본의 \(x\) 값 합”.
- \(H_0\): \(k\) 값이 모두 같은 확률 \(1/k\) 로 선택됨
- \(H_A\): \(x_j\) 큰 값이 \(\beta_1 > 0\) 이면 지수적으로 가중 되어 더 자주 선택됨
이것이 다항 지수 가족(exponential tilting) 의 원형. \(\beta_1\) 의 부호가 편향 방향을 정함.
3 §6.4.2 일반화된 다항 반응 모형
3.1 이원 데이터 구조
관측을 \(n \times k\) 표로 정렬. \(i = 1, \ldots, n\) 이 “행”(예: 공변량 조합), \(j = 1, \ldots, k\) 가 “열”(반응 범주).
로그선형 모형 (행별 장해 \(\phi_i\) 허용):
\[ \log \mu_{ij} = \phi_i + \mathbf{x}_{ij}^\top \boldsymbol{\beta} \tag{6.6} \]
- \(\phi_1, \ldots, \phi_n\): 행별 장해 모수(incidental parameters) — 행 합을 결정
- \(\boldsymbol{\beta}\): \(p\) 차원 관심 모수
- \(\mathbf{x}_{ij}\): \(i\) 행 \(j\) 열의 \(p\) 차원 공변량 벡터
3.2 왜 \(\phi_i\) 가 문제인가 — 일관성의 위기
\(\phi_i\) 의 개수가 \(n\) 에 따라 증가한다. 고정된 \(p\) 와 \(n \to \infty\) 극한에서 모수 공간 자체가 확장되므로 표준 점근이론이 깨질 수 있다. Neyman–Scott 문제(1948) 의 고전적 형태다.
MLE 의 점근 이론(일관성·정규성·효율성)은 표본 크기가 커져도 모수 개수는 고정 이라는 전제에서 성립한다. Neyman & Scott (1948) 은 그 전제가 깨지는 경우 — 관측치마다 별도의 모수가 딸려 와 \(n\) 이 커지면 모수 개수도 함께 증가하는 상황 — 에서 무조건부 MLE 가 일관성조차 잃을 수 있음 을 보였다. 고전 사례는 정규 쌍 \((Y_{i1}, Y_{i2}) \sim \mathcal N(\mu_i, \sigma^2)\) 에서 관측 쌍마다 \(\mu_i\) 가 다를 때 \(\hat\sigma^2\) 의 점근 편향이 고정되는 것. 여기서 \(\phi_i\) 가 행마다 독립이라는 구조가 바로 이 문제의 로그선형 버전이다.
해결책: 행 합 \(m_i = y_{i\bullet}\) 을 조건으로 고정. 그러면 조건부 우도에서 \(\phi_i\) 가 자동 소거되어 \(\beta\) 만 남고 일관성·효율성이 회복된다.
3.3 로그우도의 분해 — §6.4.1 의 일반화
\(\tau_i = \sum_j \mu_{ij} = \sum_j \exp(\phi_i + \mathbf{x}_{ij}^\top \boldsymbol{\beta})\) 로 파라미터 변환:
\[ \ell_Y(\boldsymbol{\tau}, \boldsymbol{\beta}) = \underbrace{\sum_i (m_i \log \tau_i - \tau_i)}_{\text{행별 포아송 우도}} + \underbrace{\sum_i \!\left\{\sum_j y_{ij} \mathbf{x}_{ij}^\top \boldsymbol{\beta} - m_i \log\!\left(\sum_j e^{\mathbf{x}_{ij}^\top \boldsymbol{\beta}}\right)\right\}}_{\text{행별 다항 우도}}. \]
두 부분으로 깨끗하게 분리. \(\boldsymbol{\beta}\) 는 두 번째 부분에만 등장.
3.4 다항 반응 모형 — 식 (6.7)
조건부 우도의 \(\pi_{ij}\) 를 읽어내면:
\[ \pi_{ij} = \frac{\exp(\mathbf{x}_{ij}^\top \boldsymbol{\beta})}{\sum_j \exp(\mathbf{x}_{ij}^\top \boldsymbol{\beta})}. \tag{6.7} \]
이것이 소프트맥스(softmax) 또는 기준범주 로짓(baseline-category logit) 모형 — §5.2.4 에서 명목형 반응에 쓴 바로 그 모형.
핵심 결과 (Palmgren, 1981):
로그선형 모형 (6.6) 과 다항 반응 모형 (6.7) 은 \(\hat{\boldsymbol{\beta}}\) 와 \(\mathrm{Cov}(\hat{\boldsymbol{\beta}})\) 에 대해 완전히 동치이다. 행 합을 조건화하든 안 하든 수치적으로 같은 답을 준다 (적절한 장해 모수가 로그선형 모형에 포함된 경우).
3.5 왜 이것이 실무에서 중요한가
| 측면 | 로그선형 관점 | 다항 관점 |
|---|---|---|
| 모수 수 | \(n + p\) (많음) | \(p\) (적음) |
| 제약 | 없음 | \(\sum_j \pi_{ij} = 1\) (다루기 번거로움) |
| 소프트웨어 | glm(..., family=poisson) 한 줄 |
전용 다항 라이브러리 |
| 수치 안정성 | 행이 많으면 \(\phi_i\) 가 polluting | 안정 |
| 확장성 | 3원, 4원 분할표로 자연스레 | 범주 수 늘면 복잡 |
실무 패턴: “다항 데이터를 포아송 모형으로 풀기” — 특히 희소하고 범주 수 많은 분할표에서 표준 관행. statsmodels, glm 모두 내부적으로 이 변환을 쓴다.
3.6 식 (6.8) — 도마뱀 데이터의 구체적 동치
§4.6 에서 로지스틱으로 다룬 Schoener (1970) 도마뱀 데이터. 종(species) \(R\) 이 이항 반응, 서식지 요인 \(H\) (perch height), \(D\) (perch diameter), \(S\) (sun), \(T\) (time of day) 가 공변량.
로지스틱 회귀 R ~ H + D + S + T 에 대응하는 로그선형 모형:
\[ H.D.S.T + R.(H + D + S + T) \tag{6.8} \]
독해:
- \(H.D.S.T\): 네 요인의 4차 완전 교호작용. 이것이 바로 다항 주변합 \(m_i\) 에 해당하는 장해 모수 \(\phi_i\)
- \(R.(H + D + S + T)\): 반응 \(R\) 과 각 공변량의 2차 교호작용. 이것이 로지스틱 회귀의 공변량 주효과에 해당
핵심 규칙: 로그선형 모형이 로지스틱과 동치가 되려면 모든 공변량 사이의 완전 교호작용 (\(H.D.S.T\)) 이 반드시 포함되어야 한다. 그것이 유의하지 않아 보여도 뺄 수 없다 — 빼면 주변합이 자유 모수가 되어 \(\phi_i\) 소거가 깨진다.
왜 “유의하지 않아도 포함”인가: 조건부 다항 해석에서 \(H.D.S.T\) 주변합은 관측된 \(m_i\) 값으로 고정 되어 있다. 이 고정은 “데이터가 주어졌다” 는 조건이지 검정할 대상이 아니다. 통상적 검정 논리와 다른 관점이 필요.
3.7 주변합 고정과 검정의 관계
“\(H.D.S.T\) 교호작용이 유의한가?” 는 “주변합 분포가 공변량 구조에 의존하는가?” 를 묻는 것이다. 실험 설계가 주변합을 고정했다면(예: 각 셀에 같은 수의 개체 할당) 이 질문은 의미가 없다. 관측 연구에서는 질문 자체는 가능하지만, 다항 해석에서는 그 질문에 답하기보다 조건화하는 것이 표준 관행.
이 미묘함은 §6.4.3 의 핵심 경고 로 이어진다.
4 §6.4.3 요약 — 쌍대성의 범위와 한계
4.1 쌍대성이 성립하는 경우
- 관심이 포아송 평균의 비율(ratio) 또는 총합 대비 비율 이면 조건화가 자연스럽다
- 다항 반응 모형이 식 (6.7) 형태 (소프트맥스 / 기준범주 로짓) 이면 로그선형과 동치
- 적절한 장해 모수 (\(\phi_i\)) 를 포함한 로그선형 은 다항 반응 모형과 수치적으로 같은 점추정·공분산을 준다
4.2 쌍대성이 깨지는 경우
McCullagh 가 명시적으로 지적하는 예외:
§5.2.2 의 비례 오즈 모형
\[ \text{logit}\,\gamma_j(\mathbf{x}) = \theta_j - \boldsymbol{\beta}^\top \mathbf{x} \]
은 일반적인 로그선형 모형의 조건부로 유도될 수 없다. 누적 확률 \(\gamma_j\) 에 링크를 걸기 때문이며, 이 구조는 로그선형 프레임 바깥에 있다.
마찬가지로 다음도 로그선형-다항 쌍대성의 밖:
- 비례 위험 모형 (보완로그로그 링크) — §5.2.2
- 연속 비율 모형 — §5.2.5
- 스케일이 공변량에 의존하는 일반화 비례 오즈 (식 5.4)
이들은 모두 누적 또는 조건부 확률에 기반 하므로, 개별 셀 확률 \(\pi_{ij}\) 에 soft-max 를 쓰는 (6.7) 과 구조적으로 다르다.
4.3 조건화의 “선택적” 성격 (Ch.7 과 대조)
McCullagh 의 흥미로운 관찰:
“이 장의 조건화는 거의 선택적(almost optional) 이다. 조건화하든 안 하든 \(\hat{\boldsymbol{\beta}}\) 와 공분산이 같다. 반면 Ch.7 의 조건부 우도는 전체 우도를 바꾸고, 최댓값 위치와 정밀도까지 달라진다.”
이 말의 의미: §6.4 에서 \(\phi_i\) 를 “포함한” 로그선형 MLE 와 “조건화한” 다항 MLE 가 같지만, 정확 검정(exact test) 을 쓰려면 조건화가 필수이다. 점추정은 같아도 참조 분포 가 달라지기 때문.
4.4 실무적 함의 정리
| 상황 | 무엇을 쓰나 |
|---|---|
| 간단한 소프트맥스 분류 | 다항 로지스틱 직접 적합 |
| 3원 이상 분할표 독립성 검정 | 로그선형 (Poisson GLM) |
| 희소 범주 + 많은 공변량 | 로그선형 — 수치 안정 |
| 정확 검정 | 조건화 필수 (Fisher·Monte Carlo) |
| 비례 오즈·연속비율 | 쌍대성 밖 — 전용 구현 사용 |
| 상호 링크된 분석 | 같은 데이터를 양쪽 해석 모두 제시 |
4.5 알고리즘 관점
반복 비례 적합(Iterative Proportional Fitting, IPF) (Bishop et al., 1975, p. 83) 는 로그선형 모형 전용 알고리즘으로, 장해 모수가 많아 연립방정식이 풀리지 않을 때 쓴다. 표준 IRLS (뉴턴-라프슨) 는 \(n + p\) 모수에 대해 \(O((n+p)^3)\) 행렬 연산이 필요하지만, IPF 는 주변합을 직접 맞추는 반복으로 \(O(nkp)\) 정도의 비용.
현대 컴퓨팅에서는 IPF 의 특혜가 줄었고, 보통 직접 다항 적합이 가능하지만, 수백만 셀을 가진 희소 분할표 (예: NLP, 지리 데이터) 에서는 여전히 IPF 가 실용적이다.
5 응용 — 쌍대성의 실제 사용
| 분야 | 쌍대성 활용 |
|---|---|
| 의학·역학 | 사례-대조 연구를 로지스틱 회귀로 변환 (Breslow–Day 검정) |
| 자연어처리 | 문맥 × 단어 분할표 → log-linear 언어 모형 |
| 사회과학 | 교차분류 패널 데이터의 로그선형 분석 = 다항 로짓 |
| 유전학 | 유전자형 × 표현형 분할표 → logit 회귀 |
| 마케팅 | 브랜드 선택 (choice set) 로지스틱 = 로그선형 |
| 생태학 | 종 × 서식지 선호 → 도마뱀 예제 재현 |
가장 중요한 실무 패턴: “로지스틱 회귀를 돌렸는데 수렴이 안 된다 / 셀이 너무 희소하다” 는 경우 로그선형 파라미터화로 재적합하는 것만으로 해결되는 경우가 많다.
6 코드 예시
6.1 Step 1: 포아송 ↔︎ 다항 수치 동치성
import numpy as np
import pandas as pd
import statsmodels.api as sm
from statsmodels.discrete.discrete_model import MNLogit
rng = np.random.default_rng(0)
n, k = 8, 3 # 8 행(공변량 조합), 3 범주
# 공변량 하나
x_rows = rng.normal(size=n)
beta_true = np.array([0.0, 0.7, -0.4]) # 범주별 기울기 (범주 1 = 기준)
phi_true = rng.normal(loc=2.5, size=n) # 행별 장해 모수
# 포아송 평균
mu = np.exp(phi_true[:, None] + x_rows[:, None] * beta_true[None, :])
counts = rng.poisson(mu)
# (A) 포아송 GLM — phi_i 를 행 factor 로 포함
df = pd.DataFrame(
[(i, j, x_rows[i], counts[i, j]) for i in range(n) for j in range(k)],
columns=["row", "col", "x", "y"],
)
df["row"] = df["row"].astype(str) # factor 로
df["col"] = df["col"].astype(str)
df["xcol"] = df["x"] * (df["col"] != "0") # col 1, 2 에만 x 효과
# 더 세련된 방식: col × x 교호작용
fit_pois = sm.GLM.from_formula(
"y ~ C(row) + C(col) + C(col):x",
data=df, family=sm.families.Poisson()
).fit()
print("=== 포아송 GLM: C(col):x 계수 (= 다항의 beta_j) ===")
coefs_pois = [p for name, p in zip(fit_pois.params.index, fit_pois.params)
if "C(col)[T." in name and ":x" in name]
print(np.array(coefs_pois).round(3))
# (B) 다항 로지스틱 — 같은 데이터를 개별 관측 레벨로 expand
rows_expand = []
for i in range(n):
for j in range(k):
rows_expand.extend([{"x": x_rows[i], "y": j}] * int(counts[i, j]))
df_exp = pd.DataFrame(rows_expand)
X = sm.add_constant(df_exp[["x"]])
fit_mnl = MNLogit(df_exp["y"], X).fit(disp=False)
print("\n=== 다항 로지스틱: x 계수 (범주 1, 2 대 기준) ===")
print(fit_mnl.params.loc["x"].values.round(3))관찰: 두 접근의 \(\hat\beta\) 가 거의 동일. 미세한 차이는 수치 최적화 허용오차. 이것이 §6.4.2 의 동치성 정리의 직접 확인.
6.2 Step 2: 식 (6.8) 도마뱀 모형 구조
import numpy as np
import pandas as pd
import statsmodels.api as sm
# 2x2x2x2 4원 분할표 + 종(R) = 2범주
# 간단한 시뮬 — Schoener 도마뱀 구조 모방
rng = np.random.default_rng(1)
factors = pd.DataFrame(
[(h, d, s, t) for h in (0, 1) for d in (0, 1)
for s in (0, 1) for t in (0, 1)],
columns=["H", "D", "S", "T"],
)
n_cells = len(factors)
m_per_cell = 30
# 각 셀에 2개 종의 개체 수 (이항)
prob_gr = 1 / (1 + np.exp(-(0.2 + 0.5 * factors["H"] - 0.3 * factors["D"]
+ 0.4 * factors["S"])))
y_gr = rng.binomial(m_per_cell, prob_gr)
y_op = m_per_cell - y_gr
# long-format
df = factors.assign(grahami=y_gr, opalinus=y_op)
df_long = df.melt(id_vars=["H", "D", "S", "T"],
value_vars=["grahami", "opalinus"],
var_name="species", value_name="count")
# 식 (6.8) 로그선형 모형: H.D.S.T + R.(H+D+S+T)
# species = R (2 수준)
# 4차 교호작용 H.D.S.T 는 반드시 포함
fit_loglin = sm.GLM.from_formula(
"count ~ C(H) * C(D) * C(S) * C(T) + C(species) * (C(H) + C(D) + C(S) + C(T))",
data=df_long, family=sm.families.Poisson()
).fit()
# 대응하는 로지스틱 회귀
df_bin = factors.assign(y=y_gr, m=y_gr + y_op)
fit_logit = sm.GLM.from_formula(
"y + I(m - y) ~ C(H) + C(D) + C(S) + C(T)",
data=df_bin, family=sm.families.Binomial()
).fit()
# 두 모형의 관심 계수(H, D, S, T 주효과) 비교
print("=== 로지스틱 ===")
print(fit_logit.params.round(3))
print("\n=== 로그선형 에서 R:H, R:D, R:S, R:T ===")
keys = [k for k in fit_loglin.params.index
if "species" in k and ":" in k and "D" not in k.split(":")[1] + "x"]
print(fit_loglin.params[
[k for k in fit_loglin.params.index
if k.startswith("C(species)[T.opalinus]:") and ":C(" not in k[26:]]
].round(3))두 적합의 공변량 주효과가 부호 반대 또는 동일하게 (기준 설정에 따라) 일치함을 확인.
6.3 R 대응
# 포아송 GLM (로그선형) = 다항 로지스틱
library(nnet)
fit_mnl <- multinom(y ~ x, data = df)
fit_pois <- glm(count ~ row + col + col:x, data = df_long,
family = poisson())
# 식 (6.8) 도마뱀
fit_logit <- glm(cbind(grahami, opalinus) ~ H + D + S + T,
data = df, family = binomial())
fit_loglin <- glm(count ~ H * D * S * T + species * (H + D + S + T),
data = df_long, family = poisson())
# 두 모형의 공변량 주효과가 정확히 같음을 확인
coef(fit_logit)
coef(fit_loglin)[grep("species", names(coef(fit_loglin)))]7 자주 걸리는 함정
| 함정 | 증상 | 처방 |
|---|---|---|
| 식 (6.8) 에서 H.D.S.T 누락 | 로그선형 \(\beta\) 가 로지스틱과 다름 | 완전 교호작용 \(\phi_i\) 항 필수 |
| \(\phi_i\) 유의 검정 시도 | 자유 모수가 아니라 고정 조건 | 장해 모수 검정은 무의미 |
| 비례 오즈를 로그선형으로 풀려고 시도 | 수렴 실패 또는 잘못된 답 | 전용 구현 사용 |
| 무조건부 분산을 조건부 분산과 동일시 | SE 과소/과대 평가 | 조건부 \(\sum(x-\bar{x})^2\) 공식 사용 |
| 희소 분할표에 로지스틱 직접 적합 | 수렴 실패, 분리(separation) | 로그선형 + IPF 또는 벌점화 |
| 쌍대성만 믿고 해석을 혼용 | 계수의 기준·단위 혼동 | “포아송 \(\beta\)” vs “다항 \(\beta\)” 명시 |
| 행 합 변화를 모형 요인으로 처리 | 쌍대성 깨짐 | 행 합은 조건 (주변 분포의 모수) |
| \(\phi_i\) 를 랜덤 효과로 재해석 | Ch.14 GLMM 과 혼동 | §6.4 는 고정 장해, 혼합효과는 다름 |
8 관련 주제
선행 지식
- Log-linear Models — 개관
- Likelihood Functions for Log-linear Models
- Log-linear Examples
- The Multinomial Distribution — 포아송 조건부 → 다항
- Measurement Scales — 비례 오즈가 쌍대성 밖인 이유
후속 주제 (placeholder)
관련 개념
- Conditional Likelihoods (Ch.7) — 참된 조건화 vs §6.4 의 “선택적” 조건화
- Neyman–Scott 문제 — 장해 모수 일관성
- Iterative Proportional Fitting
- Fisher’s Exact Test — 조건화의 극한 사례
- 사례-대조 연구와 로지스틱
9 참고문헌
- McCullagh, P. & Nelder, J. A. (1989). Generalized Linear Models (2nd ed.), §6.4. Chapman & Hall.
- Palmgren, J. (1981). The Fisher information matrix for log linear models arguing conditionally on observed explanatory variables. Biometrika, 68, 563–566.
- Lehmann, E. L. (1986). Testing Statistical Hypotheses (2nd ed.). Wiley.
- Neyman, J. & Scott, E. L. (1948). Consistent estimates based on partially consistent observations. Econometrica, 16, 1–32.
- Bishop, Y. M. M., Fienberg, S. E., & Holland, P. W. (1975). Discrete Multivariate Analysis. MIT Press.
- Breslow, N. E. & Day, N. E. (1980). Statistical Methods in Cancer Research, Vol. I: The Analysis of Case-Control Studies. IARC.
- Agresti, A. (2013). Categorical Data Analysis (3rd ed.). Wiley.