Aliasing — 식별불가의 두 얼굴과 추정가능함수

McCullagh & Nelder §3.5 — Intrinsic·Extrinsic Aliasing, Marginality, Estimability

McCullagh & Nelder (1989) §3.5 의 aliasing 이론을 심화한다. 설계 행렬의 부분공간이 겹칠 때 발생하는 식별불가(non-identifiability)를 intrinsic (모형식 자체) 과 extrinsic (데이터 분포) 로 구분하고, marginality 관계, estimable function, 제약의 선택이 왜 “모형의 일부가 아닌 관례”인지, 다항 회귀의 functional marginality 까지 — 수식과 직관으로 정리한다.

Statistics
GLM
Math
linear_algebra
저자

Kwangmin Kim

공개

2026년 04월 14일

1 왜 “Aliasing” 을 따로 다루는가

회귀를 실행하면 흔히 이런 메시지를 본다.

Coefficients: (1 not defined because of singularities)
1 coefficient is NA — may be aliased.

또는 lm.wfit: argument 'X' has rank deficient design matrix. 이것이 aliasing 의 표면적 증상이다. 원인은 한 가지 — 설계 행렬 \(\mathbf{X}\)열이 선형 종속 이라서 \((\mathbf{X}^\top\mathbf{X})\) 가 역행렬이 없다는 것.

하지만 “역행렬이 없다” 는 수치적 사실 뒤에는 통계적·기하학적 구조가 있다. McCullagh & Nelder §3.5 는 이 구조를 두 가지 관점으로 분석한다.

  1. 모형식이 본래 갖는 식별불가 — intrinsic aliasing.
  2. 관측 데이터가 우연히 만드는 식별불가 — extrinsic aliasing.

그리고 이 두 가지를 구분하면 실무적으로 완전히 다른 대응이 나온다. Intrinsic 은 제약(constraint)으로 우회하며 해석이 바뀌지 않지만, extrinsic 은 데이터 수집을 추가하거나 변수를 바꿔야 해결된다.

직관: aliasing 은 “이 두 효과를 구분할 정보가 없다” 는 선언이다. 모형이 “있다” 고 주장하는 매개변수가 실제로는 “구분 가능한 단일 양” 이 아닌 경우. §3.5 는 “무엇을 구분할 수 있는가 (estimable)” 를 명료화한다.


2 부분공간의 세 관계 — 기하학적 세팅

설계 행렬 \(\mathbf{X}\) 의 열들을 \(\mathbb R^n\) 안의 벡터로 보면, 각 항 (term) 은 여러 열이 span 하는 부분공간 (subspace) 을 정의한다. 두 항 \(P, Q\) 가 span 하는 부분공간의 관계는 세 가지뿐이다 (McCullagh Fig. 3.2).

관계 벤 다이어그램 \(\dim(P+Q)\)
(i) 독립 (disjoint) \(P, Q\) 가 겹치지 않음 \(p + q\)
(ii) 완전 포함 (fully aliased) \(Q \subseteq P\) \(p\)
(iii) 부분 겹침 (partially aliased) \(Q\)\(k\) 개가 \(P\) 에 포함 \(p + q - k\)
  1. 와 (ii) 는 (iii) 의 극단 (\(k=0, k=q\)). 실무에서 자주 보는 것은 (ii) 와 (iii).

\(\dim(P+Q) < p+q\) 가 되는 순간, 계수의 \(p+q\) 개를 구분할 수 없다 — aliasing 이다.

2.1 한 줄 정의

Aliasing

\(\mathbf{X}\) 의 열들 사이에 \(\sum_j \xi_j \mathbf{x}_j = \mathbf{0}\) 을 만족하는 비자명한 계수 \((\xi_j)_{j=1}^p\) 가 존재할 때. 이 경우 모수 \(\boldsymbol\beta\)\(\boldsymbol\beta + c\boldsymbol\xi\) 는 같은 \(\hat{\mathbf{y}} = \mathbf{X}\boldsymbol\beta\) 를 준다.

따라서 MLE 는 “직선” (또는 affine space) 으로 존재하며, 유일한 점이 없다.

직관: 겹침의 차원 \(k\)잃은 자유도의 수다. “왜 계수가 안 나와?” 의 답은 항상 “설계 행렬의 어떤 열이 다른 열들의 합으로 표현 가능” 이다.


3 Intrinsic Aliasing — 모형식이 본래 갖는 식별불가 (§3.5.1)

3.1 가장 간단한 사례 — 절편 + 요인

모형식 1 + A (절편 + 1 요인), 대수 표현

\[ \eta_{ij} \;=\; \mu + \alpha_i \]

여기서 \(i\) 는 요인 \(A\) 의 수준, \(j\) 는 수준 내 관측 인덱스.

\(A\)\(k\) 개 더미 벡터 \(\mathbf{u}_1, \dots, \mathbf{u}_k\) 는 관측마다 정확히 하나가 1 이고 나머지는 0 이므로

\[ \sum_{i=1}^k \mathbf{u}_i \;=\; \mathbf{1} \]

즉 모든 요인 더미의 합은 상수 벡터, 곧 절편의 더미. 따라서 \(\mu\)\(\sum \alpha_i\)구분 불가능.

\(\mathbf{X}\)\(k+1\) 열을 가지나 rank 는 \(k\). 열 하나가 잉여.

3.2 Intrinsic 이라는 말의 의미

이 aliasing 은 어떤 데이터가 관측되든 성립한다. 수준 배분이 어떻게 되든 “모든 관측이 어딘가 한 수준에 속한다” 는 사실 자체가 \(\sum \mathbf{u}_i = \mathbf{1}\) 을 만든다. 따라서 모형식이 내재적으로 갖는 식별불가. “Intrinsic (본래의)” 이라는 수식어의 정확한 의미다.

3.3 Marginality — 비대칭 포함

\(\mu\) 의 더미 (\(\mathbf{1}\)) 는 \(A\) 의 더미들이 span 하는 공간에 완전히 포함된다. 역은 성립하지 않는다 — \(A\) 의 개별 더미 \(\mathbf{u}_i\)\(\mathbf{1}\) 만으로 표현 불가. 이를

\[ \mu \;\text{is marginal to}\; \alpha_i \]

라 한다. Marginality 관계는 항들 사이의 부분 순서 (partial order) 를 만든다. 이 순서에는 실무적 결과가 따라온다.

  • \(\mu = 0\) 을 검정” 은 \(\alpha_i\) 가 알려지지 않은 상태에서는 의미가 없다. \(\mu\)\(\alpha_i\) 에 종속된 개념이기 때문.
  • Analysis-of-deviance 표의 항 순서는 marginality 에 따라야 한다.

3.4 추정가능함수 (Estimable Function)

\(\boldsymbol\beta\) 의 선형 결합 \(\mathbf{c}^\top\boldsymbol\beta\)추정가능 (estimable) 이라 함은, 모든 관측가능 불편 선형 추정량을 인정해도 유일한 값을 갖는 경우이다. 형식적으로

\[ \mathbf{c}^\top\boldsymbol\beta \text{ estimable} \iff \mathbf{c} \in \mathrm{range}(\mathbf{X}^\top) \]

모형 \(\mu + \alpha_i\) 에서 추정가능한 양은

  • \(\mu + \alpha_i\) (선형 예측자 자체)
  • \(\sum \lambda_i \alpha_i\) where \(\sum \lambda_i = 0\) (대조, contrast)

추정불가능한 양의 예:

  • \(\mu\) 자체 — 어떤 constant \(c\) 에 대해 \((\mu + c, \alpha_i - c)\) 가 같은 \(\eta\) 를 주므로.
  • \(\alpha_1\) 자체 — 같은 이유.

3.5 제약 (Constraint) 의 선택

개별 모수 \(\mu, \alpha_i\) 를 “풀기” 위해서는 제약이 필요하다. 세 가지 흔한 선택 (그룹 평균 6, 9, 12, 13 에 대한 숫자 예시).

제약 이름 결과
\(\hat\mu = 0\) corner (zero-intercept) \(\hat\alpha_i =\) 그룹 평균 자체 (6, 9, 12, 13)
\(\hat\alpha_1 = 0\) treatment (reference) \(\hat\mu = 6\) (기준 그룹), \(\hat\alpha_i =\) 1번 대비 차이 (0, 3, 6, 7)
\(\sum\hat\alpha_i = 0\) sum-to-zero (effects) \(\hat\mu = 10\) (전체 평균), \(\hat\alpha_i =\) 편차 (\(-4, -1, 2, 3\))
제약은 모형의 일부가 아니다

McCullagh 가 반복 강조: “Constraints on estimates are a convention only.”

  • 제약은 수치 해의 유일성 을 위한 도구다.
  • 제약을 바꿔도 모형의 의미는 변하지 않는다.
  • 추정가능한 양 (\(\mu + \alpha_i\), contrast \(\sum\lambda_i\alpha_i\)) 은 제약 선택과 무관하게 같다.
  • 제약을 “모형 가정” 으로 혼동하면 해석이 꼬인다.

직관: 세 제약은 같은 모형을 “다른 좌표계” 로 표현할 뿐이다. 그룹 평균·그룹 간 차이·전체 평균으로부터의 편차 — 모두 같은 사실의 다른 표현. R 의 기본값은 treatment, SAS 는 상황에 따라 다르고, ANOVA 전통은 sum-to-zero. 소프트웨어 전환 시 숫자가 달라 보여도 당황하지 않아야 한다.

3.6 가중 제약

그룹 크기가 다르면 \(\sum w_i\hat\alpha_i = 0\) (가중 sum-to-zero) 제약도 쓸 수 있다. \(\hat\mu\) 가 가중 평균, \(\hat\alpha_i\) 가 그로부터 편차. 불균형 설계에서 “전체 평균” 을 산술이 아닌 가중으로 정의하는 선택.


4 2-way 교차분류의 Aliasing (§3.5.2)

4.1 모형

1 + A + B + A.B, 대수 표현

\[ \eta_{ij} \;=\; \mu + \alpha_i + \beta_j + \gamma_{ij} \]

4.2 4 가지 marginality 관계

더미 벡터 수준에서 확인:

관계 설명
\(\sum_i \mathbf{u}_i^A = \mathbf{1}\) \(\alpha_i\) 전체 합이 \(\mu\)
\(\sum_j \mathbf{v}_j^B = \mathbf{1}\) \(\beta_j\) 전체 합이 \(\mu\)
\(\sum_j (\mathbf{u}\mathbf{v})_{ij} = \mathbf{u}_i^A\) \(\gamma_{ij}\)\(j\) 에 대해 합하면 \(\alpha_i\) 더미
\(\sum_i (\mathbf{u}\mathbf{v})_{ij} = \mathbf{v}_j^B\) \(\gamma_{ij}\)\(i\) 에 대해 합하면 \(\beta_j\) 더미

그리고 \(\sum_{ij}\gamma_{ij} = \mathbf{1}\).

4.3 부분 순서

\[ \mu \;\prec\; \alpha_i, \beta_j \;\prec\; \gamma_{ij} \]

\(\mu\)\(\alpha_i, \beta_j, \gamma_{ij}\) 전부에 marginal. \(\alpha_i\)\(\beta_j\) 는 서로 비교 불가지만 둘 다 \(\gamma_{ij}\) 에 marginal.

이 부분 순서가 hierarchical principle — “교호작용 항을 넣으면 그 주효과도 포함” — 의 기원이다.

4.4 추정가능한 양

\(2 \times 2\) 설계 (\(i,j \in \{1,2\}\)) 를 예로 보자. 모수는 9 개 (\(\mu, \alpha_1, \alpha_2, \beta_1, \beta_2, \gamma_{11}, \gamma_{12}, \gamma_{21}, \gamma_{22}\)) 지만 추정가능 독립 조합은 4 개뿐이다 (4 개 셀에 대응).

\[ \eta_{ij} = \mu + \alpha_i + \beta_j + \gamma_{ij}\quad (i,j=1,2) \]

추정가능 contrasts:

  • \(\sum_i \lambda_i (\alpha_i + \bar\gamma_{i\cdot})\) with \(\sum\lambda_i = 0\) — 행 간 대조.
  • \(\sum_j \lambda_j (\beta_j + \bar\gamma_{\cdot j})\) with \(\sum\lambda_j = 0\) — 열 간 대조.
  • \(\sum_{ij}\lambda_{ij}\gamma_{ij}\) with \(\sum_i\lambda_{ij} = \sum_j\lambda_{ij} = 0\) — 교호 대조.

직관: 행·열 주효과는 단독이 아니라 “평균 교호 보정 후” 의 형태로만 추정가능. 이는 실무적 중요성을 갖는다 — “\(\alpha_1\)\(\alpha_2\)” 를 해석할 때 교호작용이 평균화되어 섞여 있음을 기억해야 한다.

4.5 두 가지 표준 제약

\(2 \times 2\) 모형에서 9 모수 → 4 추정가능 → 5 개 독립 제약 필요.

(1) 대칭 제약 (sum-to-zero): \[ \hat\alpha_1+\hat\alpha_2 = 0,\quad \hat\beta_1+\hat\beta_2 = 0,\quad \hat\gamma_{1\cdot}=\hat\gamma_{\cdot 1}=\hat\gamma_{2\cdot}=\hat\gamma_{\cdot 2}=0 \]

(마지막 4 개 중 3 개만 독립.) 결과:

\[ \hat\mu = \bar y_{\cdot\cdot},\quad \hat\alpha_i = \bar y_{i\cdot} - \bar y_{\cdot\cdot},\quad \hat\beta_j = \bar y_{\cdot j} - \bar y_{\cdot\cdot},\quad \hat\gamma_{ij} = y_{ij} - \bar y_{i\cdot} - \bar y_{\cdot j} + \bar y_{\cdot\cdot} \]

전통적 ANOVA 분해의 모습이다. \(\hat\gamma_{ij}\) 는 “주효과 기반 예측으로부터 셀 \((i,j)\) 의 편차”.

(2) GLIM (corner) 제약: \[ \hat\alpha_1 = \hat\beta_1 = \hat\gamma_{11} = \hat\gamma_{12} = \hat\gamma_{21} = 0 \]

결과:

\[ \hat\mu = y_{11},\quad \hat\alpha_2 = y_{21}-y_{11},\quad \hat\beta_2 = y_{12}-y_{11},\quad \hat\gamma_{22} = y_{22}-y_{12}-y_{21}+y_{11} \]

좌상단 셀을 기준선으로. R 의 기본값 (contr.treatment).

4.6 두 제약의 일치 조건

흥미로운 관찰: \(\hat\gamma_{ij} = 0\) (교호 없음) 이면 두 제약의 주효과 contrast 가 동일. 추가로 \(\hat\alpha_i = \hat\beta_j = 0\) 이면 \(\hat\mu\) 도 같다. 이는 “제약이 모형의 의미를 바꾸지 않는다” 의 수치적 확인.

직관: 교호작용이 없는 단순 모형에서는 제약 선택의 영향이 사라진다. 교호가 들어가는 순간부터 개별 모수의 해석이 제약에 민감해진다 — 그래서 contrast 나 \(\eta_{ij}\) 수준에서 해석 하는 것이 안전하다.


5 Extrinsic Aliasing — 데이터 분포가 만드는 식별불가 (§3.5.3)

5.1 불균형 설계의 예

\(A\)\(B\) 각각 3 수준, \(3\times 3 = 9\) 조합 중 5 개만 관측됐다 하자.

         B=1  B=2  B=3
A=1       x    x    .
A=2       x    x    .
A=3       .    .    x

이 데이터에서는 \(A=3\) 인 관측과 \(B=3\) 인 관측이 정확히 같은 관측 (우측 하단 셀 하나). 따라서

\[ \mathbf{u}_3^A \;=\; \mathbf{v}_3^B \]

모형식 자체는 A + B 에 문제가 없지만, 이 특정 데이터 에서는 \(\alpha_3\)\(\beta_3\) 의 더미가 구분되지 않는다.

5.2 왜 이것이 extrinsic 인가

완전 설계 (\(3\times 3\) 모든 셀 관측) 에서는 \(\alpha_3\)\(\beta_3\) 이 별개 차원을 span 한다. 관측 분포가 표를 연결 불가능 (disconnected) 하게 쪼개면 주효과 부분공간이 축소된다. 한 관측을 옮기면 (\(A=2, B=2\)\(A=2, B=3\) 또는 \(A=3, B=1\) 로) aliasing 이 사라진다.

5.3 Intrinsic vs Extrinsic 비교

Intrinsic Extrinsic
원인 모형식 구조 (부분공간 포함) 관측 분포 (결측·불균형)
수정 방법 제약 설정 (reference level 등) 데이터 수집 확장, 또는 변수 축소
해석 영향 없음 (추정가능 양은 동일) 있음 — 구분 불가능한 모수가 새로 생김
예시 절편 + 요인 풀세트 실험군 모두 남성 (성별·처치 혼란)
재현성 모형식이 같으면 항상 발생 데이터별로 다름

5.4 실무 진단

Ralias() 함수, Python statsmodels 의 model.exog.shape vs rank_matrix(X) 비교로 확인 가능. QR 분해에서 \(R\) 의 대각 성분이 0 에 가까우면 rank deficient.

완전 분리 (complete separation) 는 로지스틱 회귀에서 흔한 extrinsic aliasing 의 병리적 형태 — 선형 결합으로 \(y\) 가 완벽 분리되면 MLE 가 발산.

직관: Extrinsic 은 “우연의 산물” 이라 예방 가능 — 실험 설계 시 randomization·factorial balance 를 지키거나, 관측 단계에서 모든 조합을 대표할 수 있도록 표본 설계.


6 Functional Marginality — 다항 항의 순서 (§3.5.4)

6.1 선형 독립인데 순서가 있다

\(\{x, x^2, x^3\}\)\(n \ge 4\) 이고 서로 다른 \(x\) 값이 4 개 이상이면 선형 독립. 따라서 aliasing 이 없다. 그런데도 모형식에 순서가 존재한다 — 왜?

6.2 예 1: 절편 없이 \(\beta_1 x\)

모형 \(\eta = \beta_1 x\) (절편 제외) 는 “\(x=0\) 에서 \(\eta = 0\)” 을 가정. 이것이 타당한가?

농업 비료 실험: \(x = 0\) (비료 0 kg) 이어도 토양에 이미 양분이 있어 \(\eta > 0\) 일 수 있다. 따라서 \(x=0\) 을 특수점으로 취급할 이유가 없으며, 절편을 제외하는 것은 강한 가정이다.

6.3 예 2: \(\beta_2 x^2\) 만 (선형 항 제외)

모형 \(\eta = \beta_0 + \beta_2 x^2\) 는 “\(x = 0\) 에서 극값” 을 가정. \(x\) 의 척도가 이동 가능하면 (예: 측정 기준이 \(x\)\(x + c\) 중 무엇이든 상관없음) 이 가정이 깨진다.

\[ \beta_0 + \beta_2(x+c)^2 \;=\; (\beta_0 + \beta_2 c^2) + 2\beta_2 c\,x + \beta_2 x^2 \]

척도 이동 후에는 선형 항 \(2\beta_2 c\,x\) 가 등장. 즉 선형 항을 빼면 “\(x=0\) 이 극값” 이라는 척도 특이성 을 가정하는 것.

6.4 예 3: 교호 \(\beta_{12}x_1 x_2\) 만 (주효과 제외)

모형 \(\eta = \beta_0 + \beta_{12}x_1 x_2\) (주효과 \(\beta_1 x_1, \beta_2 x_2\) 없이) 는 “\((0, 0)\) 이 반응 표면의 안장점 (saddle)” 을 가정. 일반적으로 이런 특이 가정은 정당화 어렵다.

6.5 일반 원칙

\[ \text{Functional marginality}: \text{고차 항을 포함하려면 하위 항도 포함} \]

  • \(x^2, x^3\) 을 쓸 거면 \(x\) 도.
  • \(x_1 x_2\) 를 쓸 거면 \(x_1, x_2\) 도.
  • \(x_1^2 x_2\) 를 쓸 거면 \(x_1, x_1^2, x_2, x_1 x_2\) 도.

Intrinsic aliasing 의 marginality 와 수학적 본질은 다르지만 (functional 은 선형 종속 아님), 모형 해석의 척도 불변성 관점에서 같은 권고가 나온다.

직관: functional marginality 는 “모형이 특정 원점에 의존하지 말아야 한다” 는 요구다. 측정 단위를 0 에서 시작할 수도, 100 에서 시작할 수도 있는데, 모형 해석이 그에 따라 바뀌면 안 된다. 하위 항을 모두 포함하면 이 불변성이 자동으로 보장된다.


7 코드 예시

7.1 Step 1: Intrinsic aliasing — rank deficient 진단

import numpy as np
import pandas as pd
from patsy import dmatrices

rng = np.random.default_rng(0)
df = pd.DataFrame({
    "y": rng.normal(size=20),
    "A": pd.Categorical(rng.choice(["a","b","c"], size=20)),
})

# (1) 정상: 절편 + A (reference 자동 제외)
_, X1 = dmatrices("y ~ A", df, return_type='dataframe')
print(f"y ~ A:         열 수 {X1.shape[1]}, rank {np.linalg.matrix_rank(X1)}")

# (2) 문제: 모든 수준의 더미를 강제
df_dum = pd.get_dummies(df["A"], prefix="A").astype(int)
X2 = np.column_stack([np.ones(len(df)), df_dum.values])
print(f"1 + 모든 더미: 열 수 {X2.shape[1]}, rank {np.linalg.matrix_rank(X2)} ← 1 deficient!")

# alias 관계 확인: sum(A_a, A_b, A_c) = 1
print(f"\n더미 합: {df_dum.sum(axis=1).unique()} (모든 관측에서 1)")

세 더미의 합이 상수 1 이 됨을 수치로 확인. 모형식 엔진 (y ~ A) 은 reference level 을 자동으로 제외해 rank 문제를 피한다.

7.2 Step 2: 제약 선택이 개별 모수에는 영향, 추정가능 양에는 영향 없음

import statsmodels.formula.api as smf
from patsy.contrasts import Treatment, Sum

# 그룹 평균 6, 9, 12, 13
n_per = 50
df_ex = pd.DataFrame({
    "y":  np.concatenate([rng.normal(m, 0.5, size=n_per) for m in [6, 9, 12, 13]]),
    "A":  pd.Categorical(np.repeat(["1","2","3","4"], n_per)),
})

# (1) Treatment (reference = 첫 수준)
m_treat = smf.ols("y ~ A", data=df_ex).fit()
# (2) Sum-to-zero
m_sum   = smf.ols("y ~ C(A, Sum)", data=df_ex).fit()

print("Treatment 제약:")
print(m_treat.params.round(2))
print("\nSum-to-zero 제약:")
print(m_sum.params.round(2))

# 추정가능 양 (fitted values) 비교
print(f"\n적합값 최대 차이: {np.abs(m_treat.fittedvalues - m_sum.fittedvalues).max():.2e}")

개별 계수는 크게 다르지만 적합값이 기계 정밀도 내에서 동일 — 추정가능 양은 제약과 무관하다는 원칙의 수치 확인.

7.3 Step 3: Extrinsic aliasing — 불균형 설계

# 5개 셀만 관측된 3x3 설계
rows = [("a","p"), ("a","q"), ("b","p"), ("b","q"), ("c","r")]
df_ext = pd.DataFrame({
    "A": pd.Categorical([r[0] for r in rows for _ in range(3)]),
    "B": pd.Categorical([r[1] for r in rows for _ in range(3)]),
    "y": rng.normal(size=15),
})

# 설계 행렬
_, X_ext = dmatrices("y ~ A + B", df_ext, return_type='dataframe')
print(f"y ~ A + B 열 수: {X_ext.shape[1]}, rank: {np.linalg.matrix_rank(X_ext)}")

# A=c 와 B=r 이 동일 관측에만 등장 → alias 발생 여부
print(f"A=c 인 관측이 B=r 일 확률: {(df_ext.query('A == \"c\"').B == 'r').mean()}")
print(f"B=r 인 관측이 A=c 일 확률: {(df_ext.query('B == \"r\"').A == 'c').mean()}")

\(A=c\) 인 모든 관측이 \(B=r\) 이라 두 더미가 동일해 rank 손실. 관측 분포가 만든 extrinsic aliasing 의 실제 모습.


8 흔한 실수

실수 처방
제약을 모형의 “가정” 으로 해석 제약은 수치 해 유일성 도구. 추정가능 양에는 영향 없음
R vs Python 계수값이 다르다고 당황 기본 제약(reference 선택) 이 달라서. contrast matrix 설정으로 통일 가능
교호 없을 때의 \(\alpha_i\) 해석을 교호 있을 때에도 그대로 교호 있으면 “평균 교호 보정 후” contrast 여야 함
Extrinsic aliasing 을 제약으로 해결 시도 제약은 intrinsic 에만 유효. Extrinsic 은 데이터 또는 변수 문제
이차항·교호 항만 넣고 선형 항 뺌 Functional marginality 위반. 척도 이동 불변성 깨짐
aliased 경고 무시하고 계수 해석 어느 계수가 NA 인지 확인하고 reference 변경 또는 변수 재설계

9 요약

  • Aliasing 은 부분공간 겹침. \(\mathbf{X}\) 열 간 선형 종속이 있으면 MLE 가 유일하지 않음.
  • Intrinsic: 모형식 구조가 낳는 식별불가. \(\sum\mathbf{u}_i^A = \mathbf{1}\) 같은 항등식이 원인. 제약으로 우회하며 추정가능 양은 변하지 않음.
  • Extrinsic: 데이터 분포가 낳는 식별불가. 특정 관측 조합이 우연히 종속. 데이터 변경 또는 변수 재설계 필요.
  • Marginality: \(\mu \prec \alpha_i \prec \gamma_{ij}\) 의 부분 순서. 교호 항을 넣으면 주효과도 포함 (hierarchical principle).
  • Estimable function: 제약과 무관하게 정의되는 양. \(\eta_{ij}\) 자체와 contrasts (\(\sum\lambda_i\alpha_i\) with \(\sum\lambda_i=0\)).
  • 제약 종류: zero-intercept, treatment, sum-to-zero, 가중 sum-to-zero. 같은 모형의 다른 좌표계일 뿐.
  • Functional marginality: 다항·교호의 하위 항 포함 원칙. 척도 원점 불변성을 위한 요구.

한 줄 요약: Aliasing 은 “무엇이 추정가능한가” 를 명료화하는 이론이다. 모형이 제공하는 듯 보이는 모든 모수가 실제로는 일부만 “식별 가능”하며, 나머지는 제약 선택에 따라 움직이는 좌표일 뿐이다. 이 구분이 명확해지면 불균형 설계·상호작용 모형·로지스틱의 “fitted prob = 1” 경고까지 모두 한 프레임으로 읽힌다.


10 관련 주제

선행 지식

관련 개념

후속 주제

  • Estimation (McCullagh §3.6) — 추정가능 양의 기하학적 해석
  • Firth logistic regression — 완전 분리 대응
  • Experimental design — extrinsic aliasing 예방

Subscribe

Enjoy this blog? Get notified of new posts by email: