Kwangmin Kim - Aliasing — 식별불가의 두 얼굴과 추정가능함수

1 왜 “Aliasing” 을 따로 다루는가

회귀를 실행하면 흔히 이런 메시지를 본다.

Coefficients: (1 not defined because of singularities)
1 coefficient is NA — may be aliased.

또는 lm.wfit: argument 'X' has rank deficient design matrix. 이것이 aliasing 의 표면적 증상이다. 원인은 한 가지 — 설계 행렬 \(\mathbf{X}\) 의 열이 선형 종속 이라서 \((\mathbf{X}^\top\mathbf{X})\) 가 역행렬이 없다는 것.

하지만 “역행렬이 없다” 는 수치적 사실 뒤에는 통계적·기하학적 구조가 있다. McCullagh & Nelder §3.5 는 이 구조를 두 가지 관점으로 분석한다.

모형식이 본래 갖는 식별불가 — intrinsic aliasing.
관측 데이터가 우연히 만드는 식별불가 — extrinsic aliasing.

그리고 이 두 가지를 구분하면 실무적으로 완전히 다른 대응이 나온다. Intrinsic 은 제약(constraint)으로 우회하며 해석이 바뀌지 않지만, extrinsic 은 데이터 수집을 추가하거나 변수를 바꿔야 해결된다.

직관: aliasing 은 “이 두 효과를 구분할 정보가 없다” 는 선언이다. 모형이 “있다” 고 주장하는 매개변수가 실제로는 “구분 가능한 단일 양” 이 아닌 경우. §3.5 는 “무엇을 구분할 수 있는가 (estimable)” 를 명료화한다.

2 부분공간의 세 관계 — 기하학적 세팅

설계 행렬 \(\mathbf{X}\) 의 열들을 \(\mathbb R^n\) 안의 벡터로 보면, 각 항 (term) 은 여러 열이 span 하는 부분공간 (subspace) 을 정의한다. 두 항 \(P, Q\) 가 span 하는 부분공간의 관계는 세 가지뿐이다 (McCullagh Fig. 3.2).

관계	벤 다이어그램	\(\dim(P+Q)\)
(i) 독립 (disjoint)	\(P, Q\) 가 겹치지 않음	\(p + q\)
(ii) 완전 포함 (fully aliased)	\(Q \subseteq P\)	\(p\)
(iii) 부분 겹침 (partially aliased)	\(Q\) 중 \(k\) 개가 \(P\) 에 포함	\(p + q - k\)

와 (ii) 는 (iii) 의 극단 (\(k=0, k=q\)). 실무에서 자주 보는 것은 (ii) 와 (iii).

\(\dim(P+Q) < p+q\) 가 되는 순간, 계수의 \(p+q\) 개를 구분할 수 없다 — aliasing 이다.

2.1 한 줄 정의

Aliasing

\(\mathbf{X}\) 의 열들 사이에 \(\sum_j \xi_j \mathbf{x}_j = \mathbf{0}\) 을 만족하는 비자명한 계수 \((\xi_j)_{j=1}^p\) 가 존재할 때. 이 경우 모수 \(\boldsymbol\beta\) 와 \(\boldsymbol\beta + c\boldsymbol\xi\) 는 같은 \(\hat{\mathbf{y}} = \mathbf{X}\boldsymbol\beta\) 를 준다.

따라서 MLE 는 “직선” (또는 affine space) 으로 존재하며, 유일한 점이 없다.

직관: 겹침의 차원 \(k\) 가 잃은 자유도의 수다. “왜 계수가 안 나와?” 의 답은 항상 “설계 행렬의 어떤 열이 다른 열들의 합으로 표현 가능” 이다.

3 Intrinsic Aliasing — 모형식이 본래 갖는 식별불가 (§3.5.1)

3.1 가장 간단한 사례 — 절편 + 요인

모형식 1 + A (절편 + 1 요인), 대수 표현

\[ \eta_{ij} \;=\; \mu + \alpha_i \]

여기서 \(i\) 는 요인 \(A\) 의 수준, \(j\) 는 수준 내 관측 인덱스.

\(A\) 의 \(k\) 개 더미 벡터 \(\mathbf{u}_1, \dots, \mathbf{u}_k\) 는 관측마다 정확히 하나가 1 이고 나머지는 0 이므로

\[ \sum_{i=1}^k \mathbf{u}_i \;=\; \mathbf{1} \]

즉 모든 요인 더미의 합은 상수 벡터, 곧 절편의 더미. 따라서 \(\mu\) 와 \(\sum \alpha_i\) 가 구분 불가능.

\(\mathbf{X}\) 는 \(k+1\) 열을 가지나 rank 는 \(k\). 열 하나가 잉여.

3.2 Intrinsic 이라는 말의 의미

이 aliasing 은 어떤 데이터가 관측되든 성립한다. 수준 배분이 어떻게 되든 “모든 관측이 어딘가 한 수준에 속한다” 는 사실 자체가 \(\sum \mathbf{u}_i = \mathbf{1}\) 을 만든다. 따라서 모형식이 내재적으로 갖는 식별불가. “Intrinsic (본래의)” 이라는 수식어의 정확한 의미다.

3.3 Marginality — 비대칭 포함

\(\mu\) 의 더미 (\(\mathbf{1}\)) 는 \(A\) 의 더미들이 span 하는 공간에 완전히 포함된다. 역은 성립하지 않는다 — \(A\) 의 개별 더미 \(\mathbf{u}_i\) 는 \(\mathbf{1}\) 만으로 표현 불가. 이를

\[ \mu \;\text{is marginal to}\; \alpha_i \]

라 한다. Marginality 관계는 항들 사이의 부분 순서 (partial order) 를 만든다. 이 순서에는 실무적 결과가 따라온다.

“\(\mu = 0\) 을 검정” 은 \(\alpha_i\) 가 알려지지 않은 상태에서는 의미가 없다. \(\mu\) 가 \(\alpha_i\) 에 종속된 개념이기 때문.
Analysis-of-deviance 표의 항 순서는 marginality 에 따라야 한다.

3.4 추정가능함수 (Estimable Function)

\(\boldsymbol\beta\) 의 선형 결합 \(\mathbf{c}^\top\boldsymbol\beta\) 가 추정가능 (estimable) 이라 함은, 모든 관측가능 불편 선형 추정량을 인정해도 유일한 값을 갖는 경우이다. 형식적으로

\[ \mathbf{c}^\top\boldsymbol\beta \text{ estimable} \iff \mathbf{c} \in \mathrm{range}(\mathbf{X}^\top) \]

모형 \(\mu + \alpha_i\) 에서 추정가능한 양은

\(\mu + \alpha_i\) (선형 예측자 자체)
\(\sum \lambda_i \alpha_i\) where \(\sum \lambda_i = 0\) (대조, contrast)

추정불가능한 양의 예:

\(\mu\) 자체 — 어떤 constant \(c\) 에 대해 \((\mu + c, \alpha_i - c)\) 가 같은 \(\eta\) 를 주므로.
\(\alpha_1\) 자체 — 같은 이유.

3.5 제약 (Constraint) 의 선택

개별 모수 \(\mu, \alpha_i\) 를 “풀기” 위해서는 제약이 필요하다. 세 가지 흔한 선택 (그룹 평균 6, 9, 12, 13 에 대한 숫자 예시).

제약	이름	결과
\(\hat\mu = 0\)	corner (zero-intercept)	\(\hat\alpha_i =\) 그룹 평균 자체 (6, 9, 12, 13)
\(\hat\alpha_1 = 0\)	treatment (reference)	\(\hat\mu = 6\) (기준 그룹), \(\hat\alpha_i =\) 1번 대비 차이 (0, 3, 6, 7)
\(\sum\hat\alpha_i = 0\)	sum-to-zero (effects)	\(\hat\mu = 10\) (전체 평균), \(\hat\alpha_i =\) 편차 (\(-4, -1, 2, 3\))

제약은 모형의 일부가 아니다

McCullagh 가 반복 강조: “Constraints on estimates are a convention only.”

제약은 수치 해의 유일성 을 위한 도구다.
제약을 바꿔도 모형의 의미는 변하지 않는다.
추정가능한 양 (\(\mu + \alpha_i\), contrast \(\sum\lambda_i\alpha_i\)) 은 제약 선택과 무관하게 같다.
제약을 “모형 가정” 으로 혼동하면 해석이 꼬인다.

직관: 세 제약은 같은 모형을 “다른 좌표계” 로 표현할 뿐이다. 그룹 평균·그룹 간 차이·전체 평균으로부터의 편차 — 모두 같은 사실의 다른 표현. R 의 기본값은 treatment, SAS 는 상황에 따라 다르고, ANOVA 전통은 sum-to-zero. 소프트웨어 전환 시 숫자가 달라 보여도 당황하지 않아야 한다.

3.6 가중 제약

그룹 크기가 다르면 \(\sum w_i\hat\alpha_i = 0\) (가중 sum-to-zero) 제약도 쓸 수 있다. \(\hat\mu\) 가 가중 평균, \(\hat\alpha_i\) 가 그로부터 편차. 불균형 설계에서 “전체 평균” 을 산술이 아닌 가중으로 정의하는 선택.

4 2-way 교차분류의 Aliasing (§3.5.2)

4.1 모형

1 + A + B + A.B, 대수 표현

\[ \eta_{ij} \;=\; \mu + \alpha_i + \beta_j + \gamma_{ij} \]

4.2 4 가지 marginality 관계

더미 벡터 수준에서 확인:

관계	설명
\(\sum_i \mathbf{u}_i^A = \mathbf{1}\)	\(\alpha_i\) 전체 합이 \(\mu\)
\(\sum_j \mathbf{v}_j^B = \mathbf{1}\)	\(\beta_j\) 전체 합이 \(\mu\)
\(\sum_j (\mathbf{u}\mathbf{v})_{ij} = \mathbf{u}_i^A\)	\(\gamma_{ij}\) 을 \(j\) 에 대해 합하면 \(\alpha_i\) 더미
\(\sum_i (\mathbf{u}\mathbf{v})_{ij} = \mathbf{v}_j^B\)	\(\gamma_{ij}\) 을 \(i\) 에 대해 합하면 \(\beta_j\) 더미

그리고 \(\sum_{ij}\gamma_{ij} = \mathbf{1}\).

4.3 부분 순서

\[ \mu \;\prec\; \alpha_i, \beta_j \;\prec\; \gamma_{ij} \]

\(\mu\) 는 \(\alpha_i, \beta_j, \gamma_{ij}\) 전부에 marginal. \(\alpha_i\) 와 \(\beta_j\) 는 서로 비교 불가지만 둘 다 \(\gamma_{ij}\) 에 marginal.

이 부분 순서가 hierarchical principle — “교호작용 항을 넣으면 그 주효과도 포함” — 의 기원이다.

4.4 추정가능한 양

\(2 \times 2\) 설계 (\(i,j \in \{1,2\}\)) 를 예로 보자. 모수는 9 개 (\(\mu, \alpha_1, \alpha_2, \beta_1, \beta_2, \gamma_{11}, \gamma_{12}, \gamma_{21}, \gamma_{22}\)) 지만 추정가능 독립 조합은 4 개뿐이다 (4 개 셀에 대응).

\[ \eta_{ij} = \mu + \alpha_i + \beta_j + \gamma_{ij}\quad (i,j=1,2) \]

추정가능 contrasts:

\(\sum_i \lambda_i (\alpha_i + \bar\gamma_{i\cdot})\) with \(\sum\lambda_i = 0\) — 행 간 대조.
\(\sum_j \lambda_j (\beta_j + \bar\gamma_{\cdot j})\) with \(\sum\lambda_j = 0\) — 열 간 대조.
\(\sum_{ij}\lambda_{ij}\gamma_{ij}\) with \(\sum_i\lambda_{ij} = \sum_j\lambda_{ij} = 0\) — 교호 대조.

직관: 행·열 주효과는 단독이 아니라 “평균 교호 보정 후” 의 형태로만 추정가능. 이는 실무적 중요성을 갖는다 — “\(\alpha_1\) 대 \(\alpha_2\)” 를 해석할 때 교호작용이 평균화되어 섞여 있음을 기억해야 한다.

4.5 두 가지 표준 제약

\(2 \times 2\) 모형에서 9 모수 → 4 추정가능 → 5 개 독립 제약 필요.

(1) 대칭 제약 (sum-to-zero): \[ \hat\alpha_1+\hat\alpha_2 = 0,\quad \hat\beta_1+\hat\beta_2 = 0,\quad \hat\gamma_{1\cdot}=\hat\gamma_{\cdot 1}=\hat\gamma_{2\cdot}=\hat\gamma_{\cdot 2}=0 \]

(마지막 4 개 중 3 개만 독립.) 결과:

\[ \hat\mu = \bar y_{\cdot\cdot},\quad \hat\alpha_i = \bar y_{i\cdot} - \bar y_{\cdot\cdot},\quad \hat\beta_j = \bar y_{\cdot j} - \bar y_{\cdot\cdot},\quad \hat\gamma_{ij} = y_{ij} - \bar y_{i\cdot} - \bar y_{\cdot j} + \bar y_{\cdot\cdot} \]

전통적 ANOVA 분해의 모습이다. \(\hat\gamma_{ij}\) 는 “주효과 기반 예측으로부터 셀 \((i,j)\) 의 편차”.

(2) GLIM (corner) 제약: \[ \hat\alpha_1 = \hat\beta_1 = \hat\gamma_{11} = \hat\gamma_{12} = \hat\gamma_{21} = 0 \]

결과:

\[ \hat\mu = y_{11},\quad \hat\alpha_2 = y_{21}-y_{11},\quad \hat\beta_2 = y_{12}-y_{11},\quad \hat\gamma_{22} = y_{22}-y_{12}-y_{21}+y_{11} \]

좌상단 셀을 기준선으로. R 의 기본값 (contr.treatment).

4.6 두 제약의 일치 조건

흥미로운 관찰: \(\hat\gamma_{ij} = 0\) (교호 없음) 이면 두 제약의 주효과 contrast 가 동일. 추가로 \(\hat\alpha_i = \hat\beta_j = 0\) 이면 \(\hat\mu\) 도 같다. 이는 “제약이 모형의 의미를 바꾸지 않는다” 의 수치적 확인.

직관: 교호작용이 없는 단순 모형에서는 제약 선택의 영향이 사라진다. 교호가 들어가는 순간부터 개별 모수의 해석이 제약에 민감해진다 — 그래서 contrast 나 \(\eta_{ij}\) 수준에서 해석 하는 것이 안전하다.

5 Extrinsic Aliasing — 데이터 분포가 만드는 식별불가 (§3.5.3)

5.1 불균형 설계의 예

\(A\) 와 \(B\) 각각 3 수준, \(3\times 3 = 9\) 조합 중 5 개만 관측됐다 하자.

         B=1  B=2  B=3
A=1       x    x    .
A=2       x    x    .
A=3       .    .    x

이 데이터에서는 \(A=3\) 인 관측과 \(B=3\) 인 관측이 정확히 같은 관측 (우측 하단 셀 하나). 따라서

\[ \mathbf{u}_3^A \;=\; \mathbf{v}_3^B \]

모형식 자체는 A + B 에 문제가 없지만, 이 특정 데이터 에서는 \(\alpha_3\) 과 \(\beta_3\) 의 더미가 구분되지 않는다.

5.2 왜 이것이 extrinsic 인가

완전 설계 (\(3\times 3\) 모든 셀 관측) 에서는 \(\alpha_3\) 과 \(\beta_3\) 이 별개 차원을 span 한다. 관측 분포가 표를 연결 불가능 (disconnected) 하게 쪼개면 주효과 부분공간이 축소된다. 한 관측을 옮기면 (\(A=2, B=2\) 를 \(A=2, B=3\) 또는 \(A=3, B=1\) 로) aliasing 이 사라진다.

5.3 Intrinsic vs Extrinsic 비교

축	Intrinsic	Extrinsic
원인	모형식 구조 (부분공간 포함)	관측 분포 (결측·불균형)
수정 방법	제약 설정 (reference level 등)	데이터 수집 확장, 또는 변수 축소
해석 영향	없음 (추정가능 양은 동일)	있음 — 구분 불가능한 모수가 새로 생김
예시	절편 + 요인 풀세트	실험군 모두 남성 (성별·처치 혼란)
재현성	모형식이 같으면 항상 발생	데이터별로 다름

5.4 실무 진단

R 의 alias() 함수, Python statsmodels 의 model.exog.shape vs rank_matrix(X) 비교로 확인 가능. QR 분해에서 \(R\) 의 대각 성분이 0 에 가까우면 rank deficient.

완전 분리 (complete separation) 는 로지스틱 회귀에서 흔한 extrinsic aliasing 의 병리적 형태 — 선형 결합으로 \(y\) 가 완벽 분리되면 MLE 가 발산.

직관: Extrinsic 은 “우연의 산물” 이라 예방 가능 — 실험 설계 시 randomization·factorial balance 를 지키거나, 관측 단계에서 모든 조합을 대표할 수 있도록 표본 설계.

6 Functional Marginality — 다항 항의 순서 (§3.5.4)

6.1 선형 독립인데 순서가 있다

\(\{x, x^2, x^3\}\) 은 \(n \ge 4\) 이고 서로 다른 \(x\) 값이 4 개 이상이면 선형 독립. 따라서 aliasing 이 없다. 그런데도 모형식에 순서가 존재한다 — 왜?

6.2 예 1: 절편 없이 \(\beta_1 x\) 만

모형 \(\eta = \beta_1 x\) (절편 제외) 는 “\(x=0\) 에서 \(\eta = 0\)” 을 가정. 이것이 타당한가?

농업 비료 실험: \(x = 0\) (비료 0 kg) 이어도 토양에 이미 양분이 있어 \(\eta > 0\) 일 수 있다. 따라서 \(x=0\) 을 특수점으로 취급할 이유가 없으며, 절편을 제외하는 것은 강한 가정이다.

6.3 예 2: \(\beta_2 x^2\) 만 (선형 항 제외)

모형 \(\eta = \beta_0 + \beta_2 x^2\) 는 “\(x = 0\) 에서 극값” 을 가정. \(x\) 의 척도가 이동 가능하면 (예: 측정 기준이 \(x\) 와 \(x + c\) 중 무엇이든 상관없음) 이 가정이 깨진다.

\[ \beta_0 + \beta_2(x+c)^2 \;=\; (\beta_0 + \beta_2 c^2) + 2\beta_2 c\,x + \beta_2 x^2 \]

척도 이동 후에는 선형 항 \(2\beta_2 c\,x\) 가 등장. 즉 선형 항을 빼면 “\(x=0\) 이 극값” 이라는 척도 특이성 을 가정하는 것.

6.4 예 3: 교호 \(\beta_{12}x_1 x_2\) 만 (주효과 제외)

모형 \(\eta = \beta_0 + \beta_{12}x_1 x_2\) (주효과 \(\beta_1 x_1, \beta_2 x_2\) 없이) 는 “\((0, 0)\) 이 반응 표면의 안장점 (saddle)” 을 가정. 일반적으로 이런 특이 가정은 정당화 어렵다.

6.5 일반 원칙

\[ \text{Functional marginality}: \text{고차 항을 포함하려면 하위 항도 포함} \]

\(x^2, x^3\) 을 쓸 거면 \(x\) 도.
\(x_1 x_2\) 를 쓸 거면 \(x_1, x_2\) 도.
\(x_1^2 x_2\) 를 쓸 거면 \(x_1, x_1^2, x_2, x_1 x_2\) 도.

Intrinsic aliasing 의 marginality 와 수학적 본질은 다르지만 (functional 은 선형 종속 아님), 모형 해석의 척도 불변성 관점에서 같은 권고가 나온다.

직관: functional marginality 는 “모형이 특정 원점에 의존하지 말아야 한다” 는 요구다. 측정 단위를 0 에서 시작할 수도, 100 에서 시작할 수도 있는데, 모형 해석이 그에 따라 바뀌면 안 된다. 하위 항을 모두 포함하면 이 불변성이 자동으로 보장된다.

7 코드 예시

7.1 Step 1: Intrinsic aliasing — rank deficient 진단

import numpy as np
import pandas as pd
from patsy import dmatrices

rng = np.random.default_rng(0)
df = pd.DataFrame({
    "y": rng.normal(size=20),
    "A": pd.Categorical(rng.choice(["a","b","c"], size=20)),
})

# (1) 정상: 절편 + A (reference 자동 제외)
_, X1 = dmatrices("y ~ A", df, return_type='dataframe')
print(f"y ~ A:         열 수 {X1.shape[1]}, rank {np.linalg.matrix_rank(X1)}")

# (2) 문제: 모든 수준의 더미를 강제
df_dum = pd.get_dummies(df["A"], prefix="A").astype(int)
X2 = np.column_stack([np.ones(len(df)), df_dum.values])
print(f"1 + 모든 더미: 열 수 {X2.shape[1]}, rank {np.linalg.matrix_rank(X2)} ← 1 deficient!")

# alias 관계 확인: sum(A_a, A_b, A_c) = 1
print(f"\n더미 합: {df_dum.sum(axis=1).unique()} (모든 관측에서 1)")

세 더미의 합이 상수 1 이 됨을 수치로 확인. 모형식 엔진 (y ~ A) 은 reference level 을 자동으로 제외해 rank 문제를 피한다.

7.2 Step 2: 제약 선택이 개별 모수에는 영향, 추정가능 양에는 영향 없음

import statsmodels.formula.api as smf
from patsy.contrasts import Treatment, Sum

# 그룹 평균 6, 9, 12, 13
n_per = 50
df_ex = pd.DataFrame({
    "y":  np.concatenate([rng.normal(m, 0.5, size=n_per) for m in [6, 9, 12, 13]]),
    "A":  pd.Categorical(np.repeat(["1","2","3","4"], n_per)),
})

# (1) Treatment (reference = 첫 수준)
m_treat = smf.ols("y ~ A", data=df_ex).fit()
# (2) Sum-to-zero
m_sum   = smf.ols("y ~ C(A, Sum)", data=df_ex).fit()

print("Treatment 제약:")
print(m_treat.params.round(2))
print("\nSum-to-zero 제약:")
print(m_sum.params.round(2))

# 추정가능 양 (fitted values) 비교
print(f"\n적합값 최대 차이: {np.abs(m_treat.fittedvalues - m_sum.fittedvalues).max():.2e}")

개별 계수는 크게 다르지만 적합값이 기계 정밀도 내에서 동일 — 추정가능 양은 제약과 무관하다는 원칙의 수치 확인.

7.3 Step 3: Extrinsic aliasing — 불균형 설계

# 5개 셀만 관측된 3x3 설계
rows = [("a","p"), ("a","q"), ("b","p"), ("b","q"), ("c","r")]
df_ext = pd.DataFrame({
    "A": pd.Categorical([r[0] for r in rows for _ in range(3)]),
    "B": pd.Categorical([r[1] for r in rows for _ in range(3)]),
    "y": rng.normal(size=15),
})

# 설계 행렬
_, X_ext = dmatrices("y ~ A + B", df_ext, return_type='dataframe')
print(f"y ~ A + B 열 수: {X_ext.shape[1]}, rank: {np.linalg.matrix_rank(X_ext)}")

# A=c 와 B=r 이 동일 관측에만 등장 → alias 발생 여부
print(f"A=c 인 관측이 B=r 일 확률: {(df_ext.query('A == \"c\"').B == 'r').mean()}")
print(f"B=r 인 관측이 A=c 일 확률: {(df_ext.query('B == \"r\"').A == 'c').mean()}")

\(A=c\) 인 모든 관측이 \(B=r\) 이라 두 더미가 동일해 rank 손실. 관측 분포가 만든 extrinsic aliasing 의 실제 모습.

8 흔한 실수

실수	처방
제약을 모형의 “가정” 으로 해석	제약은 수치 해 유일성 도구. 추정가능 양에는 영향 없음
R vs Python 계수값이 다르다고 당황	기본 제약(reference 선택) 이 달라서. contrast matrix 설정으로 통일 가능
교호 없을 때의 \(\alpha_i\) 해석을 교호 있을 때에도 그대로	교호 있으면 “평균 교호 보정 후” contrast 여야 함
Extrinsic aliasing 을 제약으로 해결 시도	제약은 intrinsic 에만 유효. Extrinsic 은 데이터 또는 변수 문제
이차항·교호 항만 넣고 선형 항 뺌	Functional marginality 위반. 척도 이동 불변성 깨짐
`aliased` 경고 무시하고 계수 해석	어느 계수가 NA 인지 확인하고 reference 변경 또는 변수 재설계

9 요약

Aliasing 은 부분공간 겹침. \(\mathbf{X}\) 열 간 선형 종속이 있으면 MLE 가 유일하지 않음.
Intrinsic: 모형식 구조가 낳는 식별불가. \(\sum\mathbf{u}_i^A = \mathbf{1}\) 같은 항등식이 원인. 제약으로 우회하며 추정가능 양은 변하지 않음.
Extrinsic: 데이터 분포가 낳는 식별불가. 특정 관측 조합이 우연히 종속. 데이터 변경 또는 변수 재설계 필요.
Marginality: \(\mu \prec \alpha_i \prec \gamma_{ij}\) 의 부분 순서. 교호 항을 넣으면 주효과도 포함 (hierarchical principle).
Estimable function: 제약과 무관하게 정의되는 양. \(\eta_{ij}\) 자체와 contrasts (\(\sum\lambda_i\alpha_i\) with \(\sum\lambda_i=0\)).
제약 종류: zero-intercept, treatment, sum-to-zero, 가중 sum-to-zero. 같은 모형의 다른 좌표계일 뿐.
Functional marginality: 다항·교호의 하위 항 포함 원칙. 척도 원점 불변성을 위한 요구.

한 줄 요약: Aliasing 은 “무엇이 추정가능한가” 를 명료화하는 이론이다. 모형이 제공하는 듯 보이는 모든 모수가 실제로는 일부만 “식별 가능”하며, 나머지는 제약 선택에 따라 움직이는 좌표일 뿐이다. 이 구분이 명확해지면 불균형 설계·상호작용 모형·로지스틱의 “fitted prob = 1” 경고까지 모두 한 프레임으로 읽힌다.

10 관련 주제

선행 지식

선형 예측자의 구성 — Systematic Component — 더미 변수의 구조적 중복
모형식 대수 — Model Formulae — 우선순위와 파싱

관련 개념

다중 선형회귀 — rank deficiency 진단
Logistic Regression: Estimation — 완전 분리의 extrinsic aliasing

후속 주제

Estimation (McCullagh §3.6) — 추정가능 양의 기하학적 해석
Firth logistic regression — 완전 분리 대응
Experimental design — extrinsic aliasing 예방