Kwangmin Kim - Homogeneity와 Monotonicity·LATE

1 정의

정의: 4 번째 IV 가정 — 두 옵션

세 instrumental conditions (i)~(iii) 만으로는 IV 추정량이 ATE 와 같다고 보장 못 함. 추가 가정 (iv) 가 필요:

Homogeneity: 처치 효과가 모든 사람에게 동일 또는 미관측 교란 \(U\) 와 covariance 0. - 5 가지 강도: 개인 수준 동일 → \(Z\)-수준 동일 → … → 일반 zero-covariance.

Monotonicity: 도구가 모든 사람의 처치를 같은 방향으로 변경 (no defiers). - 추정 대상 변경: ATE → LATE = \(\mathrm{E}[Y^{a=1} - Y^{a=0} | \text{complier}]\).

직관 — 두 옵션의 본질적 차이: Homogeneity 는 “모두에게 효과가 같다” — ATE 직접 추정. Monotonicity 는 “모두 같은 방향으로 도구에 반응” — compliers 효과만 추정. 가정의 강도는 monotonicity 가 더 약함, 추정 대상의 좁아짐이 댓가.

2 16.3 Homogeneity 의 다양한 강도

2.1 5 가지 옵션 (강한 → 약한)

Homogeneity 의 5 가지 형태

(1) 개인 수준 constant effect: \(Y_i^{a=1} - Y_i^{a=0} = \beta\) 모든 \(i\). - = additive rank preservation. 비현실적.

(2) \(Z\) 수준 effect modification 없음: \(\mathrm{E}[Y^{a=1} - Y^{a=0}|Z=z, A=a]\) 가 \(z\) 와 무관. - 약간 약함. NHEFS 사례에 비현실적.

(3) \(U\) 수준 effect modification 없음: \(\mathrm{E}[Y^{a=1} - Y^{a=0}|U]\) 가 \(U\) 와 무관. - 미관측 교란이 효과 수정자 아니라는 가정.

(4) \(U\) 수준 \(Z\)-\(A\) 연관 동일: \(\mathrm{E}[A|Z=1,U] - \mathrm{E}[A|Z=0,U]\) 가 \(U\) 무관.

(5) Zero-covariance: \(\mathrm{Cov}(e(U), t(U)) = 0\) where \(e(U) = \mathrm{E}[Y^{a=1} - Y^{a=0}|U]\) and \(t(U) = \mathrm{E}[A|Z=1,U] - \mathrm{E}[A|Z=0,U]\). - 가장 일반. (3), (4) 는 (5) 의 특수 경우.

직관 — 5 단계의 강약 흐름: (1) 이 가장 강하고 (5) 가 가장 약하다. (1) 은 모든 개인의 효과가 정확히 같다는 SF 시나리오. (5) 는 \(U\) 의 두 함수가 직교한다는 약한 통계적 조건. 약할수록 도메인 검증 어려움.

2.2 Wald 추정량과 Homogeneity 의 관계 (Technical Point 16.3)

Hernan 의 증명 핵심: Saturated additive structural mean model

\[\mathrm{E}[Y - Y^{a=0} | A, Z] = A(\beta_0 + \beta_1 Z)\]

에서 \(\beta_1\) 은 \(Z\)-수준 effect modification 의 정도. \(\beta_1 = 0\) 가정 (homogeneity (2)) 아래

\[\beta_0 = \frac{\mathrm{E}[Y|Z=1] - \mathrm{E}[Y|Z=0]}{\mathrm{E}[A|Z=1] - \mathrm{E}[A|Z=0]} = \text{Wald 추정량}\]

→ Wald 추정량 = 처치 받은 사람들의 평균 효과 (ATT).

직관 — 식별의 한계: 세 IV 조건 + Saturated additive structural mean model 은 모수 2 개 (\(\beta_0, \beta_1\)) 와 데이터 식 1 개. 모수 수 > 식별 식 → 추가 제약 (가정) 필요. \(\beta_1 = 0\) 가정이 추가 식.

직관 — ATE = ATT 가정의 강도: \(\beta_1 = 0\) 만으로는 ATT 만 식별. ATE = ATT 가정 (\(A=0\) 의 사람들에게도 같은 효과) 추가 시 ATE 식별. 두 untestable 가정의 누적.

2.3 Homogeneity 의 비현실성

NHEFS 의 Homogeneity 검증

흡연 중단의 체중 효과가 모든 사람에게 동일? 비현실적. - 일부는 5kg 증가, 일부는 0.5kg, 일부는 -1kg. - 효과는 대사·생활 습관·유전적 요인에 따라 변동. - \(U\) 수준 effect modification 없음 가정도 어렵다.

직관 — Homogeneity 가 “이상적 가정” 인 이유: 단순한 분석을 위해 채택되지만 실제 데이터의 변동성을 무시. 1990 년대 이전 IV 분석은 이 가정을 암묵적으로 사용. Hernan 의 비판적 검토는 가정의 인식적 정직함.

3 16.4 Monotonicity 와 LATE

3.1 4 가지 Compliance Type

\(A^z\) 의 잠재 결과로 본 분류

각 사람의 \(A^{z=1}\) 과 \(A^{z=0}\) 의 두 잠재 결과 → 4 가지 type:

Type	\(A^{z=1}\)	\(A^{z=0}\)	비유
Always-taker	1	1	“어차피 처치 받음”
Never-taker	0	0	“절대 처치 안 받음”
Complier	1	0	“도구에 따라 행동”
Defier	0	1	“반대로 행동”

직관 — 식별 불가능성: 한 사람의 두 잠재 결과 중 하나만 관측 (관측된 \(Z\) 의 결과). 처치 받은 사람이 always-taker 인지 complier 인지 모름. Type 자체는 unidentifiable.

직관 — 그러나 type 비율은 식별 가능: 두 type 의 비율을 데이터에서 추정 가능 (Technical Point 16.7). NHEFS 에서 compliers 비율 ≈ 분모 = 6.3%, always-takers ≈ 19.5%, never-takers ≈ 74%.

3.2 Monotonicity 가정

\(A^{z=1} \geq A^{z=0}\) for all individuals.

→ 모든 사람이 같은 방향으로 도구에 반응 (또는 무반응). Defier 없음.

3.3 Wald 추정량 = LATE

LATE (Local Average Treatment Effect, Imbens & Angrist 1994)

세 IV 조건 + Monotonicity 아래

\[\widehat{\beta}_\text{Wald} = \mathrm{E}[Y^{a=1} - Y^{a=0} | A^{z=1}=1, A^{z=0}=0]\]

= compliers 의 평균 처치 효과 = LATE (= CACE, Compliers Average Causal Effect).

ATE 가 아닌 compliers 부분군의 효과.

직관 — LATE 의 형식적 직관: 분자 (Z 의 Y 효과) 는 always-takers 와 never-takers 에서 0 (\(Z\) 가 처치를 안 바꾸므로). Defiers 도 0 (없으므로). Compliers 만 비영. → 분자 = compliers 효과 × compliers 비율. 분모 = compliers 비율. 비율 = compliers 효과.

직관 — Compliers 효과 vs ATE: compliers 가 모집단의 부분군. always-takers·never-takers 는 다른 효과 가질 수 있다. NHEFS 에서 compliers 6.3% 만의 효과 — 정책 결정에는 좁은 추정.

3.4 LATE 의 정책적 한계

Hernan 의 LATE 비판

“Compliers 가 누구인지 알 수 없다. 정책 결정자가 ‘compliers 에게 효과 X’ 라는 정보로 무엇을 할 수 있나?”

문제: 1. Compliers 부분군은 unidentifiable — 누가 그 6% 인지 모름. 2. 다른 IV 사용 시 compliers 가 다름 — instrument-dependent 부분군. 3. ATE 가 정책 결정에 더 의미 있을 때 많음.

직관 — Deaton 의 인용: “We have control over the light, but choose to let it fall where it may, and then proclaim that whatever it illuminates is what we were looking for all along.” → “어디든 IV 가 비추는 곳을 추정 대상으로 받아들이는 것은 정책 가이드로 부적절”.

직관 — LATE 가 받아들여진 이유: 1990 년대 이래 IV 분석에서 ATE 식별의 어려움 → LATE 가 식별 가능한 양으로 자리잡음. Imbens & Angrist (1994) 의 영향력. 그러나 정책 결정의 의미는 여전히 논쟁.

3.5 Compliers 의 특성화

Compliers 의 분포 추정 (Angrist & Pischke 2009)

강한 가정 아래 compliers 의 covariate 분포를 데이터에서 추정 가능.

NHEFS 의 compliers 가 누구인가? 제한된 데이터로 단순한 분포 비교: - compliers 는 가격 변화에 민감한 사람들. - 흡연량이 적당한 (가격 변동에 영향 받는) 사람들. - 사회경제 상태가 중간인 (가격 부담을 느끼는) 사람들.

이 특성화는 도메인 가정에 의존하며 robust 결론 어려움.

직관 — Compliers 특성의 도메인 추측: 정확한 식별은 불가능하지만 도메인 지식으로 대략 추측. 정책 결정자가 “이 정책이 어떤 사람들에게 효과 있나?” 의 답으로 활용 가능.

4 Monotonicity 의 검증 어려움

Defier 의 존재 가능성

Swanson & Hernan (2014), Swanson et al. (2015b) 는 관찰 데이터에서 defier 의 존재 사례 보고.

NHEFS 의 가격 IV 사례에서 defier 가능? - 가격 높은 주에서 흡연 안 끊고, 낮은 주에서 끊는 사람. - 비합리적이지만 다른 confounders (예: 사회 압력의 역방향) 로 가능.

Monotonicity 도 untestable 가정. 도메인 정당화 필요.

직관 — 가정의 인식적 인식: Monotonicity 가 homogeneity 보다 약하지만 untestable 인 점은 같다. 도메인 합리적 정당화가 필요. 약한 가정 = 검증 가능 아님.

5 두 가정의 비교

측면	Homogeneity	Monotonicity
가정 강도	강함	약함
추정 대상	ATE	LATE (compliers)
검증 가능성	Untestable	Untestable
정책적 의미	명확 (전체 인구)	좁음 (compliers 만)
도메인 정당화	어려움	더 쉬움 (no defier)
1990 년대 이전 표준	예	아니오
현대 표준	부분적	광범위

직관 — 추정 대상의 trade-off: Homogeneity 강하지만 ATE 추정. Monotonicity 약하지만 LATE 만. 가정의 강도와 추정 대상의 일반성이 trade-off.

직관 — 실무 권장: 두 가정 모두 시도해 결과 일치성 점검. 큰 차이 나면 가정 위반의 신호. Sensitivity analysis 로 가정의 영향을 정량화.

6 Bypass 의 다른 옵션

Homogeneity·Monotonicity 외 다른 접근:

Baseline covariates 도입: Structural mean model 에 covariates 추가 → 효과 수정 모형화.
Bound 분석: 점식별 포기, 구간 추정.
Multiple IV: 여러 IV 의 결과 일치 검증 → over-identification test.
Sensitivity analysis: \(\beta_1\) 의 가정 값 변화로 결과 변동 측정.

직관 — IV 의 robust 활용: 단일 IV 의 점추정에 의존하지 말고 여러 도구·여러 가정 시나리오의 결과 비교. 단일 추정값이 아닌 robustness check 의 묶음 이 의사결정의 기반.

7 응용 분야

임상시험 비순응: Monotonicity → CACE 추정
Mendelian Randomization: Multiple genetic IV → over-identification
계량경제 정책 평가: LATE 의 정책 해석 논쟁
노동경제학: 군 복무 IV의 LATE
교육 효과: 시험관 배정 IV 의 LATE

8 코드 — Compliers 비율과 LATE 진단

import pandas as pd
import numpy as np

# Hypothetical NHEFS-like data
np.random.seed(42)
n = 1566
U = np.random.normal(0, 1, n)
Z = np.random.binomial(1, 0.4, n)
# 다른 type 들 만들기 위한 잠재 결과
Az0 = (U + np.random.normal(0, 1, n) > 0).astype(int)   # Z=0 일 때
shift = np.where(Az0 == 0, 0.4, 0.0)   # Z=1 → +0.4 chance for compliers
Az1 = ((Az0 + shift + np.random.normal(0, 0.5, n)) > 0).astype(int)
# 실제 처치
A = np.where(Z == 1, Az1, Az0)
Y = 3.5 * A + U + np.random.normal(0, 5, n)

df = pd.DataFrame({"Z": Z, "A": A, "Y": Y, "Az0": Az0, "Az1": Az1})

# Compliance type 분포 (실제로는 unidentifiable, 시뮬레이션이라 알 수 있음)
df["type"] = "?"
df.loc[(df.Az1 == 1) & (df.Az0 == 1), "type"] = "always-taker"
df.loc[(df.Az1 == 0) & (df.Az0 == 0), "type"] = "never-taker"
df.loc[(df.Az1 == 1) & (df.Az0 == 0), "type"] = "complier"
df.loc[(df.Az1 == 0) & (df.Az0 == 1), "type"] = "defier"
print(df["type"].value_counts(normalize=True))

# Compliers 비율은 분모로 추정 가능
denom = df[df.Z == 1].A.mean() - df[df.Z == 0].A.mean()
print(f"Estimated compliers proportion: {denom:.3f}")

# LATE = Wald
num = df[df.Z == 1].Y.mean() - df[df.Z == 0].Y.mean()
late = num / denom
print(f"LATE estimate: {late:.2f}")

# Compliers 의 진짜 평균 효과 (시뮬레이션이라 알 수 있음)
compliers = df[df.type == "complier"]
true_late = (3.5 * 1 - 3.5 * 0)   # 효과는 모든 type 에 동일하게 설정
print(f"True compliers ATE: {true_late:.2f}")

9 한 줄 요약

세 IV 조건만으로는 ATE 식별 안 됨 — 4 번째 가정 필요. Homogeneity 는 강한 가정으로 ATE 직접 추정, monotonicity 는 약한 가정으로 LATE (compliers 효과) 추정. 4 가지 compliance type (always·never·complier·defier) 중 monotonicity 는 defier 부재 가정. LATE 는 compliers 부분군의 효과로 정책적 한계 (누구인지 모름). 두 가정 모두 untestable, 도메인 정당화 + sensitivity analysis 필수.

10 관련 주제

선행 지식

후속 주제

다른 카테고리 연결