1 정의
Relevance: \(Z\) 와 \(A\) 의 비영 연관 — \(Z \not\!\perp\!\!\!\perp A\).
Exclusion (Restriction): \(Z\) 가 \(Y\) 에 영향 주는 경로는 \(A\) 를 통해서만. 개인 수준: \(Y_i^{z, a} = Y_i^{z', a}\) for all \(z, z'\), all \(a\), all \(i\). 인구 수준: \(\mathrm{E}[Y^{z, a}] = \mathrm{E}[Y^{z', a}]\).
Independence (Exchangeability): \(Z\) 가 \(Y\) 와 공통 원인 없음 — \(Y^{a, z} \perp\!\!\!\perp Z\) for all \(a, z\).
이항 IV \(Z\) 와 이항 처치 \(A\) 에 대해
\[\widehat{\beta}_\text{Wald} = \frac{\widehat{\mathrm{E}}[Y|Z=1] - \widehat{\mathrm{E}}[Y|Z=0]} {\widehat{\mathrm{E}}[A|Z=1] - \widehat{\mathrm{E}}[A|Z=0]}\]
세 IV 조건 + 추가 가정 (iv) 아래 ATE 의 일치 추정량.
2 16.1 세 가지 IV 조건 — 자세히
2.1 (i) Relevance — 검증 가능
\[\Pr(A=1 | Z=1) - \Pr(A=1 | Z=0) > 0\]
데이터에서 직접 검증 가능. NHEFS 사례:
\[\Pr(A=1|Z=1) = 25.8\%, \quad \Pr(A=1|Z=0) = 19.5\%\]
→ 차이 6.3% — 약한 연관. F-statistic = 0.8 (임계 10 미만), weak instrument 신호.
직관 — Relevance 의 의미: 도구가 처치를 흔들어야 한다. \(Z\) 와 \(A\) 의 연관이 0 이면 Wald 추정량의 분모가 0 → 추정 불가. 강한 연관이면 분모 큼 → 추정량의 분산 작음.
직관 — Weak IV 의 위험: 분모가 작으면 분자의 작은 추정 오차도 비율을 크게 변동. 표본을 다시 뽑으면 추정값이 ±10 변동. 95% CI 가 매우 넓어짐 — 의사결정에 무용.
2.2 (ii) Exclusion Restriction — 도메인 가정
직관 — Exclusion 의 핵심: \(Z\) → \(Y\) 의 모든 경로가 \(A\) 를 거쳐야 한다. \(Z\) 가 \(Y\) 에 직접 영향 (예: 행동 변화) 또는 다른 경로 (예: 부수효과) 로 영향 주면 위반. 이중 맹검 RCT 에서는 설계로 보장.
- 부수 효과: 처치가 부수 효과를 일으켜 환자 행동 변화 → unblinding → 결과 영향.
- 유전자 IV: 유전자가 다른 phenotype 에도 영향 → exclusion 위반 가능 (pleiotropy).
- 거리 IV: 거리가 의료 시설 외 다른 결정 (이사, 일자리) 에 영향.
- 가격 IV: 가격이 다른 행동 (운동, 식습관) 에도 영향 → 결과에 직접.
직관 — Pleiotropy 의 위험: Mendelian Randomization 에서 유전자가 처치 한 가지가 아닌 여러 phenotype 영향. ALDH2 가 alcohol metabolism 외 다른 효과 있으면 exclusion 위반. 도메인 지식 + sensitivity analysis 로 검토.
2.3 (iii) Independence — 도메인 가정
\(Z\) 와 \(Y\) 가 공통 원인을 갖지 않음. RCT 의 무작위 배정에서는 자동 보장. 관찰 연구는 도메인 가정.
- 자기 선택: 사람들이 처치 환경 선택 → \(Z\) 가 외생 아님.
- 시점 효과: 시간 IV 사용 시 시간이 처치와 결과 모두에 영향.
- 지리적 IV: 지역 변수가 다른 사회경제적 변수와 연관.
직관 — Independence 의 도메인 정당화: NHEFS 의 담배 가격 IV → “주별 가격은 개인 체중에 직접 영향 주지 않는다” 는 가정. 그러나 가격이 높은 주는 부유한 주일 수 있고, 부유한 주는 식습관·운동 패턴이 다를 수 있다. 약한 사회경제 confounding 의 가능성.
2.4 Causal vs Surrogate IV (Figures 16.1, 16.2)
Causal IV (Figure 16.1): \(Z \to A \to Y\), \(Z\) 가 처치의 직접 원인. - 예: 무작위 배정 indicator.
Surrogate IV (Figure 16.2): \(U_Z \to A\), \(Z\) 는 \(U_Z\) 의 측정 가능한 surrogate. - 예: 의사의 처방 선호도 (\(U_Z\)) 의 surrogate 로 “직전 처방” (\(Z\)).
두 종류 모두 IV 분석에 사용 가능, 추가 caveat 있음.
직관 — Surrogate IV 의 미묘함: \(Z\) 가 \(A\) 의 직접 원인 아니므로 (i) Relevance 가 “공통 원인 \(U_Z\)” 를 통해 성립. (iii) 도 modified — “\(Z\) 와 \(Y\) 가 \(U_Z\) 외에 공통 원인 없음”. 추가 검토 필요.
3 16.2 Wald 추정량
3.1 Wald 식의 직관
분자 \(\mathrm{E}[Y|Z=1] - \mathrm{E}[Y|Z=0]\) — IV 가 결과에 미치는 영향 (ITT-like). 분모 \(\mathrm{E}[A|Z=1] - \mathrm{E}[A|Z=0]\) — IV 가 처치 결정에 미치는 영향 (compliance).
비율 = “IV 가 처치를 바꾸는 만큼 결과를 얼마나 바꾸는지”의 효율.
직관 — 비율로 처치 효과를 추출: IV 의 처치 영향이 100% 면 (모두 순응) 분모 = 1, 비율 = 분자 = 처치 효과. 처치 영향이 50% 면 분모 = 0.5, 비율 = 분자 × 2 = 처치 효과 (분자가 절반의 효과만 반영하므로).
직관 — 분자 부풀리기: 비순응이 있으면 ITT 효과가 진짜 처치 효과의 일부분만 보여준다. Wald 가 분자를 분모로 부풀려 진짜 처치 효과를 추정. 분모는 부풀림 비율.
3.2 NHEFS Wald 계산
| 양 | 값 |
|---|---|
| \(\widehat{\mathrm{E}}[Y|Z=1]\) | 2.686 kg |
| \(\widehat{\mathrm{E}}[Y|Z=0]\) | 2.536 kg |
| 분자 | 0.1503 |
| \(\widehat{\Pr}[A=1|Z=1]\) | 0.2578 |
| \(\widehat{\Pr}[A=1|Z=0]\) | 0.1951 |
| 분모 | 0.0627 |
| Wald 추정량 | 0.1503 / 0.0627 = 2.4 kg |
95% CI: \((-36.5, 41.3)\) — weak IV 의 결과.
직관 — 점추정 2.4kg vs 다른 도구 3.4-3.5kg: 비슷한 정도지만 CI 가 너무 넓어 의미 있는 비교 어려움. IV 가 다른 도구와 robust 일치한다고 볼 수 없음. Weak IV 가 진단으로도 무용.
3.3 2SLS — Two-Stage Least Squares
1 단계: \(\mathrm{E}[A|Z] = \alpha_0 + \alpha_1 Z\) 적합 → \(\widehat{A} = \widehat{\alpha}_0 + \widehat{\alpha}_1 Z\).
2 단계: \(\mathrm{E}[Y|Z] = \beta_0 + \beta_1 \widehat{A}\) 적합 → \(\widehat{\beta}_1\) = IV 추정값.
이항 IV + 이항 처치에서 2SLS = Wald 수치적으로 동등.
직관 — 2SLS 의 매력: 일반 회귀처럼 보이는 두 단계 절차로 IV 분석 가능. 통계 패키지의 표준 도구. 그러나 2SLS 의 표준 SE 는 IV 가 weak 하면 부정확 — robust 분산 또는 bootstrap 권장.
직관 — 2SLS 가 Wald 와 같은 이유: 2SLS 의 1 단계가 분모, 2 단계의 회귀 계수가 분자/분모 비. 수학적으로 등가. Wald 는 단순 형태, 2SLS 는 일반 다중 IV 로 확장 가능.
3.4 표본 평균 vs 회귀 계수
NHEFS 의 4 표본 평균을 직접 계산하거나, saturated 선형 회귀 두 개를 적합해도 같은 결과.
Numerator: E[Y|Z] = β_0 + β_1 Z → β_1
Denominator: E[A|Z] = α_0 + α_1 Z → α_1
Wald = β_1 / α_1
직관 — Saturated 선형 모형의 등가성: 이항 \(Z\) 에서 \(\theta_0 + \theta_1 Z\) 는 두 그룹 평균을 정확히 표현 (saturated). 회귀와 표본 평균이 등가. 다중 IV 또는 continuous IV 로 확장 시 회귀가 더 일반.
4 ITT 와 IV 의 관계
ITT (Intent-to-Treat): 분자만 — 배정에 따른 결과 차이. 처치 효과의 희석 된 형태. IV: 분자 / 분모 — 진짜 처치 효과의 추정 (compliers 에서, monotonicity 아래).
비순응이 없으면 ITT = IV. 비순응이 있으면 ITT < IV (효과가 같은 방향이면).
직관 — ITT 의 보수성: ITT 는 비순응자도 포함해 평균 → 효과가 희석. 정책 효과 (모든 사람에게 처치 권장) 평가에 적합. IV 는 진짜 처치 효과 — 의학적 효과 평가에 적합.
직관 — 두 효과의 정책적 의미: 정책 결정자는 ITT 가 더 의미 있을 때 많음 — “정책 적용 시 평균 효과” 가 궁금하므로. 의사는 IV 가 더 의미 있을 때 많음 — “환자가 약을 먹으면 효과” 가 궁금하므로. 결정자가 누구냐가 도구 선택 결정.
5 Bound 분석 (Technical Point 16.2)
이 가정만으로는 ATE 가 식별되지 않지만 bound 식별 가능:
| 가정 | Bound 폭 |
|---|---|
| 데이터만 | \((-1, 1)\) |
| + IV (i)~(iii) | Natural bounds: \(\Pr(A=1|Z=0) + \Pr(A=0|Z=1)\) |
| + Joint exchangeability | Sharp bounds (가장 좁음) |
직관 — Bound 의 정직함: 강한 가정 없이 ATE 를 한 점으로 식별 못 하지만 범위로 식별 가능. 이 범위는 흔히 0 을 포함 — 효과 방향마저 결정 못 함. 약한 가정의 댓가.
6 응용 분야
- 임상시험 비순응: 분자 = ITT, 분모 = compliance, 비율 = 처치 효과
- Mendelian Randomization: 유전자 score 가 processed exposure 의 IV
- 자연 실험: 정책 변경, 거리, 가격 IV
- 수업 효과: random 시험관 배정이 IV
- 노동경제학: 군 복무 무작위 배정, 출생 분기
7 코드 — Wald 와 2SLS 비교
import pandas as pd
import numpy as np
import statsmodels.api as sm
from linearmodels.iv import IV2SLS
# Hypothetical NHEFS-like data
np.random.seed(42)
n = 1566
U = np.random.normal(0, 1, n) # 미관측 교란
Z = np.random.binomial(1, 0.4, n) # IV
A = ((Z * 0.4 + U * 0.5 + np.random.normal(0, 1, n)) > 0).astype(int)
Y = 3.5 * A + U + np.random.normal(0, 5, n)
df = pd.DataFrame({"Z": Z, "A": A, "Y": Y})
# === Wald (직접 계산) ===
num = df[df.Z == 1].Y.mean() - df[df.Z == 0].Y.mean()
denom = df[df.Z == 1].A.mean() - df[df.Z == 0].A.mean()
print(f"Wald: {num/denom:.2f}")
# === 2SLS ===
exog = sm.add_constant(pd.Series([1]*len(df), name="const"))
endog = df["A"]
instruments = df[["Z"]]
y = df["Y"]
iv_model = IV2SLS(dependent=y, exog=exog["const"], endog=endog, instruments=instruments).fit()
print(f"\n2SLS: {iv_model.params['A']:.2f}")
print(iv_model.summary)
# === First-stage F-statistic ===
first_stage = sm.OLS(df["A"], sm.add_constant(df["Z"])).fit()
print(f"\nFirst-stage F: {first_stage.fvalue:.2f}")
print(f" (>10 권장, weak IV 진단)")8 한 줄 요약
세 IV 조건 — relevance (검증 가능), exclusion + independence (도메인 가정) — 위에서 Wald 추정량 = \(\Delta Y / \Delta A\) 로 처치 효과 추정. NHEFS 담배 가격 IV 는 weak (분모 6.3%, F=0.8) 로 점추정 2.4kg 의 95% CI 가 매우 넓음. 2SLS 는 Wald 의 회귀 형식, 다중 IV 로 일반화. ITT 는 정책 효과, IV 는 처치 효과 — 의사결정자에 따라 도구 선택. Bound 는 점식별의 부재 시 정직한 대안.
9 관련 주제
선행 지식
후속 주제
다른 카테고리 연결