1 개요
Ch.12~15 의 모든 도구 (IPW, 표준화, g-estimation, PS) 는 핵심 가정에 의존한다 — 모든 교란 변수가 측정되어 보정에 포함. 미관측 교란이 있으면 모든 도구가 실패.
도구변수 (Instrumental Variable, IV) 는 이 가정을 우회하는 다른 가족의 도구이다. 미관측 교란이 있어도 다른 set 의 가정 위에서 인과 효과 추정 가능.
직관 — IV 가 마법인 이유: 미관측 교란을 측정할 수 없는 상황에서, 처치-결과 관계의 “외생적” 변동 (instrument \(Z\)) 을 활용해 인과 효과를 우회 추정. 경제학·역학에서 광범위하게 사용. 그러나 IV 도 untestable 가정에 의존 — 다른 가정의 묶음으로 같은 문제를 푸는 도구.
세 가지 instrumental conditions 를 만족하는 변수 \(Z\):
- Relevance: \(Z\) 가 \(A\) 와 연관 (\(Z \not\!\perp\!\!\!\perp A\)).
- Exclusion: \(Z\) 가 \(Y\) 에 영향을 주는 경로는 \(A\) 를 통해서만.
- Independence: \(Z\) 와 \(Y\) 가 공통 원인을 갖지 않음 (or \(Y^{a, z} \perp\!\!\!\perp Z\)).
직관 — 세 조건의 이미지: (i) 도구가 처치를 흔든다, (ii) 도구의 영향이 처치만을 통과한다, (iii) 도구가 결과와 직접 연결 안 된다. 세 조건이 모두 성립하면 도구의 변동을 “처치의 외생적 진동” 으로 사용 가능.
2 6 개 소챕터의 흐름
| 소챕터 | 핵심 질문 | 답 |
|---|---|---|
| 16.1 | IV 의 세 조건은? | Relevance + Exclusion + Independence |
| 16.2 | IV 추정량의 형태는? | Wald 추정량 — 두 비율의 비 |
| 16.3 | 추가 가정 (iv) 는? | Homogeneity — 효과의 등질성 |
| 16.4 | 더 약한 (iv) 는? | Monotonicity → LATE (compliers 효과) |
| 16.5 | 세 조건을 다시 보면? | 약 instrument 의 위험, weak IV bias |
| 16.6 | 다른 도구와 비교? | 가정의 다른 묶음, 보완적 사용 |
3 NHEFS 사례 — 담배 가격 IV
제안된 IV: \(Z\) = 출생 주의 평균 담배 가격 > $1.50 여부 (이항).
Wald 추정량:
\[\widehat{\beta}_\text{IV} = \frac{\widehat{\mathrm{E}}[Y|Z=1] - \widehat{\mathrm{E}}[Y|Z=0]}{\widehat{\mathrm{E}}[A|Z=1] - \widehat{\mathrm{E}}[A|Z=0]} = \frac{2.686 - 2.536}{0.2578 - 0.1951} = \frac{0.1503}{0.0627} = 2.4 \text{ kg}\]
95% CI: \((-36.5, 41.3)\) — 매우 넓음 (weak instrument).
직관 — Wald 추정량의 의미: 분자 = “\(Z\) 가 1 일 때 vs 0 일 때 결과 차이” (ITT-like). 분모 = “\(Z\) 가 1 일 때 vs 0 일 때 처치 차이” (compliance-like). 분모로 분자를 부풀려 처치 효과 추정. 분모가 작을수록 (약한 instrument) 부풀림이 커지고 분산도 폭발.
직관 — 95% CI 가 매우 넓은 이유: 분모 \(0.0627\) 이 매우 작음 — 6% 의 차이만 처치에서 발생. 분모의 작은 변동이 추정값에 큰 영향. 약한 instrument 의 분산 폭발이 IV 의 가장 흔한 함정.
4 핵심 개념 5 가지
4.1 1. 세 IV 조건 (16.1)
| 조건 | 검증 가능? | NHEFS 점검 |
|---|---|---|
| (i) Relevance | 검증 가능 | 6% 의 차이 — 약함 |
| (ii) Exclusion | 검증 불가 | 도메인 가정 |
| (iii) Independence | 검증 불가 | 도메인 가정 |
직관 — 두 가정만 untestable: Relevance 는 데이터에서 \(Z\)-\(A\) 연관으로 직접 점검. 나머지 두 조건은 도메인 지식에 의존. 데이터로 IV 의 타당성을 절반만 점검 가능.
4.2 2. RCT vs 관찰 연구 IV
무작위 임상시험: \(Z\) = 무작위 배정, \(A\) = 실제 처치 받음, \(Y\) = 결과.
- Relevance: 배정이 처치 결정에 영향 — 자동 성립.
- Exclusion: 이중 맹검에서 배정 자체가 결과에 영향 안 줌 — 설계로 보장.
- Independence: 무작위 배정 — 자동 성립.
→ 비순응 (noncompliance) 이 있는 RCT 에서 IV 분석으로 처치 효과 추정. ITT 와 다름.
직관 — IV 가 RCT 의 도구: ITT (Intent-to-Treat) 는 “배정 효과” 추정. IV 는 “처치 효과” 추정 — 비순응자 보정. RCT 의 비순응 처리는 IV 의 가장 자연스러운 응용.
4.3 3. 관찰 연구의 IV 후보
| 카테고리 | 예시 | 가정 |
|---|---|---|
| Genetic | ALDH2 polymorphism (alcohol metabolism) | 유전자 → 처치 → 결과만 |
| Preference | 의사의 처방 선호도 | 선호도 → 처방 → 결과만 |
| Access | 시설까지의 거리, 시간 | 거리 → 처치 → 결과만 |
NHEFS 의 담배 가격은 access 카테고리 — “가격 → 금연 → 체중” 가정.
직관 — Mendelian Randomization: 유전자 변이를 IV 로 사용. 유전자는 무작위로 결정되어 부모 세대의 무작위 실험과 비슷한 구조. 의학·역학에서 중요한 도구로 자리잡음.
직관 — IV 검증의 어려움: 후보 IV 가 모든 조건을 만족하는지 확실히 알 수 없다. 도메인 지식 + 다른 IV 와의 결과 일치성 + sensitivity analysis 로 robust 검토.
4.4 4. Homogeneity vs Monotonicity (16.3-16.4)
세 조건만으로는 IV 추정량이 ATE 와 같다고 보장 못 함. 추가 가정 (iv) 필요:
Homogeneity: 처치 효과가 모든 사람에게 동일 (또는 미관측 교란 \(U\) 의 함수가 아님). - 비현실적 (대부분 효과는 변동성 있음).
Monotonicity: 도구가 모든 사람의 처치를 같은 방향으로 변경. - \(A^{z=1} \geq A^{z=0}\) — defier 없음. - 더 현실적이지만 추정 대상이 변경: ATE → LATE (compliers 효과).
직관 — Defier 의 의미: \(Z=1\) 일 때 처치 안 받고 \(Z=0\) 일 때 처치 받는 반대로 행동 하는 사람. 가격 IV 사례에서 “가격 높을 때 더 흡연하는 사람” — 비합리적이지만 가능. 흔하지 않으면 monotonicity 합리적.
직관 — LATE 가 정책 결정에 한계: LATE = compliers 만의 효과. Always-takers 와 never-takers 효과는 모름. 정책 적용 시 “이 인구의 효과” 가 아닌 “compliers 인구의 효과” 라는 좁은 추정.
4.5 5. 4 가지 Compliance Type (16.4)
| Type | \(A^{z=1}\) | \(A^{z=0}\) | 의미 |
|---|---|---|---|
| Always-taker | 1 | 1 | 항상 처치 받음 |
| Never-taker | 0 | 0 | 절대 처치 안 받음 |
| Complier | 1 | 0 | 도구에 따라 행동 |
| Defier | 0 | 1 | 반대로 행동 |
Monotonicity = “no defiers”. 그러면 IV 추정량 = LATE = \(\mathrm{E}[Y^{a=1} - Y^{a=0} | \text{complier}]\).
직관 — 잠재 결과의 4 분류: 처치 받는 행동의 4 가지 패턴. 같은 사람이 어떤 type 인지 직접 관찰 불가 — \(Z=1\) 받은 처치자가 always-taker 인지 complier 인지 모름. 통계적 식별의 한계.
직관 — Compliers 가 누구인지 모름: NHEFS 의 6% compliers — “가격 높을 때만 금연하는 사람”. 그러나 누가 그 사람들인지 데이터로 알 수 없다. 정책 결정에서 “이 6% 에게 효과 2.4kg” 라는 메시지가 의미 있나? — Hernan 의 비판.
5 NHEFS 의 IV 분석 한계
NHEFS 의 담배 가격 IV: - 분모 0.0627 — 매우 작음 - F-statistic 0.8 — 일반 임계값 10 미만 (weak IV 기준) - 95% CI (-36.5, 41.3) — 정보 없음 수준
결론: 이 IV 는 weak instrument 로 의사결정에 무용. 다른 IV 또는 다른 도구 권장.
직관 — Weak IV bias 의 메커니즘: 분모가 0 에 가까우면 추정량이 분모의 작은 추정 오차에 매우 민감. 표본마다 ±10 차이가 생길 수 있음. F-statistic > 10 은 분모 추정의 신뢰성을 보장하는 기준.
직관 — 결과의 robust 신호로 사용: 좋은 IV 라도 위 방법들 (IPW 3.4, 표준화 3.5 등) 과 일치하면 가정의 robust 신호. 일치 안 하면 미관측 교란 가능성. NHEFS 사례는 IV 의 약함이 진단에 도움 안 됨.
6 IV 의 Bound 분석 (Technical Point 16.2)
세 조건만으로는 ATE 가 식별 안 되지만 bound (상하한) 는 식별 가능.
| 데이터 | Bound 폭 |
|---|---|
| 데이터만 | \((-1, 1)\) — 비정보적 |
| + IV 사용 | Natural bounds — 좁아지지만 0 포함 가능 |
| + Joint exchangeability | Sharp bounds — 가장 좁음 |
| + Homogeneity 또는 Monotonicity | Point identification |
직관 — Bound 가 점추정 대신 정직한 결과: 강한 가정 없이 ATE 를 점으로 식별 못 하지만 범위로 식별 가능. Manski (1990) 의 partial identification — “강한 가정으로 좁은 점추정” vs “약한 가정으로 넓은 bound” 의 절충.
7 응용 분야
- 임상시험 비순응: ITT vs IV (per-protocol)
- Mendelian Randomization: 유전자를 IV 로
- 계량경제 정책 평가: 정책 변경, 거리, 가격 IV
- 사회과학: 자연 실험의 외생적 변동
- 약물역학: 의사 선호도 IV
8 후속 글로 이어지는 다리
| 글 | 다루는 내용 |
|---|---|
| 15-1 | 16.1 + 16.2 — 세 조건 + Wald 추정량 |
| 15-2 | 16.3 + 16.4 — Homogeneity + Monotonicity·LATE |
| 15-3 | 16.5 + 16.6 — 약한 IV + 다른 도구와의 비교 |
9 코드 미리보기
import pandas as pd
import statsmodels.api as sm
nhefs = pd.read_csv("nhefs.csv").dropna(
subset=["wt82_71", "price82"]
).reset_index(drop=True)
# IV: 출생주 담배 가격 (가상 — 실제 데이터에는 다른 변수 사용)
nhefs["Z"] = (nhefs["price82"] >= 1.50).astype(int)
# 분자, 분모
num = nhefs[nhefs["Z"] == 1]["wt82_71"].mean() - nhefs[nhefs["Z"] == 0]["wt82_71"].mean()
denom = nhefs[nhefs["Z"] == 1]["qsmk"].mean() - nhefs[nhefs["Z"] == 0]["qsmk"].mean()
print(f"Numerator: {num:.4f}")
print(f"Denominator: {denom:.4f}")
print(f"Wald estimate: {num/denom:.2f} kg")
# 2SLS (statsmodels.IV2SLS)
from linearmodels import IV2SLS
exog = sm.add_constant(pd.DataFrame({"const": [1]*len(nhefs)}))
endog = nhefs["qsmk"]
instr = nhefs[["Z"]]
y = nhefs["wt82_71"]
iv_model = IV2SLS(dependent=y, exog=exog, endog=endog, instruments=instr).fit()
print(iv_model.summary)
# F-statistic 점검 (first stage)
first_stage = sm.OLS(nhefs["qsmk"], sm.add_constant(nhefs["Z"])).fit()
print(f"First-stage F: {first_stage.fvalue:.2f}")10 한 줄 요약
IV 는 미관측 교란을 우회하는 다른 가족의 인과 분석 도구로, 세 instrumental conditions (relevance + exclusion + independence) + 추가 가정 (homogeneity 또는 monotonicity) 위에서 작동한다. Wald 추정량은 두 비율의 비. NHEFS 담배 가격 IV 는 weak instrument 로 95% CI 폭발. Mendelian Randomization, 의사 선호도, 거리 등이 흔한 IV 후보. LATE 는 compliers 효과로 정책 결정에 한계. IV 는 마법 아니라 다른 가정 묶음.
11 관련 주제
선행 지식
후속 주제
- 세 조건 + Wald 추정량 — Ch.16.1-16.2
- Homogeneity + Monotonicity·LATE — Ch.16.3-16.4
- 약한 IV + 도구 비교 — Ch.16.5-16.6
- Causal Survival — Ch.17
다른 카테고리 연결