도구변수 추정 — Ch.16 개관

Hernan Ch.16 — 미관측 교란 우회, 3 가지 IV 조건, Wald · LATE

Hernan & Robins (2020) Ch.16 의 6 개 소챕터를 한 흐름으로 정리한다. IV 가 다른 도구와 근본적으로 다른 이유 (미관측 교란 보정 가능), 3 가지 instrumental conditions, Wald 추정량, homogeneity vs monotonicity 의 동치 조건, LATE 의 의미와 한계를 압축한다.

Experimentation
Causal Inference
저자

Kwangmin Kim

공개

2026년 05월 08일

1 개요

Ch.12~15 의 모든 도구 (IPW, 표준화, g-estimation, PS) 는 핵심 가정에 의존한다 — 모든 교란 변수가 측정되어 보정에 포함. 미관측 교란이 있으면 모든 도구가 실패.

도구변수 (Instrumental Variable, IV) 는 이 가정을 우회하는 다른 가족의 도구이다. 미관측 교란이 있어도 다른 set 의 가정 위에서 인과 효과 추정 가능.

직관 — IV 가 마법인 이유: 미관측 교란을 측정할 수 없는 상황에서, 처치-결과 관계의 “외생적” 변동 (instrument \(Z\)) 을 활용해 인과 효과를 우회 추정. 경제학·역학에서 광범위하게 사용. 그러나 IV 도 untestable 가정에 의존 — 다른 가정의 묶음으로 같은 문제를 푸는 도구.

정의: 도구변수 (Instrumental Variable)

세 가지 instrumental conditions 를 만족하는 변수 \(Z\):

  1. Relevance: \(Z\)\(A\) 와 연관 (\(Z \not\!\perp\!\!\!\perp A\)).
  2. Exclusion: \(Z\)\(Y\) 에 영향을 주는 경로는 \(A\) 를 통해서만.
  3. Independence: \(Z\)\(Y\) 가 공통 원인을 갖지 않음 (or \(Y^{a, z} \perp\!\!\!\perp Z\)).

직관 — 세 조건의 이미지: (i) 도구가 처치를 흔든다, (ii) 도구의 영향이 처치만을 통과한다, (iii) 도구가 결과와 직접 연결 안 된다. 세 조건이 모두 성립하면 도구의 변동을 “처치의 외생적 진동” 으로 사용 가능.

2 6 개 소챕터의 흐름

소챕터 핵심 질문
16.1 IV 의 세 조건은? Relevance + Exclusion + Independence
16.2 IV 추정량의 형태는? Wald 추정량 — 두 비율의 비
16.3 추가 가정 (iv) 는? Homogeneity — 효과의 등질성
16.4 더 약한 (iv) 는? Monotonicity → LATE (compliers 효과)
16.5 세 조건을 다시 보면? 약 instrument 의 위험, weak IV bias
16.6 다른 도구와 비교? 가정의 다른 묶음, 보완적 사용

3 NHEFS 사례 — 담배 가격 IV

NHEFS IV 결과 (Hernan, Program 16.1-16.2)

제안된 IV: \(Z\) = 출생 주의 평균 담배 가격 > $1.50 여부 (이항).

Wald 추정량:

\[\widehat{\beta}_\text{IV} = \frac{\widehat{\mathrm{E}}[Y|Z=1] - \widehat{\mathrm{E}}[Y|Z=0]}{\widehat{\mathrm{E}}[A|Z=1] - \widehat{\mathrm{E}}[A|Z=0]} = \frac{2.686 - 2.536}{0.2578 - 0.1951} = \frac{0.1503}{0.0627} = 2.4 \text{ kg}\]

95% CI: \((-36.5, 41.3)\) — 매우 넓음 (weak instrument).

직관 — Wald 추정량의 의미: 분자 = “\(Z\) 가 1 일 때 vs 0 일 때 결과 차이” (ITT-like). 분모 = “\(Z\) 가 1 일 때 vs 0 일 때 처치 차이” (compliance-like). 분모로 분자를 부풀려 처치 효과 추정. 분모가 작을수록 (약한 instrument) 부풀림이 커지고 분산도 폭발.

직관 — 95% CI 가 매우 넓은 이유: 분모 \(0.0627\) 이 매우 작음 — 6% 의 차이만 처치에서 발생. 분모의 작은 변동이 추정값에 큰 영향. 약한 instrument 의 분산 폭발이 IV 의 가장 흔한 함정.

4 핵심 개념 5 가지

4.1 1. 세 IV 조건 (16.1)

조건 검증 가능? NHEFS 점검
(i) Relevance 검증 가능 6% 의 차이 — 약함
(ii) Exclusion 검증 불가 도메인 가정
(iii) Independence 검증 불가 도메인 가정

직관 — 두 가정만 untestable: Relevance 는 데이터에서 \(Z\)-\(A\) 연관으로 직접 점검. 나머지 두 조건은 도메인 지식에 의존. 데이터로 IV 의 타당성을 절반만 점검 가능.

4.2 2. RCT vs 관찰 연구 IV

RCT 의 IV 사례

무작위 임상시험: \(Z\) = 무작위 배정, \(A\) = 실제 처치 받음, \(Y\) = 결과.

    1. Relevance: 배정이 처치 결정에 영향 — 자동 성립.
    1. Exclusion: 이중 맹검에서 배정 자체가 결과에 영향 안 줌 — 설계로 보장.
    1. Independence: 무작위 배정 — 자동 성립.

→ 비순응 (noncompliance) 이 있는 RCT 에서 IV 분석으로 처치 효과 추정. ITT 와 다름.

직관 — IV 가 RCT 의 도구: ITT (Intent-to-Treat) 는 “배정 효과” 추정. IV 는 “처치 효과” 추정 — 비순응자 보정. RCT 의 비순응 처리는 IV 의 가장 자연스러운 응용.

4.3 3. 관찰 연구의 IV 후보

흔한 관찰 IV 후보 (Hernan, Fine Point 16.1)
카테고리 예시 가정
Genetic ALDH2 polymorphism (alcohol metabolism) 유전자 → 처치 → 결과만
Preference 의사의 처방 선호도 선호도 → 처방 → 결과만
Access 시설까지의 거리, 시간 거리 → 처치 → 결과만

NHEFS 의 담배 가격은 access 카테고리 — “가격 → 금연 → 체중” 가정.

직관 — Mendelian Randomization: 유전자 변이를 IV 로 사용. 유전자는 무작위로 결정되어 부모 세대의 무작위 실험과 비슷한 구조. 의학·역학에서 중요한 도구로 자리잡음.

직관 — IV 검증의 어려움: 후보 IV 가 모든 조건을 만족하는지 확실히 알 수 없다. 도메인 지식 + 다른 IV 와의 결과 일치성 + sensitivity analysis 로 robust 검토.

4.4 4. Homogeneity vs Monotonicity (16.3-16.4)

세 조건만으로는 IV 추정량이 ATE 와 같다고 보장 못 함. 추가 가정 (iv) 필요:

두 가지 (iv) 옵션

Homogeneity: 처치 효과가 모든 사람에게 동일 (또는 미관측 교란 \(U\) 의 함수가 아님). - 비현실적 (대부분 효과는 변동성 있음).

Monotonicity: 도구가 모든 사람의 처치를 같은 방향으로 변경. - \(A^{z=1} \geq A^{z=0}\) — defier 없음. - 더 현실적이지만 추정 대상이 변경: ATE → LATE (compliers 효과).

직관 — Defier 의 의미: \(Z=1\) 일 때 처치 안 받고 \(Z=0\) 일 때 처치 받는 반대로 행동 하는 사람. 가격 IV 사례에서 “가격 높을 때 더 흡연하는 사람” — 비합리적이지만 가능. 흔하지 않으면 monotonicity 합리적.

직관 — LATE 가 정책 결정에 한계: LATE = compliers 만의 효과. Always-takers 와 never-takers 효과는 모름. 정책 적용 시 “이 인구의 효과” 가 아닌 “compliers 인구의 효과” 라는 좁은 추정.

4.5 5. 4 가지 Compliance Type (16.4)

\(Z\)\(A\) 의 잠재 결과 분류
Type \(A^{z=1}\) \(A^{z=0}\) 의미
Always-taker 1 1 항상 처치 받음
Never-taker 0 0 절대 처치 안 받음
Complier 1 0 도구에 따라 행동
Defier 0 1 반대로 행동

Monotonicity = “no defiers”. 그러면 IV 추정량 = LATE = \(\mathrm{E}[Y^{a=1} - Y^{a=0} | \text{complier}]\).

직관 — 잠재 결과의 4 분류: 처치 받는 행동의 4 가지 패턴. 같은 사람이 어떤 type 인지 직접 관찰 불가 — \(Z=1\) 받은 처치자가 always-taker 인지 complier 인지 모름. 통계적 식별의 한계.

직관 — Compliers 가 누구인지 모름: NHEFS 의 6% compliers — “가격 높을 때만 금연하는 사람”. 그러나 누가 그 사람들인지 데이터로 알 수 없다. 정책 결정에서 “이 6% 에게 효과 2.4kg” 라는 메시지가 의미 있나? — Hernan 의 비판.

5 NHEFS 의 IV 분석 한계

약한 IV 의 결과

NHEFS 의 담배 가격 IV: - 분모 0.0627 — 매우 작음 - F-statistic 0.8 — 일반 임계값 10 미만 (weak IV 기준) - 95% CI (-36.5, 41.3) — 정보 없음 수준

결론: 이 IV 는 weak instrument 로 의사결정에 무용. 다른 IV 또는 다른 도구 권장.

직관 — Weak IV bias 의 메커니즘: 분모가 0 에 가까우면 추정량이 분모의 작은 추정 오차에 매우 민감. 표본마다 ±10 차이가 생길 수 있음. F-statistic > 10 은 분모 추정의 신뢰성을 보장하는 기준.

직관 — 결과의 robust 신호로 사용: 좋은 IV 라도 위 방법들 (IPW 3.4, 표준화 3.5 등) 과 일치하면 가정의 robust 신호. 일치 안 하면 미관측 교란 가능성. NHEFS 사례는 IV 의 약함이 진단에 도움 안 됨.

6 IV 의 Bound 분석 (Technical Point 16.2)

세 조건만으로는 ATE 가 식별 안 되지만 bound (상하한) 는 식별 가능.

데이터 Bound 폭
데이터만 \((-1, 1)\) — 비정보적
+ IV 사용 Natural bounds — 좁아지지만 0 포함 가능
+ Joint exchangeability Sharp bounds — 가장 좁음
+ Homogeneity 또는 Monotonicity Point identification

직관 — Bound 가 점추정 대신 정직한 결과: 강한 가정 없이 ATE 를 점으로 식별 못 하지만 범위로 식별 가능. Manski (1990) 의 partial identification — “강한 가정으로 좁은 점추정” vs “약한 가정으로 넓은 bound” 의 절충.

7 응용 분야

  • 임상시험 비순응: ITT vs IV (per-protocol)
  • Mendelian Randomization: 유전자를 IV 로
  • 계량경제 정책 평가: 정책 변경, 거리, 가격 IV
  • 사회과학: 자연 실험의 외생적 변동
  • 약물역학: 의사 선호도 IV

8 후속 글로 이어지는 다리

다루는 내용
15-1 16.1 + 16.2 — 세 조건 + Wald 추정량
15-2 16.3 + 16.4 — Homogeneity + Monotonicity·LATE
15-3 16.5 + 16.6 — 약한 IV + 다른 도구와의 비교

9 코드 미리보기

import pandas as pd
import statsmodels.api as sm

nhefs = pd.read_csv("nhefs.csv").dropna(
    subset=["wt82_71", "price82"]
).reset_index(drop=True)

# IV: 출생주 담배 가격 (가상 — 실제 데이터에는 다른 변수 사용)
nhefs["Z"] = (nhefs["price82"] >= 1.50).astype(int)

# 분자, 분모
num = nhefs[nhefs["Z"] == 1]["wt82_71"].mean() - nhefs[nhefs["Z"] == 0]["wt82_71"].mean()
denom = nhefs[nhefs["Z"] == 1]["qsmk"].mean() - nhefs[nhefs["Z"] == 0]["qsmk"].mean()

print(f"Numerator: {num:.4f}")
print(f"Denominator: {denom:.4f}")
print(f"Wald estimate: {num/denom:.2f} kg")

# 2SLS (statsmodels.IV2SLS)
from linearmodels import IV2SLS
exog = sm.add_constant(pd.DataFrame({"const": [1]*len(nhefs)}))
endog = nhefs["qsmk"]
instr = nhefs[["Z"]]
y = nhefs["wt82_71"]
iv_model = IV2SLS(dependent=y, exog=exog, endog=endog, instruments=instr).fit()
print(iv_model.summary)

# F-statistic 점검 (first stage)
first_stage = sm.OLS(nhefs["qsmk"], sm.add_constant(nhefs["Z"])).fit()
print(f"First-stage F: {first_stage.fvalue:.2f}")

10 한 줄 요약

IV 는 미관측 교란을 우회하는 다른 가족의 인과 분석 도구로, 세 instrumental conditions (relevance + exclusion + independence) + 추가 가정 (homogeneity 또는 monotonicity) 위에서 작동한다. Wald 추정량은 두 비율의 비. NHEFS 담배 가격 IV 는 weak instrument 로 95% CI 폭발. Mendelian Randomization, 의사 선호도, 거리 등이 흔한 IV 후보. LATE 는 compliers 효과로 정책 결정에 한계. IV 는 마법 아니라 다른 가정 묶음.

11 관련 주제

선행 지식

후속 주제

다른 카테고리 연결

Subscribe

Enjoy this blog? Get notified of new posts by email: