이 글은 Phase J (고급 응용) 시리즈의 첫 글이자, Hernan & Robins Ch.4 Effect Modification 분해 4 편 중 첫 번째 (overview) 다. Phase D 의 인과추론 정통 (Ch.1~3) 후속 — 처치 효과가 한 숫자가 아니라 사람마다 다르다 는 인식.
1 진입 직관 — 평균 효과 0 이 모두에게 효과 0 이 아니다
Phase D 의 Ch.1~3 에서 평균 인과 효과 (ATE) 를 다뤘다. 전체 모집단 에 대한 처치의 평균 효과. 그러나 Hernan 의 놀라운 사례 :
Table 1.1 의 발견: 20 명의 표본에서 처치 군 사망률 50%, 대조 군 사망률 50%. ATE = 0 — 처치가 효과 없어 보임.
Ch.4 의 재분석: 같은 데이터를 성별로 층화. 여성 (10 명) 에서 처치 군 사망률 60% > 대조 60% — 처치가 해롭다. 남성 (10 명) 에서 처치 군 40% < 대조 60% — 처치가 이롭다.
충격적 결론: 평균 효과 0 이지만 모든 사람에게 효과 0 이 아니다. 여성에는 +20%, 남성에는 -20% — 정확히 상쇄.
결정적 함의: 처치 효과는 한 숫자가 아니다. 사람의 특성에 따라 방향과 크기가 다른 무엇이다.
비유 — 약의 부작용: 한 신약이 전체 평균 으로 사망률 변화 0%. 그러나 고령자에 +10%, 청년에 -10%. 의사 입장: “이 약은 효과 없음” 이 아니라 “청년에는 처방, 고령자에는 금기”. 정밀 의학 (precision medicine) 의 출발점.
2 정의: Effect Modifier
변수 \(V\) 가 처치 \(A\) 가 결과 \(Y\) 에 미치는 평균 인과 효과를 변화시킬 때, \(V\) 를 effect modifier 라 부른다.
2.1 두 가지 scale
Additive Effect Modification:
\[ \mathbb{E}[Y^{a=1} - Y^{a=0} | V=1] \neq \mathbb{E}[Y^{a=1} - Y^{a=0} | V=0] \]
처치 효과의 차이 (difference) 가 \(V\) 의 수준에 따라 다름.
Multiplicative Effect Modification:
\[ \frac{\mathbb{E}[Y^{a=1} | V=1]}{\mathbb{E}[Y^{a=0} | V=1]} \neq \frac{\mathbb{E}[Y^{a=1} | V=0]}{\mathbb{E}[Y^{a=0} | V=0]} \]
처치 효과의 비율 (ratio) 이 \(V\) 의 수준에 따라 다름.
2.2 핵심 가정
\(V\) 는 처치 \(A\) 에 영향을 받지 않는 변수 — 보통 baseline characteristic (성별, 연령, baseline 위험 등).
흔한 혼동: Effect modifier ≠ Confounder.
- Confounder (Phase D Ch.7): 처치와 결과 모두에 영향 — 통제 안 하면 bias 발생
- Effect modifier: 처치 효과의 크기·방향 을 변화 — 진짜 heterogeneity 표현
한 변수가 둘 다 일 수 있고 둘 다 아닐 수도 있다.
수식 직관: Confounder 는 전체 평균 효과 추정의 정확성 문제. Effect modifier 는 효과 자체의 다양성 문제. 다른 차원.
3 Additive vs Multiplicative — 같은 데이터, 다른 결론
Hernan 이 강조하는 결정적 차이.
3.1 두 시나리오
3.1.1 Scenario 1: 같은 risk difference, 다른 risk ratio
가상 데이터:
\[ \Pr[Y^{a=0} = 1 | V=1] = 0.8, \quad \Pr[Y^{a=1} = 1 | V=1] = 0.9 \]
\[ \Pr[Y^{a=0} = 1 | V=0] = 0.1, \quad \Pr[Y^{a=1} = 1 | V=0] = 0.2 \]
Additive 분석: - \(V=1\): 차이 = \(0.9 - 0.8 = 0.1\) - \(V=0\): 차이 = \(0.2 - 0.1 = 0.1\) - 동일 — 추가 effect modification 없음
Multiplicative 분석: - \(V=1\): 비율 = \(0.9 / 0.8 = 1.125\) - \(V=0\): 비율 = \(0.2 / 0.1 = 2.0\) - 다름 — 곱셈 effect modification 있음
함의: 같은 데이터 가 effect modifier 의 존재 여부에서 상반된 결론. Effect-measure modification 이라는 용어가 더 정확하다 — 항상 어느 측정 기준 을 사용했는지 명시 필요.
3.2 Risk Difference vs Risk Ratio 의 의미 차이
| 측정 | 의미 | Public Health 활용 |
|---|---|---|
| Risk difference (additive) | 절대 위험 변화 | NNT (Number Needed to Treat) 계산 |
| Risk ratio (multiplicative) | 상대 위험 변화 | 메커니즘·생물학적 직관 |
반사실 — 임상 결정: 한 약이 모든 환자에서 상대 위험을 50% 감소 (ratio = 0.5). 그러나 절대 위험 은:
- 고위험 환자: 80% → 40% (RD = 40%, NNT = 2.5)
- 저위험 환자: 5% → 2.5% (RD = 2.5%, NNT = 40)
상대 위험은 동일 (multiplicative effect modification 없음), 절대 위험은 매우 다름 (additive effect modification 있음). 고위험 환자에 처방 우선 결정.
3.3 Hernan 의 입장
“Odds ratio 는 거의 사용 안 함 — 인과 추론의 모수로 부적합. Risk difference 와 risk ratio 만 다룸. 두 측정 모두 보고 — 어느 한 쪽 기준만으로 결론 내리지 마라.”
4 Qualitative vs Non-qualitative Effect Modification
4.1 Qualitative (방향 반대)
처치 효과가 sub-group 별로 반대 방향. 한 group 에서 이롭고 다른 group 에서 해로움.
4.1.1 사례
Hernan 의 Table 4.1: 여성 +20% 사망 증가, 남성 -20% 사망 감소. Qualitative effect modification.
4.1.2 함의
qualitative 일 때:
- Additive 와 multiplicative 둘 다 effect modification 발생 (자동)
- 평균 처치 효과가 모집단의 sub-group 비율에 매우 민감 — 일반화 위험
4.2 Non-qualitative (크기 차이만)
처치 효과가 sub-group 별로 같은 방향, 크기만 다름.
4.2.1 사례
항암제가 모든 환자에서 사망률 감소, 그러나 고령자에서 더 큰 감소 (예: 30%) vs 청년에서 적은 감소 (예: 10%).
4.2.2 함의
Multiplicative scale 에서 modification 없을 수도, 있을 수도. Additive scale 도 마찬가지.
핵심: 크기 차이 만 있어도 임상적으로 중요 — 어느 환자에 더 효과적인지 결정.
5 Stratification — 식별의 핵심 도구
5.1 메커니즘
처치 효과를 \(V\) 의 각 stratum 에서 별도로 계산. Stratum 간 다르면 effect modification 존재.
5.2 무작위 배정 시험에서
Marginal randomized experiment: 무조건 무작위 배정. 모든 stratum 에서 exchangeability 성립. 따라서:
\[ \Pr[Y^{a=1} = 1 | V=v] = \Pr[Y = 1 | A=1, V=v] \]
즉 관찰된 conditional risk 가 진짜 counterfactual risk 와 같음. Sub-group 별 단순 비교 로 effect modification 식별.
5.3 조건부 무작위 배정 시험에서
Conditional randomization (예: \(L\) 에 따라 무작위 확률 다름). \(V\) 에서의 stratification 은 2 단계:
- \(V\) 에서 stratification
- 각 stratum 내에서 \(L\) 에 대한 standardization 또는 IP weighting
Hernan 의 Greek vs Roman 사례 (Ch.4.2): 두 nationality 에서 L 에 따른 처치 확률 다름 + 처치 효과 자체 다름.
5.4 관찰 연구에서
Conditional exchangeability \(Y^a \perp\!\!\!\perp A | L\) 가정 + 위 2 단계 절차. Phase D Ch.7 의 confounding 통제와 결합.
6 왜 Effect Modification 이 중요한가
Hernan 이 4.3 에서 강조하는 3 가지 이유.
6.1 이유 1: Transportability — 한 모집단의 효과가 다른 모집단에 일반화 가능한가
효과 modifier 의 분포가 모집단마다 다름. 한 모집단에서 평균 +10% 효과가 다른 모집단 에서 -5% 일 수 있음.
사례: 미국에서 검증된 약을 한국 에 적용. 인종·생활습관·식이 등 effect modifier 분포 다름 → 효과 다를 수 있음. 임상 문헌에서 흔한 도전.
6.2 이유 2: Targeting — 어느 sub-group 에 처치를 적용할지
정밀 의학 (precision medicine) 의 출발점. 모든 환자에 처방 이 아니라 효과 클 환자에만 처방.
사례: 신약 X 가 전체 평균 으로 사망률 5% 감소. 그러나 유전자 변이 A 환자에 30% 감소, 변이 B 환자에 효과 없음. 변이 검사 후 변이 A 환자에만 처방 — 효율적.
6.3 이유 3: Mechanism — 처치 작용 방식의 단서
Effect modifier 가 처치 메커니즘의 hint. 효과가 특정 group 에서만 나타나면 그 group 의 특성이 메커니즘과 관련.
사례: 항암제가 유전자 변이 환자에만 효과 → 그 유전자 경로 가 약의 작용 mechanism.
7 Surrogate vs Causal Effect Modifier
Hernan 의 미묘한 구분.
7.1 Causal Effect Modifier
\(V\) 자체가 처치 효과의 차이를 만드는 인과 요인.
7.2 Surrogate Effect Modifier
\(V\) 는 그 자체 가 아니라 진짜 인과 요인의 marker.
7.3 사례 (Hernan Ch.4)
국적 (Greek vs Roman) 이 효과 modifier — 그러나 국적 자체 가 인과적 작용은 아님.
진짜 원인: 외과 술기 품질 차이 (Greek 의사가 더 능숙). 국적은 그 marker.
함의: Roman 환자에 Greek 의사 보내면 effect modification 사라짐. Surrogate 의 차이는 근본 인과 를 찾으면 사라질 수 있음.
반사실: 만약 국적 자체 가 인과적 (예: 유전적 약물 대사 차이) 이면 이주해도 modification 유지. Causal effect modifier.
신중한 표현: 일부 학자는 “effect modification by V” 대신 “effect heterogeneity across strata of V” 표현 선호 — 인과적 주장 회피.
8 Effect Modification ≠ Interaction
Hernan 의 결정적 분리.
8.1 차이
| 개념 | Hernan 의 정의 |
|---|---|
| Effect Modification (Ch.4) | \(V\) 가 처치 \(A\) 의 효과를 변화시킴. \(V\) 는 처치 아님 — baseline 변수 |
| Interaction (Ch.5) | \(A\) 와 \(V\) 둘 다 처치 — 공동 개입 의 효과 |
8.2 사례
Effect modification: 성별 이 항암제 효과를 변화. 성별은 처치 아님.
Interaction: 항암제 + 방사선 의 공동 효과. 둘 다 처치.
수학적 형태는 비슷 하지만 해석 다름. Interaction 은 둘 다 조작 가능 하므로 공동 처치 디자인 가능. Effect modification 은 baseline 의 자연스러운 차이.
다음 글 (J-HER5 시리즈) 에서 interaction 깊이.
9 Effect in the Treated — Fine Point 4.1
9.1 정의
일반 ATE 가 전체 모집단의 평균 효과 라면, Average effect in the treated (ATT) 는 처치를 받은 사람들에서의 평균 효과.
\[ \text{ATT} = \mathbb{E}[Y^{a=1} | A=1] - \mathbb{E}[Y^{a=0} | A=1] \]
9.2 의미
처치 받은 사람들의 counterfactual — 그들이 받지 않았다면 무슨 결과 일까. 처치 받은 group 의 baseline 위험 이 그 답.
9.3 Standardized Morbidity Ratio (SMR)
\[ \text{SMR} = \frac{\Pr[Y=1 | A=1]}{\Pr[Y^{a=0}=1 | A=1]} \]
의학에서 흔히 사용. 해당 group 에서의 risk ratio.
9.4 Effect Modification 과의 관계
Treated 와 untreated 의 distribution 이 다르면 ATT ≠ ATE. 처치 군이 평균보다 효과 modifier 비율 다름 — ATT ≠ ATE.
반사실: 신약을 고위험 환자에 우선 처방 하는 임상 환경. ATT 는 고위험 환자의 평균 효과. ATE (모든 환자 균등) 와 다름. Targeting 정책 평가 에 ATT 적합.
10 챕터의 줄기 — 후속 글 안내
Ch.4 의 후반부 (4.4, 4.5) 와 후속 글:
10.1 후속 글 1 (J-HER4-1) — Heterogeneity + Stratification 깊이
- 4.1 의 가상 데이터 깊이 분석
- 4.2 의 stratification 메커니즘 — randomized vs observational
- Greek/Roman 사례
10.2 후속 글 2 (J-HER4-2) — Why Care + Stratification as Adjustment
- 4.3 의 transportability·targeting·mechanism 깊이
- 4.4 의 stratification 이 adjustment 도구로서의 역할
- Confounding 과의 관계
10.3 후속 글 3 (J-HER4-3) — Matching as Adjustment
- 4.5 의 matching 으로서의 stratification
- Propensity score matching 과의 연결
- IP weighting 과의 비교
이후 J-HER5 시리즈 (4 편) 가 interaction 다룸.
11 Phase J 시리즈에서의 위치
Phase J 는 고급 응용 28 편. 이 글이 첫 글:
- HER Ch.4 (4 편): Effect Modification ← 현재
- HER Ch.5 (4 편): Interaction
- ML HTE (4 편): Meta-learners, Causal Forest, DML
- DiD (4 편): Difference-in-Differences
- RDD (4 편): Regression Discontinuity
- Switchback·Geo (4 편): 시간·지역 무작위
- Adaptive Trial (4 편): RAR, Platform Trial
Effect Modification 은 이 모든 응용의 기초 개념. HTE 도, DiD 도, switchback 도 모두 처치 효과의 이질성 을 가정.
12 시뮬레이션 — Hernan Table 4.1 재현
import numpy as np
from scipy import stats
np.random.seed(42)
# Hernan Table 4.1 (Ch.4) 재현
# 20 명, 성별 V, counterfactual Y^0, Y^1
data = [
# (이름, V (1=여성, 0=남성), Y^0, Y^1)
("Rheia", 1, 0, 1),
("Demeter", 1, 0, 0),
("Hestia", 1, 0, 0),
("Hera", 1, 0, 0),
("Artemis", 1, 1, 1),
("Leto", 1, 0, 1),
("Athena", 1, 1, 1),
("Aphrodite", 1, 0, 1),
("Persephone",1, 1, 1),
("Hebe", 1, 1, 0),
("Kronos", 0, 1, 0),
("Hades", 0, 0, 0),
("Poseidon", 0, 1, 0),
("Zeus", 0, 0, 1),
("Apollo", 0, 1, 0),
("Ares", 0, 1, 1),
("Hephaestus",0, 0, 1),
("Polyphemus",0, 0, 1),
("Hermes", 0, 1, 0),
("Dionysus", 0, 1, 0),
]
V = np.array([d[1] for d in data])
Y0 = np.array([d[2] for d in data])
Y1 = np.array([d[3] for d in data])
# 전체 모집단의 ATE
ate_overall_rd = Y1.mean() - Y0.mean()
ate_overall_rr = Y1.mean() / Y0.mean() if Y0.mean() > 0 else float('inf')
print("[Hernan Table 4.1 — 평균 효과 vs Sub-group 효과]\n")
print(f"전체 (n={len(V)}):")
print(f" Pr(Y^1=1) = {Y1.mean():.2f}")
print(f" Pr(Y^0=1) = {Y0.mean():.2f}")
print(f" Risk Difference (ATE) = {ate_overall_rd:+.2f}")
print(f" Risk Ratio = {ate_overall_rr:.2f}")
print(f" → 평균 효과 0 — 처치가 효과 없어 보임\n")
# 여성 (V=1) 의 ATE
women = V == 1
ate_women_rd = Y1[women].mean() - Y0[women].mean()
ate_women_rr = Y1[women].mean() / Y0[women].mean()
print(f"여성 (V=1, n={women.sum()}):")
print(f" Pr(Y^1=1 | V=1) = {Y1[women].mean():.2f}")
print(f" Pr(Y^0=1 | V=1) = {Y0[women].mean():.2f}")
print(f" Risk Difference = {ate_women_rd:+.2f}")
print(f" Risk Ratio = {ate_women_rr:.2f}")
print(f" → 처치가 사망 위험을 *증가* (해로움)\n")
# 남성 (V=0) 의 ATE
men = V == 0
ate_men_rd = Y1[men].mean() - Y0[men].mean()
ate_men_rr = Y1[men].mean() / Y0[men].mean()
print(f"남성 (V=0, n={men.sum()}):")
print(f" Pr(Y^1=1 | V=0) = {Y1[men].mean():.2f}")
print(f" Pr(Y^0=1 | V=0) = {Y0[men].mean():.2f}")
print(f" Risk Difference = {ate_men_rd:+.2f}")
print(f" Risk Ratio = {ate_men_rr:.2f}")
print(f" → 처치가 사망 위험을 *감소* (이로움)\n")
# Effect modification 확인
print("[Effect Modification by V]")
print(f" Additive: {ate_women_rd:+.2f} (여성) ≠ {ate_men_rd:+.2f} (남성) → YES")
print(f" Multiplicative: {ate_women_rr:.2f} (여성) ≠ {ate_men_rr:.2f} (남성) → YES")
print(f" Qualitative (방향 반대): YES — 여성은 +, 남성은 -")
print()
print(" → 평균 효과 0 의 함정 — 모집단 분포 (50:50) 의 우연한 상쇄")
print(" → 만약 다른 모집단 (예: 80% 여성) 에서는 평균 효과가 *해로움* 으로 나타남")
print(" → Transportability 의 도전")결과 해석:
- 전체 ATE = 0. 처치 효과 없어 보임 — 위험한 결론.
- 여성에는 RD = +0.20, 남성에는 RD = -0.20. 정확히 상쇄.
- Qualitative effect modification — 두 group 의 효과 방향 반대.
- Transportability 위험: 여성 비율 다른 모집단에서 완전히 다른 결론.
13 결론 — Ch.4 개관의 한 줄 요약
평균 처치 효과 0 이 모두에게 효과 0 이 아니다. Effect modification 은 처치 효과의 이질성 을 인정하는 인과 추론의 근본 개념.
핵심 메시지:
- 평균의 함정: ATE 0 + sub-group 효과 ≠ 0 가능 (qualitative)
- Additive vs Multiplicative: 같은 데이터, 다른 결론. Effect-measure modification
- Qualitative vs Non-qualitative: 방향 반대 vs 크기 차이만
- Stratification 으로 식별: Randomized + Conditional + Observational
- Transportability·Targeting·Mechanism — 3 가지 응용
- Surrogate vs Causal modifier: 인과 메커니즘 신중
- Effect modification ≠ Interaction: Ch.5 에서 다룸
다음 글에서 4.1, 4.2 의 heterogeneity 와 stratification 식별 깊이.
14 관련 주제
선행 지식
- (Phase D) Hernan Ch.1~3 — 인과 효과 정의·무작위 실험·관찰 연구
- (Phase D) Ch.7 — Confounding (effect modifier 와의 차이)
Phase J 후속 글
- HER Ch.4.1 + 4.2 — Heterogeneity 와 Stratification (placeholder)
- HER Ch.4.3 + 4.4 — Why Care + Adjustment (placeholder)
- HER Ch.4.5 — Matching as Adjustment (placeholder)
- HER Ch.5 시리즈 — Interaction (placeholder)
다른 카테고리 연결
- (Phase J 후속) ML HTE — Meta-learners, Causal Forest
- Machine_Learning — Heterogeneous Treatment Effects (placeholder)
15 참고문헌
- Hernán, M. A. & Robins, J. M. (2020). Causal Inference: What If, Chapter 4. Chapman & Hall/CRC.
- Hernán, M. A. & VanderWeele, T. J. (2011). Compound treatments and transportability of causal inference. Epidemiology 22, 368-377.
- Pearl, J. & Bareinboim, E. (2014). External validity: from do-calculus to transportability across populations. Statistical Science 29, 579-595.
- Dahabreh, I. J. & Hernán, M. A. (2019). Extending inferences from a randomized trial to a target population. Eur. J. Epidemiol. 34, 719-722.
- Smith, G. C. S. & Pell, J. P. (2003). Parachute use to prevent death and major trauma related to gravitational challenge. BMJ 327, 1459-1461.
- Miettinen, O. S. (1972). Standardization of risk ratios. Am. J. Epidemiol. 96, 383-388.