Effect Modification — Hernan Ch.4 개관

평균 효과의 함정과 sub-group heterogeneity

Hernan & Robins Causal Inference: What If Ch.4 Effect Modification 의 큰 그림. (1) 평균 처치 효과 0 이지만 sub-group 별로 효과가 반대 방향 일 수 있는 충격적 사례, (2) Effect Modifier \(V\) 의 공식 정의 — Additive vs Multiplicative scale, (3) Qualitative vs Non-qualitative effect modification, (4) Stratification 으로 식별, (5) 왜 effect modification 이 transportability·targeting·mechanism 의 핵심인가, (6) Surrogate vs Causal effect modifier 구분. 후속 3 글 안내.

Experimentation
Causal Inference
저자

Kwangmin Kim

공개

2026년 05월 09일

이 글은 Phase J (고급 응용) 시리즈의 첫 글이자, Hernan & Robins Ch.4 Effect Modification 분해 4 편 중 첫 번째 (overview) 다. Phase D 의 인과추론 정통 (Ch.1~3) 후속 — 처치 효과가 한 숫자가 아니라 사람마다 다르다 는 인식.

1 진입 직관 — 평균 효과 0 이 모두에게 효과 0 이 아니다

Phase D 의 Ch.1~3 에서 평균 인과 효과 (ATE) 를 다뤘다. 전체 모집단 에 대한 처치의 평균 효과. 그러나 Hernan 의 놀라운 사례 :

Table 1.1 의 발견: 20 명의 표본에서 처치 군 사망률 50%, 대조 군 사망률 50%. ATE = 0 — 처치가 효과 없어 보임.

Ch.4 의 재분석: 같은 데이터를 성별로 층화. 여성 (10 명) 에서 처치 군 사망률 60% > 대조 60% — 처치가 해롭다. 남성 (10 명) 에서 처치 군 40% < 대조 60% — 처치가 이롭다.

충격적 결론: 평균 효과 0 이지만 모든 사람에게 효과 0 이 아니다. 여성에는 +20%, 남성에는 -20% — 정확히 상쇄.

결정적 함의: 처치 효과는 한 숫자가 아니다. 사람의 특성에 따라 방향과 크기가 다른 무엇이다.

비유 — 약의 부작용: 한 신약이 전체 평균 으로 사망률 변화 0%. 그러나 고령자에 +10%, 청년에 -10%. 의사 입장: “이 약은 효과 없음” 이 아니라 “청년에는 처방, 고령자에는 금기”. 정밀 의학 (precision medicine) 의 출발점.

2 정의: Effect Modifier

정의: Effect Modifier (Hernan Ch.4)

변수 \(V\)처치 \(A\) 가 결과 \(Y\) 에 미치는 평균 인과 효과를 변화시킬 때, \(V\)effect modifier 라 부른다.

2.1 두 가지 scale

Additive Effect Modification:

\[ \mathbb{E}[Y^{a=1} - Y^{a=0} | V=1] \neq \mathbb{E}[Y^{a=1} - Y^{a=0} | V=0] \]

처치 효과의 차이 (difference)\(V\) 의 수준에 따라 다름.

Multiplicative Effect Modification:

\[ \frac{\mathbb{E}[Y^{a=1} | V=1]}{\mathbb{E}[Y^{a=0} | V=1]} \neq \frac{\mathbb{E}[Y^{a=1} | V=0]}{\mathbb{E}[Y^{a=0} | V=0]} \]

처치 효과의 비율 (ratio)\(V\) 의 수준에 따라 다름.

2.2 핵심 가정

\(V\) 는 처치 \(A\) 에 영향을 받지 않는 변수 — 보통 baseline characteristic (성별, 연령, baseline 위험 등).

흔한 혼동: Effect modifier ≠ Confounder.

  • Confounder (Phase D Ch.7): 처치와 결과 모두에 영향 — 통제 안 하면 bias 발생
  • Effect modifier: 처치 효과의 크기·방향 을 변화 — 진짜 heterogeneity 표현

한 변수가 둘 다 일 수 있고 둘 다 아닐 수도 있다.

수식 직관: Confounder 는 전체 평균 효과 추정의 정확성 문제. Effect modifier 는 효과 자체의 다양성 문제. 다른 차원.

3 Additive vs Multiplicative — 같은 데이터, 다른 결론

Hernan 이 강조하는 결정적 차이.

3.1 두 시나리오

3.1.1 Scenario 1: 같은 risk difference, 다른 risk ratio

가상 데이터:

\[ \Pr[Y^{a=0} = 1 | V=1] = 0.8, \quad \Pr[Y^{a=1} = 1 | V=1] = 0.9 \]

\[ \Pr[Y^{a=0} = 1 | V=0] = 0.1, \quad \Pr[Y^{a=1} = 1 | V=0] = 0.2 \]

Additive 분석: - \(V=1\): 차이 = \(0.9 - 0.8 = 0.1\) - \(V=0\): 차이 = \(0.2 - 0.1 = 0.1\) - 동일 — 추가 effect modification 없음

Multiplicative 분석: - \(V=1\): 비율 = \(0.9 / 0.8 = 1.125\) - \(V=0\): 비율 = \(0.2 / 0.1 = 2.0\) - 다름 — 곱셈 effect modification 있음

함의: 같은 데이터 가 effect modifier 의 존재 여부에서 상반된 결론. Effect-measure modification 이라는 용어가 더 정확하다 — 항상 어느 측정 기준 을 사용했는지 명시 필요.

3.2 Risk Difference vs Risk Ratio 의 의미 차이

측정 의미 Public Health 활용
Risk difference (additive) 절대 위험 변화 NNT (Number Needed to Treat) 계산
Risk ratio (multiplicative) 상대 위험 변화 메커니즘·생물학적 직관

반사실 — 임상 결정: 한 약이 모든 환자에서 상대 위험을 50% 감소 (ratio = 0.5). 그러나 절대 위험 은:

  • 고위험 환자: 80% → 40% (RD = 40%, NNT = 2.5)
  • 저위험 환자: 5% → 2.5% (RD = 2.5%, NNT = 40)

상대 위험은 동일 (multiplicative effect modification 없음), 절대 위험은 매우 다름 (additive effect modification 있음). 고위험 환자에 처방 우선 결정.

3.3 Hernan 의 입장

Odds ratio 는 거의 사용 안 함 — 인과 추론의 모수로 부적합. Risk differencerisk ratio 만 다룸. 두 측정 모두 보고 — 어느 한 쪽 기준만으로 결론 내리지 마라.”

4 Qualitative vs Non-qualitative Effect Modification

4.1 Qualitative (방향 반대)

처치 효과가 sub-group 별로 반대 방향. 한 group 에서 이롭고 다른 group 에서 해로움.

4.1.1 사례

Hernan 의 Table 4.1: 여성 +20% 사망 증가, 남성 -20% 사망 감소. Qualitative effect modification.

4.1.2 함의

qualitative 일 때:

  • Additive 와 multiplicative 둘 다 effect modification 발생 (자동)
  • 평균 처치 효과가 모집단의 sub-group 비율에 매우 민감 — 일반화 위험

4.2 Non-qualitative (크기 차이만)

처치 효과가 sub-group 별로 같은 방향, 크기만 다름.

4.2.1 사례

항암제가 모든 환자에서 사망률 감소, 그러나 고령자에서 더 큰 감소 (예: 30%) vs 청년에서 적은 감소 (예: 10%).

4.2.2 함의

Multiplicative scale 에서 modification 없을 수도, 있을 수도. Additive scale 도 마찬가지.

핵심: 크기 차이 만 있어도 임상적으로 중요 — 어느 환자에 더 효과적인지 결정.

5 Stratification — 식별의 핵심 도구

5.1 메커니즘

처치 효과를 \(V\) 의 각 stratum 에서 별도로 계산. Stratum 간 다르면 effect modification 존재.

5.2 무작위 배정 시험에서

Marginal randomized experiment: 무조건 무작위 배정. 모든 stratum 에서 exchangeability 성립. 따라서:

\[ \Pr[Y^{a=1} = 1 | V=v] = \Pr[Y = 1 | A=1, V=v] \]

관찰된 conditional risk진짜 counterfactual risk 와 같음. Sub-group 별 단순 비교 로 effect modification 식별.

5.3 조건부 무작위 배정 시험에서

Conditional randomization (예: \(L\) 에 따라 무작위 확률 다름). \(V\) 에서의 stratification 은 2 단계:

  1. \(V\) 에서 stratification
  2. 각 stratum 내에서 \(L\) 에 대한 standardization 또는 IP weighting

Hernan 의 Greek vs Roman 사례 (Ch.4.2): 두 nationality 에서 L 에 따른 처치 확률 다름 + 처치 효과 자체 다름.

5.4 관찰 연구에서

Conditional exchangeability \(Y^a \perp\!\!\!\perp A | L\) 가정 + 위 2 단계 절차. Phase D Ch.7 의 confounding 통제와 결합.

6 왜 Effect Modification 이 중요한가

Hernan 이 4.3 에서 강조하는 3 가지 이유.

6.1 이유 1: Transportability — 한 모집단의 효과가 다른 모집단에 일반화 가능한가

효과 modifier 의 분포가 모집단마다 다름. 한 모집단에서 평균 +10% 효과가 다른 모집단 에서 -5% 일 수 있음.

사례: 미국에서 검증된 약을 한국 에 적용. 인종·생활습관·식이 등 effect modifier 분포 다름효과 다를 수 있음. 임상 문헌에서 흔한 도전.

6.2 이유 2: Targeting — 어느 sub-group 에 처치를 적용할지

정밀 의학 (precision medicine) 의 출발점. 모든 환자에 처방 이 아니라 효과 클 환자에만 처방.

사례: 신약 X 가 전체 평균 으로 사망률 5% 감소. 그러나 유전자 변이 A 환자에 30% 감소, 변이 B 환자에 효과 없음. 변이 검사 후 변이 A 환자에만 처방 — 효율적.

6.3 이유 3: Mechanism — 처치 작용 방식의 단서

Effect modifier 가 처치 메커니즘의 hint. 효과가 특정 group 에서만 나타나면 그 group 의 특성이 메커니즘과 관련.

사례: 항암제가 유전자 변이 환자에만 효과 → 그 유전자 경로 가 약의 작용 mechanism.

7 Surrogate vs Causal Effect Modifier

Hernan 의 미묘한 구분.

7.1 Causal Effect Modifier

\(V\) 자체가 처치 효과의 차이를 만드는 인과 요인.

7.2 Surrogate Effect Modifier

\(V\)그 자체 가 아니라 진짜 인과 요인의 marker.

7.3 사례 (Hernan Ch.4)

국적 (Greek vs Roman) 이 효과 modifier — 그러나 국적 자체 가 인과적 작용은 아님.

진짜 원인: 외과 술기 품질 차이 (Greek 의사가 더 능숙). 국적은 그 marker.

함의: Roman 환자에 Greek 의사 보내면 effect modification 사라짐. Surrogate 의 차이는 근본 인과 를 찾으면 사라질 수 있음.

반사실: 만약 국적 자체 가 인과적 (예: 유전적 약물 대사 차이) 이면 이주해도 modification 유지. Causal effect modifier.

신중한 표현: 일부 학자는 “effect modification by V” 대신 “effect heterogeneity across strata of V” 표현 선호 — 인과적 주장 회피.

8 Effect Modification ≠ Interaction

Hernan 의 결정적 분리.

8.1 차이

개념 Hernan 의 정의
Effect Modification (Ch.4) \(V\)처치 \(A\) 의 효과를 변화시킴. \(V\)처치 아님 — baseline 변수
Interaction (Ch.5) \(A\)\(V\) 둘 다 처치공동 개입 의 효과

8.2 사례

Effect modification: 성별항암제 효과를 변화. 성별은 처치 아님.

Interaction: 항암제 + 방사선공동 효과. 둘 다 처치.

수학적 형태는 비슷 하지만 해석 다름. Interaction 은 둘 다 조작 가능 하므로 공동 처치 디자인 가능. Effect modification 은 baseline 의 자연스러운 차이.

다음 글 (J-HER5 시리즈) 에서 interaction 깊이.

9 Effect in the Treated — Fine Point 4.1

9.1 정의

일반 ATE 가 전체 모집단의 평균 효과 라면, Average effect in the treated (ATT)처치를 받은 사람들에서의 평균 효과.

\[ \text{ATT} = \mathbb{E}[Y^{a=1} | A=1] - \mathbb{E}[Y^{a=0} | A=1] \]

9.2 의미

처치 받은 사람들의 counterfactual그들이 받지 않았다면 무슨 결과 일까. 처치 받은 group 의 baseline 위험 이 그 답.

9.3 Standardized Morbidity Ratio (SMR)

\[ \text{SMR} = \frac{\Pr[Y=1 | A=1]}{\Pr[Y^{a=0}=1 | A=1]} \]

의학에서 흔히 사용. 해당 group 에서의 risk ratio.

9.4 Effect Modification 과의 관계

Treated 와 untreated 의 distribution 이 다르면 ATT ≠ ATE. 처치 군이 평균보다 효과 modifier 비율 다름ATT ≠ ATE.

반사실: 신약을 고위험 환자에 우선 처방 하는 임상 환경. ATT고위험 환자의 평균 효과. ATE (모든 환자 균등) 와 다름. Targeting 정책 평가 에 ATT 적합.

10 챕터의 줄기 — 후속 글 안내

Ch.4 의 후반부 (4.4, 4.5) 와 후속 글:

10.1 후속 글 1 (J-HER4-1) — Heterogeneity + Stratification 깊이

  • 4.1 의 가상 데이터 깊이 분석
  • 4.2 의 stratification 메커니즘 — randomized vs observational
  • Greek/Roman 사례

10.2 후속 글 2 (J-HER4-2) — Why Care + Stratification as Adjustment

  • 4.3 의 transportability·targeting·mechanism 깊이
  • 4.4 의 stratification 이 adjustment 도구로서의 역할
  • Confounding 과의 관계

10.3 후속 글 3 (J-HER4-3) — Matching as Adjustment

  • 4.5 의 matching 으로서의 stratification
  • Propensity score matching 과의 연결
  • IP weighting 과의 비교

이후 J-HER5 시리즈 (4 편) 가 interaction 다룸.

11 Phase J 시리즈에서의 위치

Phase J 는 고급 응용 28 편. 이 글이 첫 글:

  • HER Ch.4 (4 편): Effect Modification ← 현재
  • HER Ch.5 (4 편): Interaction
  • ML HTE (4 편): Meta-learners, Causal Forest, DML
  • DiD (4 편): Difference-in-Differences
  • RDD (4 편): Regression Discontinuity
  • Switchback·Geo (4 편): 시간·지역 무작위
  • Adaptive Trial (4 편): RAR, Platform Trial

Effect Modification 은 이 모든 응용의 기초 개념. HTE 도, DiD 도, switchback 도 모두 처치 효과의 이질성 을 가정.

12 시뮬레이션 — Hernan Table 4.1 재현

import numpy as np
from scipy import stats

np.random.seed(42)

# Hernan Table 4.1 (Ch.4) 재현
# 20 명, 성별 V, counterfactual Y^0, Y^1
data = [
    # (이름, V (1=여성, 0=남성), Y^0, Y^1)
    ("Rheia",     1, 0, 1),
    ("Demeter",   1, 0, 0),
    ("Hestia",    1, 0, 0),
    ("Hera",      1, 0, 0),
    ("Artemis",   1, 1, 1),
    ("Leto",      1, 0, 1),
    ("Athena",    1, 1, 1),
    ("Aphrodite", 1, 0, 1),
    ("Persephone",1, 1, 1),
    ("Hebe",      1, 1, 0),
    ("Kronos",    0, 1, 0),
    ("Hades",     0, 0, 0),
    ("Poseidon",  0, 1, 0),
    ("Zeus",      0, 0, 1),
    ("Apollo",    0, 1, 0),
    ("Ares",      0, 1, 1),
    ("Hephaestus",0, 0, 1),
    ("Polyphemus",0, 0, 1),
    ("Hermes",    0, 1, 0),
    ("Dionysus",  0, 1, 0),
]

V = np.array([d[1] for d in data])
Y0 = np.array([d[2] for d in data])
Y1 = np.array([d[3] for d in data])

# 전체 모집단의 ATE
ate_overall_rd = Y1.mean() - Y0.mean()
ate_overall_rr = Y1.mean() / Y0.mean() if Y0.mean() > 0 else float('inf')

print("[Hernan Table 4.1 — 평균 효과 vs Sub-group 효과]\n")
print(f"전체 (n={len(V)}):")
print(f"  Pr(Y^1=1) = {Y1.mean():.2f}")
print(f"  Pr(Y^0=1) = {Y0.mean():.2f}")
print(f"  Risk Difference (ATE) = {ate_overall_rd:+.2f}")
print(f"  Risk Ratio = {ate_overall_rr:.2f}")
print(f"  → 평균 효과 0 — 처치가 효과 없어 보임\n")

# 여성 (V=1) 의 ATE
women = V == 1
ate_women_rd = Y1[women].mean() - Y0[women].mean()
ate_women_rr = Y1[women].mean() / Y0[women].mean()

print(f"여성 (V=1, n={women.sum()}):")
print(f"  Pr(Y^1=1 | V=1) = {Y1[women].mean():.2f}")
print(f"  Pr(Y^0=1 | V=1) = {Y0[women].mean():.2f}")
print(f"  Risk Difference = {ate_women_rd:+.2f}")
print(f"  Risk Ratio = {ate_women_rr:.2f}")
print(f"  → 처치가 사망 위험을 *증가* (해로움)\n")

# 남성 (V=0) 의 ATE
men = V == 0
ate_men_rd = Y1[men].mean() - Y0[men].mean()
ate_men_rr = Y1[men].mean() / Y0[men].mean()

print(f"남성 (V=0, n={men.sum()}):")
print(f"  Pr(Y^1=1 | V=0) = {Y1[men].mean():.2f}")
print(f"  Pr(Y^0=1 | V=0) = {Y0[men].mean():.2f}")
print(f"  Risk Difference = {ate_men_rd:+.2f}")
print(f"  Risk Ratio = {ate_men_rr:.2f}")
print(f"  → 처치가 사망 위험을 *감소* (이로움)\n")

# Effect modification 확인
print("[Effect Modification by V]")
print(f"  Additive: {ate_women_rd:+.2f} (여성) ≠ {ate_men_rd:+.2f} (남성) → YES")
print(f"  Multiplicative: {ate_women_rr:.2f} (여성) ≠ {ate_men_rr:.2f} (남성) → YES")
print(f"  Qualitative (방향 반대): YES — 여성은 +, 남성은 -")
print()
print("  → 평균 효과 0 의 함정 — 모집단 분포 (50:50) 의 우연한 상쇄")
print("  → 만약 다른 모집단 (예: 80% 여성) 에서는 평균 효과가 *해로움* 으로 나타남")
print("  → Transportability 의 도전")

결과 해석:

  1. 전체 ATE = 0. 처치 효과 없어 보임 — 위험한 결론.
  2. 여성에는 RD = +0.20, 남성에는 RD = -0.20. 정확히 상쇄.
  3. Qualitative effect modification — 두 group 의 효과 방향 반대.
  4. Transportability 위험: 여성 비율 다른 모집단에서 완전히 다른 결론.

13 결론 — Ch.4 개관의 한 줄 요약

평균 처치 효과 0 이 모두에게 효과 0 이 아니다. Effect modification 은 처치 효과의 이질성 을 인정하는 인과 추론의 근본 개념.

핵심 메시지:

  1. 평균의 함정: ATE 0 + sub-group 효과 ≠ 0 가능 (qualitative)
  2. Additive vs Multiplicative: 같은 데이터, 다른 결론. Effect-measure modification
  3. Qualitative vs Non-qualitative: 방향 반대 vs 크기 차이만
  4. Stratification 으로 식별: Randomized + Conditional + Observational
  5. Transportability·Targeting·Mechanism — 3 가지 응용
  6. Surrogate vs Causal modifier: 인과 메커니즘 신중
  7. Effect modification ≠ Interaction: Ch.5 에서 다룸

다음 글에서 4.1, 4.2 의 heterogeneity 와 stratification 식별 깊이.

14 관련 주제

선행 지식

  • (Phase D) Hernan Ch.1~3 — 인과 효과 정의·무작위 실험·관찰 연구
  • (Phase D) Ch.7 — Confounding (effect modifier 와의 차이)

Phase J 후속 글

다른 카테고리 연결

  • (Phase J 후속) ML HTE — Meta-learners, Causal Forest
  • Machine_Learning — Heterogeneous Treatment Effects (placeholder)

15 참고문헌

  • Hernán, M. A. & Robins, J. M. (2020). Causal Inference: What If, Chapter 4. Chapman & Hall/CRC.
  • Hernán, M. A. & VanderWeele, T. J. (2011). Compound treatments and transportability of causal inference. Epidemiology 22, 368-377.
  • Pearl, J. & Bareinboim, E. (2014). External validity: from do-calculus to transportability across populations. Statistical Science 29, 579-595.
  • Dahabreh, I. J. & Hernán, M. A. (2019). Extending inferences from a randomized trial to a target population. Eur. J. Epidemiol. 34, 719-722.
  • Smith, G. C. S. & Pell, J. P. (2003). Parachute use to prevent death and major trauma related to gravitational challenge. BMJ 327, 1459-1461.
  • Miettinen, O. S. (1972). Standardization of risk ratios. Am. J. Epidemiol. 96, 383-388.

Subscribe

Enjoy this blog? Get notified of new posts by email: