이 글은 Phase J 시리즈의 5 번째 글이자, Hernan Ch.5 Interaction 시리즈 (4 편) 의 첫 글. Ch.4 의 effect modification 과 비슷해 보이나 결정적으로 다른 개념 — 두 처치의 공동 효과 — 를 다룬다.
1 진입 직관 — “처치가 두 개일 때”
Ch.4 의 effect modification: 처치 1 개 (\(A\)) 의 효과가 baseline 변수 (\(V\)) 에 따라 다름. \(V\) 는 처치 아님 — 그냥 특성.
Ch.5 의 interaction: 처치 2 개 (\(A\), \(E\)) 가 동시 작용. 둘 다 조작 가능.
결정적 차이: 두 변수의 지위 (status). \(V\) 는 baseline, \(E\) 는 처치. 따라서:
- Effect Modification: \(\mathbb{E}[Y^{a=1} - Y^{a=0} | V=v]\) — 사용된 counterfactual 은 \(Y^a\) 만
- Interaction: \(\mathbb{E}[Y^{a=1, e=1} - Y^{a=0, e=1}]\) vs \(\mathbb{E}[Y^{a=1, e=0} - Y^{a=0, e=0}]\) — counterfactual 은 공동 \(Y^{a, e}\)
비유 — 음식 조합: 고추장 단독, 밥 단독, 고추장 + 밥. 각각의 효과가 서로의 존재에 따라 달라지면 interaction. 간장 알러지가 있는 사람에서 고추장 효과가 다르면 effect modification — 알러지는 처치가 아니다.
2 정의: Joint Intervention 과 Counterfactual \(Y^{a,e}\)
두 처치 \(A\) 와 \(E\) 를 동시에 조작. 4 가지 가능한 처치 조합:
| \(A\) | \(E\) | 의미 |
|---|---|---|
| 1 | 1 | 둘 다 받음 |
| 1 | 0 | \(A\) 만 받음 |
| 0 | 1 | \(E\) 만 받음 |
| 0 | 0 | 둘 다 안 받음 |
각 환자에 대해 4 개의 counterfactual outcome:
\[ Y^{a=1, e=1}, \quad Y^{a=1, e=0}, \quad Y^{a=0, e=1}, \quad Y^{a=0, e=0} \]
\(Y^{a, e}\) 는 처치 \(A=a\), \(E=e\) 로 강제 개입 시 결과.
2.1 Consistency
\[ Y = Y^{A, E} \]
즉 실제 받은 처치 조합 의 counterfactual 이 관찰된 결과.
수식 직관: 단일 처치 counterfactual \(Y^a\) 의 자연스러운 확장. 4 개 (또는 더 많은) 가능한 처치 시나리오에서 결과를 동시에 상상.
3 Interaction 의 공식 정의
3.1 Additive Interaction
\(A\) 와 \(E\) 사이 additive interaction 존재 ↔︎
\[ \Pr[Y^{a=1, e=1}] - \Pr[Y^{a=0, e=1}] \neq \Pr[Y^{a=1, e=0}] - \Pr[Y^{a=0, e=0}] \]
즉 \(E=1\) 하에서 \(A\) 의 효과 와 \(E=0\) 하에서 \(A\) 의 효과 가 다름.
3.2 등가 표현
위 정의는 대칭 — 다음과 동등:
\[ \Pr[Y^{a=1, e=1}] - \Pr[Y^{a=1, e=0}] \neq \Pr[Y^{a=0, e=1}] - \Pr[Y^{a=0, e=0}] \]
즉 \(A=1\) 하에서 \(E\) 의 효과 와 \(A=0\) 하에서 \(E\) 의 효과 가 다름.
수식 직관: \(A\) 와 \(E\) 의 지위 동등. 어느 처치를 “main effect” 로 보든 interaction 정의 동일.
3.3 Multiplicative Interaction
Risk ratio 에서:
\[ \frac{\Pr[Y^{a=1, e=1}]}{\Pr[Y^{a=0, e=0}]} \neq \frac{\Pr[Y^{a=1, e=0}]}{\Pr[Y^{a=0, e=0}]} \times \frac{\Pr[Y^{a=0, e=1}]}{\Pr[Y^{a=0, e=0}]} \]
즉 결합 효과 가 각 단독 효과의 곱 과 다름.
3.4 Superadditive vs Subadditive
| 형태 | 부등식 | 의미 |
|---|---|---|
| Superadditive | \(>\) | 결합 효과가 합보다 큼 (시너지) |
| Subadditive | \(<\) | 결합 효과가 합보다 작음 (간섭) |
사례 — Superadditive: 항생제 단독 효과 +0.1, 백신 단독 효과 +0.1. 둘 다 함께 효과 +0.3. 합 (0.2) 보다 큼 — 시너지.
사례 — Subadditive: 두 진통제 단독 효과 -2 통증, 둘 다 함께 -3 통증 (예상 -4). 합보다 작음 — 한계 효용 감소.
4 Effect Modification vs Interaction — 결정적 분리
4.1 두 차이
| 측면 | Effect Modification | Interaction |
|---|---|---|
| 변수 | \(V\) (baseline characteristic) | \(E\) (처치) |
| 조작 가능성 | 불가능 (관찰만) | 가능 (실험적 조작) |
| Counterfactual | \(Y^a\) (단일 처치) | \(Y^{a,e}\) (공동 처치) |
| 가정 | \(V\) 에 대한 가정 불필요 | \(E\) 에 대해 exchangeability·positivity·consistency 필요 |
| 목적 | Heterogeneity 발견 | 공동 처치 설계 |
4.2 Hernan 의 미묘한 통찰
“\(V\) 가 처치 효과의 modifier 라고 해서 \(V\) 에 대해 직접 개입할 수 있다는 것이 아님. 단지 \(V\) 가 다른 stratum 에서 처치 효과가 다름 만 의미. 따라서 \(V\) 의 효과 에 대해서는 어떤 가정도 필요 없음.”
반면 interaction 에서 \(E\) 는 처치 — 조작 가능 + exchangeability 필요. 우리가 \(E\) 의 효과 에 대한 인과 추론을 하려는 것이므로.
4.3 사례 — 동일 데이터, 다른 해석
임상시험에서 항암제 A + 식이 보충 E. 두 경우:
4.3.1 Case 1: E 가 무작위 배정됨 (실험 설계)
\(E\) 는 처치. Interaction 분석 가능 — joint randomization. Effect modification = Interaction (이 경우).
4.3.2 Case 2: E 가 자연 발생 baseline (관찰 변수)
\(E\) 는 처치 아님. Effect modification 만 분석. Interaction 주장 못 함 (causal claim 없음).
4.4 Hernan 의 중요한 문장
“\(V\) 가 \(A\) 의 effect modifier 일 수 있지만 \(V\) 와 \(A\) 의 interaction 은 아닐 수 있음. 왜냐하면 \(V\) 가 진짜 인과 변수 가 아니라 그것의 surrogate 일 수 있기 때문.”
Ch.4 의 Greek/Roman 사례: 국적은 effect modifier. 그러나 진짜 원인은 외과 술기 품질 — 국적의 surrogate. Causal interaction 은 국적 아닌 술기 품질 과의 관계.
5 Identifying Interaction — Ch.5.2
5.1 핵심 요건
두 처치 모두 에 대해 exchangeability·positivity·consistency. 즉 4 가지 처치 조합 (A, E) 에 대한 인과 추론 모두 가능.
5.2 Setting 1: Marginal Randomization of E
\(E\) 가 무작위 배정. 그러면:
\[ \Pr[Y^{a, e=1}] = \Pr[Y^a | E=1] \]
Interaction 정의가 effect modification 정의와 같아짐. 절차 동일.
5.3 Setting 2: Joint Randomization of A and E
두 처치 모두 무작위 배정 — 2 × 2 factorial design. 이상적. 모든 4 cell 에서 exchangeability 자동.
5.4 Setting 3: Observational
둘 다 관찰 변수. Conditional exchangeability 가정 + standardization/IP weighting. 처치를 combined treatment AE (4 levels) 로 보고 단일 처치 분석 적용.
5.5 Setting 4: 일부 처치만 무작위
예: \(A\) 무작위, \(E\) 관찰. \(E\) 에 대한 가정 추가 필요. 더 까다로움.
6 16 가지 Response Types — Ch.5.3
이전 글 (Ch.4-1) 에서 단일 처치의 4 response types (Doomed, Helped, Hurt, Immune). 두 처치 시:
각 환자에 4 counterfactual (\(Y^{a=1,e=1}, Y^{a=1,e=0}, Y^{a=0,e=1}, Y^{a=0,e=0}\)). 각 0/1 → \(2^4 = 16\) 유형.
6.1 일부 유형의 의미
| 유형 | \(Y^{1,1}\) | \(Y^{1,0}\) | \(Y^{0,1}\) | \(Y^{0,0}\) | 의미 |
|---|---|---|---|---|---|
| 1 | 1 | 1 | 1 | 1 | Doomed (어느 처치도 무관) |
| 6 | 1 | 1 | 0 | 0 | \(E\) 가 처치 (E=1 시 결과) |
| 11 | 0 | 1 | 0 | 1 | \(A\) 만 영향 — helped by A |
| 16 | 0 | 0 | 0 | 0 | Immune (어느 처치도 결과 없음) |
수식 직관: 16 유형 중 일부는 두 처치 시너지, 일부는 무관, 일부는 한 쪽만 영향. Interaction 은 유형의 분포 에서 발생.
6.2 Interaction 의 response type 표현
No interaction 의 경우 : 16 유형 중 일부 제약 (constraint) 이 성립. 즉 16 유형이 모두 가능한 게 아닌 상태.
예 (Hernan): no additive interaction 이면 response type 분포가 일정 식 만족.
7 Sufficient Cause Framework — Ch.5.4
7.1 동기
Counterfactual framework 의 대안 (또는 보완). Sufficient causes 또는 causal pies.
7.2 정의
Sufficient cause: 그것이 발생하면 반드시 결과 야기. 보통 여러 component cause 의 결합.
예: 결핵 발병의 sufficient cause = 결핵균 노출 + 면역 약화 + 유전적 감수성. 이 3 가지가 동시 일 때 발병.
7.3 Component Causes
한 sufficient cause 는 여러 components 로 구성. 각 component 는 그 자체로 충분 안 함.
비유: 원의 조각 (pie slice). 모든 조각이 모여야 완전한 원 (sufficient cause).
7.4 한 결과의 여러 sufficient causes
한 결과 (예: 폐암) 는 여러 sufficient causes 가능:
- SC1: 흡연 + 유전 X
- SC2: 석면 노출 + 유전 Y
- SC3: 방사선 + 면역 약화
한 사람에 어느 SC 라도 완성되면 발병.
8 Sufficient Cause Interaction — Ch.5.5
8.1 정의
두 처치 \(A\) 와 \(E\) 가 같은 sufficient cause 에 모두 component 일 때 sufficient cause interaction 존재.
즉 둘 다 있어야 그 sufficient cause 완성. 둘 중 하나라도 없으면 그 경로로 발병 안 함.
8.2 Counterfactual Interaction 과의 차이
Counterfactual interaction (Ch.5.1) 은 통계적 정의 — risk difference / ratio 의 패턴.
Sufficient cause interaction 은 메커니즘 정의 — 같은 sufficient cause 의 component.
8.3 관계
두 framework 는 부분적 일치. Sufficient cause interaction 이 있으면 대부분 counterfactual interaction 도 있음. 그러나 반대는 항상 성립 안 함.
즉 통계 패턴 (counterfactual interaction) 이 기계론적 인과 (sufficient cause) 를 함의하지 않음.
9 Counterfactuals or Sufficient Causes? — Ch.5.6
9.1 Hernan 의 입장
“두 framework 는 상호 보완적. 같은 현상의 다른 측면.”
| Framework | 강점 |
|---|---|
| Counterfactual | 통계적 분석에 적합. ATE, CATE 추정에 이론적 기반. |
| Sufficient Cause | 인과 메커니즘의 biological intuition. 역학에서 흔함. |
9.2 Hernan 의 권고
“Counterfactual framework 우선. Sufficient cause 는 해석 보조. 통계 분석은 counterfactual 로, 메커니즘 논의는 sufficient cause 로.”
본 시리즈도 counterfactual 위주.
10 Phase J 시리즈에서의 위치
이전 글들 (Ch.4 시리즈) 와의 관계:
| Glb | 주제 | 처치 변수 |
|---|---|---|
| J-HER4-* | Effect Modification | 단일 처치 \(A\) + baseline \(V\) |
| J-HER5-* | Interaction | 두 처치 \(A\) + \(E\) |
| J-MLHTE-* | ML 기반 HTE | 단일 처치 + 다차원 baseline |
Ch.4 와 Ch.5 는 대응되는 두 개념. 표면적 비슷하나 변수의 지위 와 causal claim 이 결정적으로 다름.
11 시뮬레이션 — Joint Intervention 과 Interaction
import numpy as np
from scipy import stats
np.random.seed(42)
# 시나리오: 2x2 factorial randomization
# 두 처치 A (heart transplant), E (vitamins)
n = 4000
A = np.random.choice([0, 1], n, p=[0.5, 0.5])
E = np.random.choice([0, 1], n, p=[0.5, 0.5])
# 진짜 효과: superadditive interaction
# Y^{0,0} = 0.50 baseline
# Y^{1,0} = 0.40 (A 단독 -0.10)
# Y^{0,1} = 0.45 (E 단독 -0.05)
# Y^{1,1} = 0.20 (둘 다 -0.30, 합 -0.15 보다 큼 — superadditive)
true_p = np.where(
(A == 0) & (E == 0), 0.50,
np.where(
(A == 1) & (E == 0), 0.40,
np.where(
(A == 0) & (E == 1), 0.45,
0.20 # A=1, E=1
)
)
)
Y = (np.random.random(n) < true_p).astype(int)
# 4 cell 의 risk
print("[2x2 Factorial — Joint Intervention 의 효과]\n")
for a in [0, 1]:
for e in [0, 1]:
mask = (A == a) & (E == e)
risk = Y[mask].mean()
print(f" Pr(Y=1 | A={a}, E={e}) = {risk:.3f} (n={mask.sum()})")
# Risk differences
print("\n[Risk Differences]")
p00 = Y[(A==0) & (E==0)].mean()
p10 = Y[(A==1) & (E==0)].mean()
p01 = Y[(A==0) & (E==1)].mean()
p11 = Y[(A==1) & (E==1)].mean()
rd_A_e0 = p10 - p00 # A 효과 (E=0)
rd_A_e1 = p11 - p01 # A 효과 (E=1)
rd_E_a0 = p01 - p00 # E 효과 (A=0)
rd_E_a1 = p11 - p10 # E 효과 (A=1)
print(f" RD(A | E=0) = {rd_A_e0:+.3f}")
print(f" RD(A | E=1) = {rd_A_e1:+.3f}")
print(f" RD(E | A=0) = {rd_E_a0:+.3f}")
print(f" RD(E | A=1) = {rd_E_a1:+.3f}")
# Additive interaction
print(f"\n[Additive Interaction]")
print(f" RD(A | E=1) - RD(A | E=0) = {rd_A_e1 - rd_A_e0:+.3f}")
print(f" RD(E | A=1) - RD(E | A=0) = {rd_E_a1 - rd_E_a0:+.3f}")
print(f" → 둘 다 같음 (수학적 동등) — interaction 정의의 대칭성 확인")
# Sum of single effects vs joint effect
single_sum = rd_A_e0 + rd_E_a0 # A 단독 + E 단독
joint = p11 - p00 # 둘 다 결합 효과
print(f"\n[합 vs 결합 효과]")
print(f" 단독 효과 합: {single_sum:+.3f}")
print(f" 결합 효과: {joint:+.3f}")
print(f" 차이 (Interaction): {joint - single_sum:+.3f}")
print(f" → Superadditive: 결합 효과가 합보다 *큰 음*")결과 해석:
- 4 cell 의 risk 가 진짜 값과 비슷. Joint intervention 의 4 가지 결과 직접 측정.
- RD(A | E=1) ≠ RD(A | E=0) — interaction 존재.
- 대칭성 확인: A 의 modifier as E = E 의 modifier as A — 수학적으로 동등.
- Superadditive: 결합 효과 (-0.30) 가 단독 합 (-0.15) 보다 큰 효과.
12 결론 — Ch.5 개관의 한 줄 요약
Interaction 은 두 처치의 공동 효과. Effect modification 과 표면적 비슷하나 변수의 지위 (처치 vs baseline) 가 결정적 차이. Joint intervention 의 counterfactual \(Y^{a,e}\) 가 핵심.
핵심 메시지:
- Joint intervention: 4 가지 처치 조합의 counterfactual
- 공식 정의: Additive + Multiplicative interaction
- Effect modification 과의 차이: V (baseline) vs E (처치). Causal status.
- 16 response types: 단일 처치 4 → 공동 처치 16
- Sufficient cause framework: 메커니즘 관점, counterfactual 의 보완
- Hernan 의 권고: Counterfactual 우선, sufficient cause 보조
후속 3 글에서 5.1 + 5.2 깊이, 5.3 + 5.4 (response types + sufficient causes), 5.5 + 5.6 (sufficient cause interaction) 다룬다.
13 관련 주제
선행 지식
- Effect Modification — Ch.4 시리즈
- (Phase D) Hernan Ch.1~3 — Counterfactual framework
Phase J 후속 글
- Joint Intervention 과 Identifying Interaction (5.1+5.2) (placeholder)
- Counterfactual Response Types + Sufficient Causes (5.3+5.4) (placeholder)
- Sufficient Cause Interaction (5.5+5.6) (placeholder)
14 참고문헌
- Hernán, M. A. & Robins, J. M. (2020). Causal Inference: What If, Chapter 5. Chapman & Hall/CRC.
- VanderWeele, T. J. (2009). On the distinction between interaction and effect modification. Epidemiology 20, 863-871.
- VanderWeele, T. J. (2015). Explanation in Causal Inference: Methods for Mediation and Interaction. Oxford University Press.
- Rothman, K. J. (1976). Causes. Am. J. Epidemiol. 104, 587-592. (Sufficient cause framework)
- Greenland, S., Pearl, J., Robins, J. M. (1999). Causal diagrams for epidemiologic research. Epidemiology 10, 37-48.