Kwangmin Kim - Interaction — Hernan Ch.5 개관

이 글은 Phase J 시리즈의 5 번째 글이자, Hernan Ch.5 Interaction 시리즈 (4 편) 의 첫 글. Ch.4 의 effect modification 과 비슷해 보이나 결정적으로 다른 개념 — 두 처치의 공동 효과 — 를 다룬다.

1 진입 직관 — “처치가 두 개일 때”

Ch.4 의 effect modification: 처치 1 개 (\(A\)) 의 효과가 baseline 변수 (\(V\)) 에 따라 다름. \(V\) 는 처치 아님 — 그냥 특성.

Ch.5 의 interaction: 처치 2 개 (\(A\), \(E\)) 가 동시 작용. 둘 다 조작 가능.

결정적 차이: 두 변수의 지위 (status). \(V\) 는 baseline, \(E\) 는 처치. 따라서:

Effect Modification: \(\mathbb{E}[Y^{a=1} - Y^{a=0} | V=v]\) — 사용된 counterfactual 은 \(Y^a\) 만

Interaction: \(\mathbb{E}[Y^{a=1, e=1} - Y^{a=0, e=1}]\) vs \(\mathbb{E}[Y^{a=1, e=0} - Y^{a=0, e=0}]\) — counterfactual 은 공동 \(Y^{a, e}\)

비유 — 음식 조합: 고추장 단독, 밥 단독, 고추장 + 밥. 각각의 효과가 서로의 존재에 따라 달라지면 interaction. 간장 알러지가 있는 사람에서 고추장 효과가 다르면 effect modification — 알러지는 처치가 아니다.

2 정의: Joint Intervention 과 Counterfactual \(Y^{a,e}\)

정의: Joint Intervention (Hernan Ch.5)

두 처치 \(A\) 와 \(E\) 를 동시에 조작. 4 가지 가능한 처치 조합:

\(A\)	\(E\)	의미
1	1	둘 다 받음
1	0	\(A\) 만 받음
0	1	\(E\) 만 받음
0	0	둘 다 안 받음

각 환자에 대해 4 개의 counterfactual outcome:

\[ Y^{a=1, e=1}, \quad Y^{a=1, e=0}, \quad Y^{a=0, e=1}, \quad Y^{a=0, e=0} \]

\(Y^{a, e}\) 는 처치 \(A=a\), \(E=e\) 로 강제 개입 시 결과.

2.1 Consistency

\[ Y = Y^{A, E} \]

즉 실제 받은 처치 조합 의 counterfactual 이 관찰된 결과.

수식 직관: 단일 처치 counterfactual \(Y^a\) 의 자연스러운 확장. 4 개 (또는 더 많은) 가능한 처치 시나리오에서 결과를 동시에 상상.

3 Interaction 의 공식 정의

3.1 Additive Interaction

\(A\) 와 \(E\) 사이 additive interaction 존재 ↔︎

\[ \Pr[Y^{a=1, e=1}] - \Pr[Y^{a=0, e=1}] \neq \Pr[Y^{a=1, e=0}] - \Pr[Y^{a=0, e=0}] \]

즉 \(E=1\) 하에서 \(A\) 의 효과 와 \(E=0\) 하에서 \(A\) 의 효과 가 다름.

3.2 등가 표현

위 정의는 대칭 — 다음과 동등:

\[ \Pr[Y^{a=1, e=1}] - \Pr[Y^{a=1, e=0}] \neq \Pr[Y^{a=0, e=1}] - \Pr[Y^{a=0, e=0}] \]

즉 \(A=1\) 하에서 \(E\) 의 효과 와 \(A=0\) 하에서 \(E\) 의 효과 가 다름.

수식 직관: \(A\) 와 \(E\) 의 지위 동등. 어느 처치를 “main effect” 로 보든 interaction 정의 동일.

3.3 Multiplicative Interaction

Risk ratio 에서:

\[ \frac{\Pr[Y^{a=1, e=1}]}{\Pr[Y^{a=0, e=0}]} \neq \frac{\Pr[Y^{a=1, e=0}]}{\Pr[Y^{a=0, e=0}]} \times \frac{\Pr[Y^{a=0, e=1}]}{\Pr[Y^{a=0, e=0}]} \]

즉 결합 효과 가 각 단독 효과의 곱 과 다름.

3.4 Superadditive vs Subadditive

형태	부등식	의미
Superadditive	\(>\)	결합 효과가 합보다 큼 (시너지)
Subadditive	\(<\)	결합 효과가 합보다 작음 (간섭)

사례 — Superadditive: 항생제 단독 효과 +0.1, 백신 단독 효과 +0.1. 둘 다 함께 효과 +0.3. 합 (0.2) 보다 큼 — 시너지.

사례 — Subadditive: 두 진통제 단독 효과 -2 통증, 둘 다 함께 -3 통증 (예상 -4). 합보다 작음 — 한계 효용 감소.

4 Effect Modification vs Interaction — 결정적 분리

4.1 두 차이

측면	Effect Modification	Interaction
변수	\(V\) (baseline characteristic)	\(E\) (처치)
조작 가능성	불가능 (관찰만)	가능 (실험적 조작)
Counterfactual	\(Y^a\) (단일 처치)	\(Y^{a,e}\) (공동 처치)
가정	\(V\) 에 대한 가정 불필요	\(E\) 에 대해 exchangeability·positivity·consistency 필요
목적	Heterogeneity 발견	공동 처치 설계

4.2 Hernan 의 미묘한 통찰

“\(V\) 가 처치 효과의 modifier 라고 해서 \(V\) 에 대해 직접 개입할 수 있다는 것이 아님. 단지 \(V\) 가 다른 stratum 에서 처치 효과가 다름 만 의미. 따라서 \(V\) 의 효과 에 대해서는 어떤 가정도 필요 없음.”

반면 interaction 에서 \(E\) 는 처치 — 조작 가능 + exchangeability 필요. 우리가 \(E\) 의 효과 에 대한 인과 추론을 하려는 것이므로.

4.3 사례 — 동일 데이터, 다른 해석

임상시험에서 항암제 A + 식이 보충 E. 두 경우:

4.3.1 Case 1: E 가 무작위 배정됨 (실험 설계)

\(E\) 는 처치. Interaction 분석 가능 — joint randomization. Effect modification = Interaction (이 경우).

4.3.2 Case 2: E 가 자연 발생 baseline (관찰 변수)

\(E\) 는 처치 아님. Effect modification 만 분석. Interaction 주장 못 함 (causal claim 없음).

4.4 Hernan 의 중요한 문장

“\(V\) 가 \(A\) 의 effect modifier 일 수 있지만 \(V\) 와 \(A\) 의 interaction 은 아닐 수 있음. 왜냐하면 \(V\) 가 진짜 인과 변수 가 아니라 그것의 surrogate 일 수 있기 때문.”

Ch.4 의 Greek/Roman 사례: 국적은 effect modifier. 그러나 진짜 원인은 외과 술기 품질 — 국적의 surrogate. Causal interaction 은 국적 아닌 술기 품질 과의 관계.

5 Identifying Interaction — Ch.5.2

5.1 핵심 요건

두 처치 모두 에 대해 exchangeability·positivity·consistency. 즉 4 가지 처치 조합 (A, E) 에 대한 인과 추론 모두 가능.

5.2 Setting 1: Marginal Randomization of E

\(E\) 가 무작위 배정. 그러면:

\[ \Pr[Y^{a, e=1}] = \Pr[Y^a | E=1] \]

Interaction 정의가 effect modification 정의와 같아짐. 절차 동일.

5.3 Setting 2: Joint Randomization of A and E

두 처치 모두 무작위 배정 — 2 × 2 factorial design. 이상적. 모든 4 cell 에서 exchangeability 자동.

5.4 Setting 3: Observational

둘 다 관찰 변수. Conditional exchangeability 가정 + standardization/IP weighting. 처치를 combined treatment AE (4 levels) 로 보고 단일 처치 분석 적용.

5.5 Setting 4: 일부 처치만 무작위

예: \(A\) 무작위, \(E\) 관찰. \(E\) 에 대한 가정 추가 필요. 더 까다로움.

6 16 가지 Response Types — Ch.5.3

이전 글 (Ch.4-1) 에서 단일 처치의 4 response types (Doomed, Helped, Hurt, Immune). 두 처치 시:

각 환자에 4 counterfactual (\(Y^{a=1,e=1}, Y^{a=1,e=0}, Y^{a=0,e=1}, Y^{a=0,e=0}\)). 각 0/1 → \(2^4 = 16\) 유형.

6.1 일부 유형의 의미

유형	\(Y^{1,1}\)	\(Y^{1,0}\)	\(Y^{0,1}\)	\(Y^{0,0}\)	의미
1	1	1	1	1	Doomed (어느 처치도 무관)
6	1	1	0	0	\(E\) 가 처치 (E=1 시 결과)
11	0	1	0	1	\(A\) 만 영향 — helped by A
16	0	0	0	0	Immune (어느 처치도 결과 없음)

수식 직관: 16 유형 중 일부는 두 처치 시너지, 일부는 무관, 일부는 한 쪽만 영향. Interaction 은 유형의 분포 에서 발생.

6.2 Interaction 의 response type 표현

No interaction 의 경우 : 16 유형 중 일부 제약 (constraint) 이 성립. 즉 16 유형이 모두 가능한 게 아닌 상태.

예 (Hernan): no additive interaction 이면 response type 분포가 일정 식 만족.

7 Sufficient Cause Framework — Ch.5.4

7.1 동기

Counterfactual framework 의 대안 (또는 보완). Sufficient causes 또는 causal pies.

7.2 정의

Sufficient cause: 그것이 발생하면 반드시 결과 야기. 보통 여러 component cause 의 결합.

예: 결핵 발병의 sufficient cause = 결핵균 노출 + 면역 약화 + 유전적 감수성. 이 3 가지가 동시 일 때 발병.

7.3 Component Causes

한 sufficient cause 는 여러 components 로 구성. 각 component 는 그 자체로 충분 안 함.

비유: 원의 조각 (pie slice). 모든 조각이 모여야 완전한 원 (sufficient cause).

7.4 한 결과의 여러 sufficient causes

한 결과 (예: 폐암) 는 여러 sufficient causes 가능:

SC1: 흡연 + 유전 X

SC2: 석면 노출 + 유전 Y

SC3: 방사선 + 면역 약화

한 사람에 어느 SC 라도 완성되면 발병.

8 Sufficient Cause Interaction — Ch.5.5

8.1 정의

두 처치 \(A\) 와 \(E\) 가 같은 sufficient cause 에 모두 component 일 때 sufficient cause interaction 존재.

즉 둘 다 있어야 그 sufficient cause 완성. 둘 중 하나라도 없으면 그 경로로 발병 안 함.

8.2 Counterfactual Interaction 과의 차이

Counterfactual interaction (Ch.5.1) 은 통계적 정의 — risk difference / ratio 의 패턴.

Sufficient cause interaction 은 메커니즘 정의 — 같은 sufficient cause 의 component.

8.3 관계

두 framework 는 부분적 일치. Sufficient cause interaction 이 있으면 대부분 counterfactual interaction 도 있음. 그러나 반대는 항상 성립 안 함.

즉 통계 패턴 (counterfactual interaction) 이 기계론적 인과 (sufficient cause) 를 함의하지 않음.

9 Counterfactuals or Sufficient Causes? — Ch.5.6

9.1 Hernan 의 입장

“두 framework 는 상호 보완적. 같은 현상의 다른 측면.”

Framework	강점
Counterfactual	통계적 분석에 적합. ATE, CATE 추정에 이론적 기반.
Sufficient Cause	인과 메커니즘의 biological intuition. 역학에서 흔함.

9.2 Hernan 의 권고

“Counterfactual framework 우선. Sufficient cause 는 해석 보조. 통계 분석은 counterfactual 로, 메커니즘 논의는 sufficient cause 로.”

본 시리즈도 counterfactual 위주.

10 Phase J 시리즈에서의 위치

이전 글들 (Ch.4 시리즈) 와의 관계:

Glb	주제	처치 변수
J-HER4-*	Effect Modification	단일 처치 \(A\) + baseline \(V\)
J-HER5-*	Interaction	두 처치 \(A\) + \(E\)
J-MLHTE-*	ML 기반 HTE	단일 처치 + 다차원 baseline

Ch.4 와 Ch.5 는 대응되는 두 개념. 표면적 비슷하나 변수의 지위 와 causal claim 이 결정적으로 다름.

11 시뮬레이션 — Joint Intervention 과 Interaction

import numpy as np
from scipy import stats

np.random.seed(42)

# 시나리오: 2x2 factorial randomization
# 두 처치 A (heart transplant), E (vitamins)
n = 4000
A = np.random.choice([0, 1], n, p=[0.5, 0.5])
E = np.random.choice([0, 1], n, p=[0.5, 0.5])

# 진짜 효과: superadditive interaction
# Y^{0,0} = 0.50 baseline
# Y^{1,0} = 0.40 (A 단독 -0.10)
# Y^{0,1} = 0.45 (E 단독 -0.05)
# Y^{1,1} = 0.20 (둘 다 -0.30, 합 -0.15 보다 큼 — superadditive)
true_p = np.where(
    (A == 0) & (E == 0), 0.50,
    np.where(
        (A == 1) & (E == 0), 0.40,
        np.where(
            (A == 0) & (E == 1), 0.45,
            0.20  # A=1, E=1
        )
    )
)
Y = (np.random.random(n) < true_p).astype(int)

# 4 cell 의 risk
print("[2x2 Factorial — Joint Intervention 의 효과]\n")
for a in [0, 1]:
    for e in [0, 1]:
        mask = (A == a) & (E == e)
        risk = Y[mask].mean()
        print(f"  Pr(Y=1 | A={a}, E={e}) = {risk:.3f} (n={mask.sum()})")

# Risk differences
print("\n[Risk Differences]")
p00 = Y[(A==0) & (E==0)].mean()
p10 = Y[(A==1) & (E==0)].mean()
p01 = Y[(A==0) & (E==1)].mean()
p11 = Y[(A==1) & (E==1)].mean()

rd_A_e0 = p10 - p00   # A 효과 (E=0)
rd_A_e1 = p11 - p01   # A 효과 (E=1)
rd_E_a0 = p01 - p00   # E 효과 (A=0)
rd_E_a1 = p11 - p10   # E 효과 (A=1)

print(f"  RD(A | E=0) = {rd_A_e0:+.3f}")
print(f"  RD(A | E=1) = {rd_A_e1:+.3f}")
print(f"  RD(E | A=0) = {rd_E_a0:+.3f}")
print(f"  RD(E | A=1) = {rd_E_a1:+.3f}")

# Additive interaction
print(f"\n[Additive Interaction]")
print(f"  RD(A | E=1) - RD(A | E=0) = {rd_A_e1 - rd_A_e0:+.3f}")
print(f"  RD(E | A=1) - RD(E | A=0) = {rd_E_a1 - rd_E_a0:+.3f}")
print(f"  → 둘 다 같음 (수학적 동등) — interaction 정의의 대칭성 확인")

# Sum of single effects vs joint effect
single_sum = rd_A_e0 + rd_E_a0   # A 단독 + E 단독
joint = p11 - p00                 # 둘 다 결합 효과
print(f"\n[합 vs 결합 효과]")
print(f"  단독 효과 합: {single_sum:+.3f}")
print(f"  결합 효과: {joint:+.3f}")
print(f"  차이 (Interaction): {joint - single_sum:+.3f}")
print(f"  → Superadditive: 결합 효과가 합보다 *큰 음*")

결과 해석:

4 cell 의 risk 가 진짜 값과 비슷. Joint intervention 의 4 가지 결과 직접 측정.

RD(A | E=1) ≠ RD(A | E=0) — interaction 존재.

대칭성 확인: A 의 modifier as E = E 의 modifier as A — 수학적으로 동등.

Superadditive: 결합 효과 (-0.30) 가 단독 합 (-0.15) 보다 큰 효과.

12 결론 — Ch.5 개관의 한 줄 요약

Interaction 은 두 처치의 공동 효과. Effect modification 과 표면적 비슷하나 변수의 지위 (처치 vs baseline) 가 결정적 차이. Joint intervention 의 counterfactual \(Y^{a,e}\) 가 핵심.

핵심 메시지:

Joint intervention: 4 가지 처치 조합의 counterfactual
공식 정의: Additive + Multiplicative interaction
Effect modification 과의 차이: V (baseline) vs E (처치). Causal status.
16 response types: 단일 처치 4 → 공동 처치 16
Sufficient cause framework: 메커니즘 관점, counterfactual 의 보완
Hernan 의 권고: Counterfactual 우선, sufficient cause 보조

후속 3 글에서 5.1 + 5.2 깊이, 5.3 + 5.4 (response types + sufficient causes), 5.5 + 5.6 (sufficient cause interaction) 다룬다.

13 관련 주제

선행 지식

Effect Modification — Ch.4 시리즈
(Phase D) Hernan Ch.1~3 — Counterfactual framework

Phase J 후속 글

Joint Intervention 과 Identifying Interaction (5.1+5.2) (placeholder)
Counterfactual Response Types + Sufficient Causes (5.3+5.4) (placeholder)
Sufficient Cause Interaction (5.5+5.6) (placeholder)

14 참고문헌

Hernán, M. A. & Robins, J. M. (2020). Causal Inference: What If, Chapter 5. Chapman & Hall/CRC.
VanderWeele, T. J. (2009). On the distinction between interaction and effect modification. Epidemiology 20, 863-871.
VanderWeele, T. J. (2015). Explanation in Causal Inference: Methods for Mediation and Interaction. Oxford University Press.
Rothman, K. J. (1976). Causes. Am. J. Epidemiol. 104, 587-592. (Sufficient cause framework)
Greenland, S., Pearl, J., Robins, J. M. (1999). Causal diagrams for epidemiologic research. Epidemiology 10, 37-48.