다양한 Outcome 의 통합 — RD·Mean·Mixed

Woodward Ch.12.3.5 — Pooling Risk Differences·Means·Mixed

Meta-analysis 의 다양한 outcome 형태 — Risk Difference (RD), Mean Difference (MD), Standardised Mean Difference (SMD), 그리고 mixed scale (RR + RD + Mean) 의 통합 절차를 추상 → 일상어 → 반사실 3 단계 직관으로 풀어낸다. Cohen’s d, Hedges’ g 의 차이와 작은 표본 보정도 다룬다.

Experimentation
Modeling
저자

Kwangmin Kim

공개

2026년 05월 08일

1 다양한 Outcome 의 통합

정의: Outcome 형태

Meta-analysis 의 outcome 은 다양:

Outcome 단위 사례
Log RR / OR 로그 ratio 흡연-폐암
Risk Difference (RD) 비율 차이 백신 효과
Mean Difference (MD) 절대 차이 혈압
Standardised Mean Difference (SMD) 무단위 다른 척도 통합
Hazard Ratio (HR) 시간-사건 ratio 생존

각 outcome 별 통합 수식이 다름.

2 Risk Difference (RD) 통합

정의: RD

\[\text{RD}_i = p_{1i} - p_{0i}\]

\(p_{1i}\) = 처치군 결과 비율, \(p_{0i}\) = 대조군.

분산: \[\text{Var}(\text{RD}_i) = \frac{p_{1i}(1-p_{1i})}{n_{1i}} + \frac{p_{0i}(1-p_{0i})}{n_{0i}}\]

IV 가중 통합.

2.1 RD vs RR — 척도 선택

직관 3 단계: RD vs RR 의 활용
  • 추상 정의: RD 는 절대 효과 (NNT 산출 가능). RR 은 상대 효과.
  • 일상어 비유: 백신 효과 — RD 5%p (1000 명 중 50 명 추가 보호) vs RR 0.5 (위험 반감).
  • 반사실 시나리오: Baseline 위험 다른 인구에 RR 일정 가정. RD 는 baseline 의존 → heterogeneity 큼.

Cochrane 권장: - RR 이 일정 가정 → RR 우선. - 절대 효과 의사 결정 → RD. - 둘 다 보고가 표준.

3 Mean Difference (MD) 통합

정의: MD

\[\text{MD}_i = \bar{Y}_{1i} - \bar{Y}_{0i}\]

분산: \[\text{Var}(\text{MD}_i) = \frac{s_{1i}^2}{n_{1i}} + \frac{s_{0i}^2}{n_{0i}}\]

(또는 pooled variance).

활용: 같은 단위의 outcome (예: 모든 연구가 mmHg) 통합.

3.1 Pooled vs Unpooled Variance

직관: 두 분산의 차이
  • Pooled: 두 군의 분산 동등 가정.
  • Unpooled (Welch-style): 두 분산 자유.

Cochrane 권장: pooled (대부분 동등 가정).

3 단계 직관:

  • 추상 정의: Pooled 가 효율 ↑, unpooled 가 robust.
  • 일상어 비유: 두 학교의 분산 비슷 가정 → pooled. 다르면 unpooled.
  • 반사실 시나리오: Pooled 가정 위반 시 SE 부정확. F-test 로 분산 동등성 검정.

4 Standardised Mean Difference (SMD)

정의: SMD (Cohen’s d)

\[d = \frac{\bar{Y}_{1} - \bar{Y}_{0}}{s_{\text{pooled}}}\]

여기서 \(s_{\text{pooled}}\) = pooled standard deviation.

해석: 효과 크기를 표준편차 단위로 — 무단위.

4.1 활용 — 다른 척도 통합

직관 3 단계: SMD 의 가치
  • 추상 정의: 다른 측정 도구로 측정된 같은 개념 (예: 우울증 척도 BDI vs HAM-D) 의 통합.
  • 일상어 비유: 다른 단위 (cm vs inch) 의 통합 — 표준화 후 비교.
  • 반사실 시나리오: 단순 평균 차이 비교 시 척도 차이가 결과 왜곡. SMD 가 정직.

해석 (Cohen): - \(|d| < 0.2\): small. - \(0.2 \le |d| < 0.5\): medium. - \(|d| \ge 0.8\): large.

4.2 Hedges’ g — 작은 표본 보정

가정 위반: Cohen’s d 의 작은 표본 bias

Cohen’s d 가 작은 표본에서 효과 ↑ 편향.

Hedges’ g: \[g = d \cdot J\]

\(J = 1 - \frac{3}{4(n_1 + n_2) - 9}\) (correction factor).

\(n\) 큼 → \(J \to 1\)\(g \approx d\).

Cochrane 권장: Hedges’ g.

3 단계 직관:

  • 추상 정의: Cohen’s d 의 분포가 작은 표본에서 skew. Hedges 가 보정.
  • 일상어 비유: 작은 표본의 평균은 진성보다 ↑ 편향 — 보정 필수.
  • 반사실 시나리오: 보정 안 하면 작은 연구의 효과 부풀려짐. Meta 의 결과 왜곡.

5 SMD 의 통합

# 각 연구의 SMD 와 분산
studies = pd.DataFrame({
    "n1": [50, 60, 80, 100, 120],
    "n0": [50, 55, 75, 95, 115],
    "mean1": [10.5, 11.2, 9.8, 12.0, 10.8],
    "mean0": [9.5, 9.8, 8.5, 10.5, 9.2],
    "sd1": [3.2, 3.5, 2.8, 4.0, 3.6],
    "sd0": [3.0, 3.2, 2.5, 3.8, 3.4],
})

# Pooled SD
studies["s_pooled"] = np.sqrt(((studies["n1"] - 1) * studies["sd1"]**2
                                + (studies["n0"] - 1) * studies["sd0"]**2)
                               / (studies["n1"] + studies["n0"] - 2))

# Cohen's d
studies["d"] = (studies["mean1"] - studies["mean0"]) / studies["s_pooled"]

# Hedges' correction
studies["J"] = 1 - 3 / (4*(studies["n1"] + studies["n0"]) - 9)
studies["g"] = studies["d"] * studies["J"]

# Variance of g
studies["var_g"] = ((studies["n1"] + studies["n0"]) / (studies["n1"] * studies["n0"])
                    + studies["g"]**2 / (2 * (studies["n1"] + studies["n0"])))

6 Mixed Scale 의 통합 한계

가정 위반: 다른 outcome 의 강제 통합

가설: 일부 연구는 RR, 일부는 RD, 일부는 mean difference.

문제: 다른 단위의 통합은 무의미.

해결: 1. 단일 척도로 변환: 모든 연구를 같은 척도로 (예: log OR). 2. 별도 분석: 척도별 별도 통합. 3. Narrative: 통합 부적절 시 서술적 통합.

3 단계 직관:

  • 추상 정의: Outcome 단위가 같아야 통합 의미.
  • 일상어 비유: 사과와 오렌지 통합 — 단위 통일 또는 별도.
  • 반사실 시나리오: 강제 통합은 무의미한 결과 산출 위험.

6.1 Conversion 도구

변환 도구
OR → RR Baseline risk 가정 후 변환
RR → RD Baseline risk 곱
Mean → SMD Pooled SD 로 표준화
HR → log RR 시간 가정 (희귀 사건에서 근사)
직관: Conversion 의 위험
  • 추상 정의: 각 변환이 추가 가정 (baseline risk, time horizon, SD 분포). 가정 위반 시 부정확.
  • 일상어 비유: 환율 변환 — 환율 변동 가정. 시점에 따라 다름.
  • 반사실 시나리오: 가능하면 원 척도로 통합. Conversion 은 차선.

7 A/B 테스트의 다양한 Outcome

사례: A/B 의 lift 통합

A/B 테스트의 outcome:

메트릭 척도
결제율 RR or RD
평균 결제액 MD
클릭 수 IRR (Poisson)
시간-이탈 HR

다중 메트릭 통합 시 각 메트릭 별도 meta-analysis.

3 단계 직관:

  • 추상 정의: A/B 의 OEC (Overall Evaluation Criterion) 통합 시 metric 별 정의 명확.
  • 일상어 비유: 영화 평가 - 평점 + 매출 + 리뷰 — 각각 별도 평가 후 통합.
  • 반사실 시나리오: 강제 단일 metric 통합은 정보 손실. Multi-objective 또는 별도 보고.

8 사례 — Sodium-BP의 RD vs MD

사례: 28 RCT 의 통합

Outcome: 수축기 BP 변화 (mmHg).

MD: \(\hat\mu = -4.2\) mmHg, CI: (-5.5, -3.0).

SMD (Hedges’ g): \(\hat g = -0.30\) (medium effect).

두 결과 동등 의미 — MD 는 임상 단위, SMD 는 무단위 비교.

3 단계 직관:

  • 추상 정의: 두 척도 모두 보고 — MD 임상 의사 결정, SMD 효과 크기 평가.
  • 일상어 비유: 매출 변화 절대값 + 매출 변화 % — 두 표현이 다른 의사 결정 도구.
  • 반사실 시나리오: 한 척도만 보고 시 의사 결정 약함. 다중 보고가 정직.

9 Outcome 변환의 표준 도구

정의: 변환 공식

OR → RR (작은 결과 가정): \[\text{RR} \approx \frac{\text{OR}}{(1 - r_0) + r_0 \cdot \text{OR}}\]

여기서 \(r_0\) = baseline risk.

RR → RD: \[\text{RD} = r_0 (\text{RR} - 1)\]

Mean → SMD: \[\text{SMD} = \text{MD} / s_{\text{pooled}}\]

HR → log RR (희귀 사건): \[\log \text{RR} \approx \log \text{HR} \cdot \text{const}\]

직관 3 단계: 변환의 한계
  • 추상 정의: 각 변환이 추가 가정. 가정 위반 시 부정확.
  • 일상어 비유: 환율 변환 — 시점·시장에 따라 변동.
  • 반사실 시나리오: 가능하면 원 척도로 통합. Conversion 은 차선.

10 Hedges’ g vs Cohen’s d — 작은 표본

사례: \(n_1 = n_0 = 10\) 일 때

가설: Mean diff = 0.5, pooled SD = 1.0.

Cohen’s d = 0.5. Hedges’ J = \(1 - 3/(4 \cdot 20 - 9) = 0.958\). Hedges’ g = \(0.5 \cdot 0.958 = 0.479\).

차이 4% — 작은 표본에서 의미.

3 단계 직관:

  • 추상 정의: Hedges 가 Cohen 의 작은 표본 bias 보정.
  • 일상어 비유: 시험 점수의 작은 표본 — 평균 추정의 noise 보정.
  • 반사실 시나리오: \(n > 50\) 면 차이 무시 가능. 작은 표본 시 Hedges 표준.

11 SMD 의 해석 — Cohen’s 임계값

정의: Effect Size 임계값
\(|d|\) Cohen 의 해석
0.2 Small
0.5 Medium
0.8 Large

(Cohen, 1988).

직관 3 단계: 임계값의 한계
  • 추상 정의: 임의 임계값 — 분야·맥락 무시.
  • 일상어 비유: 시험 점수 차이 5 점 — 작은 차이? 큰 차이? 학년·과목에 따라 다름.
  • 반사실 시나리오: 임상 의의 임계값 (MCID, minimal clinically important difference) 이 더 직접.

12 A/B 테스트의 다양한 Outcome

사례: A/B 의 OEC

A/B 테스트의 결과 metric:

Metric 척도 통합
Conversion rate Proportion RR or RD
Revenue per user Continuous MD or SMD
Click count Count (Poisson) IRR
Time to conversion Survival HR

3 단계 직관:

  • 추상 정의: 각 metric 의 단위가 다름 → 별도 통합.
  • 일상어 비유: 회사 평가의 다중 측면 (매출, 고객, 직원, 사회) — 각각 별도.
  • 반사실 시나리오: OEC 가 단일 score 시 다른 측면 가림. 다중 통합 + 가중 통합이 정직.

13 결론

Outcome 형태 (RD, MD, SMD, RR, HR) 별 통합 수식이 다름. SMD (Cohen’s d, Hedges’ g) 가 다른 척도 통합 도구. 변환 공식 (OR↔︎RR↔︎RD) 의 가정 점검 필수. Cohen 임계값은 개략 — MCID 가 임상 의의 직접. Cochrane 권장: Hedges’ g + RR + RD 모두 보고.

다음 글 (H-WOO12-5) 에서 heterogeneity 의 source 탐색을 본다.

14 관련 주제

Subscribe

Enjoy this blog? Get notified of new posts by email: