1 다양한 Outcome 의 통합
Meta-analysis 의 outcome 은 다양:
| Outcome | 단위 | 사례 |
|---|---|---|
| Log RR / OR | 로그 ratio | 흡연-폐암 |
| Risk Difference (RD) | 비율 차이 | 백신 효과 |
| Mean Difference (MD) | 절대 차이 | 혈압 |
| Standardised Mean Difference (SMD) | 무단위 | 다른 척도 통합 |
| Hazard Ratio (HR) | 시간-사건 ratio | 생존 |
각 outcome 별 통합 수식이 다름.
2 Risk Difference (RD) 통합
\[\text{RD}_i = p_{1i} - p_{0i}\]
\(p_{1i}\) = 처치군 결과 비율, \(p_{0i}\) = 대조군.
분산: \[\text{Var}(\text{RD}_i) = \frac{p_{1i}(1-p_{1i})}{n_{1i}} + \frac{p_{0i}(1-p_{0i})}{n_{0i}}\]
IV 가중 통합.
2.1 RD vs RR — 척도 선택
- 추상 정의: RD 는 절대 효과 (NNT 산출 가능). RR 은 상대 효과.
- 일상어 비유: 백신 효과 — RD 5%p (1000 명 중 50 명 추가 보호) vs RR 0.5 (위험 반감).
- 반사실 시나리오: Baseline 위험 다른 인구에 RR 일정 가정. RD 는 baseline 의존 → heterogeneity 큼.
Cochrane 권장: - RR 이 일정 가정 → RR 우선. - 절대 효과 의사 결정 → RD. - 둘 다 보고가 표준.
3 Mean Difference (MD) 통합
\[\text{MD}_i = \bar{Y}_{1i} - \bar{Y}_{0i}\]
분산: \[\text{Var}(\text{MD}_i) = \frac{s_{1i}^2}{n_{1i}} + \frac{s_{0i}^2}{n_{0i}}\]
(또는 pooled variance).
활용: 같은 단위의 outcome (예: 모든 연구가 mmHg) 통합.
3.1 Pooled vs Unpooled Variance
- Pooled: 두 군의 분산 동등 가정.
- Unpooled (Welch-style): 두 분산 자유.
Cochrane 권장: pooled (대부분 동등 가정).
3 단계 직관:
- 추상 정의: Pooled 가 효율 ↑, unpooled 가 robust.
- 일상어 비유: 두 학교의 분산 비슷 가정 → pooled. 다르면 unpooled.
- 반사실 시나리오: Pooled 가정 위반 시 SE 부정확. F-test 로 분산 동등성 검정.
4 Standardised Mean Difference (SMD)
\[d = \frac{\bar{Y}_{1} - \bar{Y}_{0}}{s_{\text{pooled}}}\]
여기서 \(s_{\text{pooled}}\) = pooled standard deviation.
해석: 효과 크기를 표준편차 단위로 — 무단위.
4.1 활용 — 다른 척도 통합
- 추상 정의: 다른 측정 도구로 측정된 같은 개념 (예: 우울증 척도 BDI vs HAM-D) 의 통합.
- 일상어 비유: 다른 단위 (cm vs inch) 의 통합 — 표준화 후 비교.
- 반사실 시나리오: 단순 평균 차이 비교 시 척도 차이가 결과 왜곡. SMD 가 정직.
해석 (Cohen): - \(|d| < 0.2\): small. - \(0.2 \le |d| < 0.5\): medium. - \(|d| \ge 0.8\): large.
4.2 Hedges’ g — 작은 표본 보정
Cohen’s d 가 작은 표본에서 효과 ↑ 편향.
Hedges’ g: \[g = d \cdot J\]
\(J = 1 - \frac{3}{4(n_1 + n_2) - 9}\) (correction factor).
\(n\) 큼 → \(J \to 1\) → \(g \approx d\).
Cochrane 권장: Hedges’ g.
3 단계 직관:
- 추상 정의: Cohen’s d 의 분포가 작은 표본에서 skew. Hedges 가 보정.
- 일상어 비유: 작은 표본의 평균은 진성보다 ↑ 편향 — 보정 필수.
- 반사실 시나리오: 보정 안 하면 작은 연구의 효과 부풀려짐. Meta 의 결과 왜곡.
5 SMD 의 통합
# 각 연구의 SMD 와 분산
studies = pd.DataFrame({
"n1": [50, 60, 80, 100, 120],
"n0": [50, 55, 75, 95, 115],
"mean1": [10.5, 11.2, 9.8, 12.0, 10.8],
"mean0": [9.5, 9.8, 8.5, 10.5, 9.2],
"sd1": [3.2, 3.5, 2.8, 4.0, 3.6],
"sd0": [3.0, 3.2, 2.5, 3.8, 3.4],
})
# Pooled SD
studies["s_pooled"] = np.sqrt(((studies["n1"] - 1) * studies["sd1"]**2
+ (studies["n0"] - 1) * studies["sd0"]**2)
/ (studies["n1"] + studies["n0"] - 2))
# Cohen's d
studies["d"] = (studies["mean1"] - studies["mean0"]) / studies["s_pooled"]
# Hedges' correction
studies["J"] = 1 - 3 / (4*(studies["n1"] + studies["n0"]) - 9)
studies["g"] = studies["d"] * studies["J"]
# Variance of g
studies["var_g"] = ((studies["n1"] + studies["n0"]) / (studies["n1"] * studies["n0"])
+ studies["g"]**2 / (2 * (studies["n1"] + studies["n0"])))6 Mixed Scale 의 통합 한계
가설: 일부 연구는 RR, 일부는 RD, 일부는 mean difference.
문제: 다른 단위의 통합은 무의미.
해결: 1. 단일 척도로 변환: 모든 연구를 같은 척도로 (예: log OR). 2. 별도 분석: 척도별 별도 통합. 3. Narrative: 통합 부적절 시 서술적 통합.
3 단계 직관:
- 추상 정의: Outcome 단위가 같아야 통합 의미.
- 일상어 비유: 사과와 오렌지 통합 — 단위 통일 또는 별도.
- 반사실 시나리오: 강제 통합은 무의미한 결과 산출 위험.
6.1 Conversion 도구
| 변환 | 도구 |
|---|---|
| OR → RR | Baseline risk 가정 후 변환 |
| RR → RD | Baseline risk 곱 |
| Mean → SMD | Pooled SD 로 표준화 |
| HR → log RR | 시간 가정 (희귀 사건에서 근사) |
- 추상 정의: 각 변환이 추가 가정 (baseline risk, time horizon, SD 분포). 가정 위반 시 부정확.
- 일상어 비유: 환율 변환 — 환율 변동 가정. 시점에 따라 다름.
- 반사실 시나리오: 가능하면 원 척도로 통합. Conversion 은 차선.
7 A/B 테스트의 다양한 Outcome
A/B 테스트의 outcome:
| 메트릭 | 척도 |
|---|---|
| 결제율 | RR or RD |
| 평균 결제액 | MD |
| 클릭 수 | IRR (Poisson) |
| 시간-이탈 | HR |
다중 메트릭 통합 시 각 메트릭 별도 meta-analysis.
3 단계 직관:
- 추상 정의: A/B 의 OEC (Overall Evaluation Criterion) 통합 시 metric 별 정의 명확.
- 일상어 비유: 영화 평가 - 평점 + 매출 + 리뷰 — 각각 별도 평가 후 통합.
- 반사실 시나리오: 강제 단일 metric 통합은 정보 손실. Multi-objective 또는 별도 보고.
8 사례 — Sodium-BP의 RD vs MD
Outcome: 수축기 BP 변화 (mmHg).
MD: \(\hat\mu = -4.2\) mmHg, CI: (-5.5, -3.0).
SMD (Hedges’ g): \(\hat g = -0.30\) (medium effect).
두 결과 동등 의미 — MD 는 임상 단위, SMD 는 무단위 비교.
3 단계 직관:
- 추상 정의: 두 척도 모두 보고 — MD 임상 의사 결정, SMD 효과 크기 평가.
- 일상어 비유: 매출 변화 절대값 + 매출 변화 % — 두 표현이 다른 의사 결정 도구.
- 반사실 시나리오: 한 척도만 보고 시 의사 결정 약함. 다중 보고가 정직.
9 Outcome 변환의 표준 도구
OR → RR (작은 결과 가정): \[\text{RR} \approx \frac{\text{OR}}{(1 - r_0) + r_0 \cdot \text{OR}}\]
여기서 \(r_0\) = baseline risk.
RR → RD: \[\text{RD} = r_0 (\text{RR} - 1)\]
Mean → SMD: \[\text{SMD} = \text{MD} / s_{\text{pooled}}\]
HR → log RR (희귀 사건): \[\log \text{RR} \approx \log \text{HR} \cdot \text{const}\]
- 추상 정의: 각 변환이 추가 가정. 가정 위반 시 부정확.
- 일상어 비유: 환율 변환 — 시점·시장에 따라 변동.
- 반사실 시나리오: 가능하면 원 척도로 통합. Conversion 은 차선.
10 Hedges’ g vs Cohen’s d — 작은 표본
가설: Mean diff = 0.5, pooled SD = 1.0.
Cohen’s d = 0.5. Hedges’ J = \(1 - 3/(4 \cdot 20 - 9) = 0.958\). Hedges’ g = \(0.5 \cdot 0.958 = 0.479\).
차이 4% — 작은 표본에서 의미.
3 단계 직관:
- 추상 정의: Hedges 가 Cohen 의 작은 표본 bias 보정.
- 일상어 비유: 시험 점수의 작은 표본 — 평균 추정의 noise 보정.
- 반사실 시나리오: \(n > 50\) 면 차이 무시 가능. 작은 표본 시 Hedges 표준.
11 SMD 의 해석 — Cohen’s 임계값
| \(|d|\) | Cohen 의 해석 |
|---|---|
| 0.2 | Small |
| 0.5 | Medium |
| 0.8 | Large |
(Cohen, 1988).
- 추상 정의: 임의 임계값 — 분야·맥락 무시.
- 일상어 비유: 시험 점수 차이 5 점 — 작은 차이? 큰 차이? 학년·과목에 따라 다름.
- 반사실 시나리오: 임상 의의 임계값 (MCID, minimal clinically important difference) 이 더 직접.
12 A/B 테스트의 다양한 Outcome
A/B 테스트의 결과 metric:
| Metric | 척도 | 통합 |
|---|---|---|
| Conversion rate | Proportion | RR or RD |
| Revenue per user | Continuous | MD or SMD |
| Click count | Count (Poisson) | IRR |
| Time to conversion | Survival | HR |
3 단계 직관:
- 추상 정의: 각 metric 의 단위가 다름 → 별도 통합.
- 일상어 비유: 회사 평가의 다중 측면 (매출, 고객, 직원, 사회) — 각각 별도.
- 반사실 시나리오: OEC 가 단일 score 시 다른 측면 가림. 다중 통합 + 가중 통합이 정직.
13 결론
Outcome 형태 (RD, MD, SMD, RR, HR) 별 통합 수식이 다름. SMD (Cohen’s d, Hedges’ g) 가 다른 척도 통합 도구. 변환 공식 (OR↔︎RR↔︎RD) 의 가정 점검 필수. Cohen 임계값은 개략 — MCID 가 임상 의의 직접. Cochrane 권장: Hedges’ g + RR + RD 모두 보고.
다음 글 (H-WOO12-5) 에서 heterogeneity 의 source 탐색을 본다.
14 관련 주제
- Heterogeneity
- 1111-11-11, Investigating Heterogeneity