1 왜 Meta-analysis 인가
여러 독립 연구의 결과를 통계적으로 통합 하는 분석. 단일 연구보다 더 강한 증거 + 일반화 가능성 (Woodward, 2014, Ch.12).
3 가지 동기:
- 검정력 ↑: 단일 연구의 작은 표본 → 통합으로 효과 검출.
- 일반화: 다양한 인구·환경의 결과 통합.
- 일관성 검증: 결과가 연구 간 일치하는가.
예시: - 같은 약의 여러 RCT 결과 통합 → 평균 효과 추정. - 흡연-폐암 관찰 연구 100+ 통합 → 인과 강도 평가.
1.1 Meta-analysis 의 진화
- 추상 정의: 한 연구의 결과 = \(\hat\theta_1 \pm \text{SE}_1\). 여러 연구 통합 = \(\hat\theta_{\text{pooled}} \pm \text{SE}_{\text{pooled}}\), \(\text{SE}_{\text{pooled}} < \text{SE}_1\).
- 일상어 비유: 단일 시험관의 측정 vs 100 회 측정의 평균 — 후자가 더 정밀.
- 반사실 시나리오: 만약 모든 연구가 같은 systematic bias 를 갖는다면 meta-analysis 가 그 bias 를 더 정밀하게 추정 — “precisely wrong”. RCT meta-analysis 는 그 함정 회피, 관찰 meta-analysis 는 위험.
2 Ch.12 전체 구조
WOO Ch.12 — Meta-analysis
│
├── 12.1 Reviewing evidence (Cochrane) → H-WOO12-1
├── 12.2 Systematic review → H-WOO12-1
├── 12.3 General approach to pooling
│ ├── 12.3.1 IV (Inverse Variance) → H-WOO12-2
│ ├── 12.3.2 Fixed vs Random effects → H-WOO12-2
│ ├── 12.3.3 Heterogeneity (I², τ²) → H-WOO12-3
│ ├── 12.3.4 Calculations → H-WOO12-3
│ ├── 12.3.5 Case studies → H-WOO12-4
├── 12.4 Investigating heterogeneity → H-WOO12-5
├── 12.5 Pooling tabular data → H-WOO12-6
├── 12.6 IPD → H-WOO12-7
├── 12.7 Study quality → H-WOO12-7
└── 12.8 Publication bias → H-WOO12-8
3 12.1~12.2 — Systematic Review
연구 문헌을 체계적·재현 가능 한 방법으로 모집·평가·통합:
- PROTOCOL 사전 등록 (PROSPERO).
- Search — 다중 데이터베이스 (PubMed, Embase, Cochrane CENTRAL).
- Inclusion/Exclusion criteria 사전 명시.
- Quality assessment (RoB 2, ROBINS-I).
- Data extraction by 2 reviewers.
- Synthesis — meta-analysis 또는 narrative.
(Cochrane Handbook).
3.1 Cochrane vs 일반 Review
- 추상 정의: Cochrane Collaboration 이 systematic review 의 황금 표준. 표준 protocol + peer review + 정기 갱신.
- 일상어 비유: 측정 도구의 인증 — Cochrane = ISO 인증.
- 반사실 시나리오: 비-Cochrane review 는 quality 변동 ↑. 결과 신뢰성 점검 필요.
4 12.3 — Pooling 의 일반 접근
4.1 Inverse Variance (IV) Method
각 연구 \(i\) 의 효과 \(\hat\theta_i\) 와 분산 \(v_i\). Pooled estimate:
\[\hat\theta_{\text{pooled}} = \frac{\sum_i w_i \hat\theta_i}{\sum_i w_i}, \quad w_i = \frac{1}{v_i}\]
Variance: \[\text{Var}(\hat\theta_{\text{pooled}}) = \frac{1}{\sum_i w_i}\]
4.2 직관 — Inverse Variance Weighting
- 추상 정의: 정밀한 (작은 분산) 연구의 가중치 ↑. Optimal estimator (under known variances).
- 일상어 비유: 여러 평론가의 평가 평균 — 정확한 평론가 (작은 noise) 의 의견 가중치 ↑.
- 반사실 시나리오: 단순 평균은 큰 noise 연구도 같은 가중. IV 가 정보량 비례 가중.
5 Fixed vs Random Effects
Fixed Effects (FE): - 진성 효과 \(\theta\) 가 모든 연구에 동일. - 연구 간 차이 = 오로지 sampling error.
\[\hat\theta_i = \theta + \epsilon_i, \quad \epsilon_i \sim N(0, v_i)\]
Random Effects (RE): - 진성 효과 \(\theta_i\) 가 연구마다 다름 (random distribution). - 연구 간 차이 = sampling error + 진성 heterogeneity.
\[\hat\theta_i = \theta_i + \epsilon_i, \quad \theta_i \sim N(\mu, \tau^2), \quad \epsilon_i \sim N(0, v_i)\]
5.1 직관 — 두 모형의 분업
- 추상 정의: FE 가 “한 진성 효과 가정”, RE 가 “효과의 분포 가정”. RE 가 더 일반적이며 보수적 (CI wider).
- 일상어 비유: FE = “모든 학교의 진성 평균 점수 동일”, RE = “학교마다 다른 평균 점수, 분포 모형”.
- 반사실 시나리오: 만약 진성 효과가 정말 동일하면 FE 가 효율. 보통 다양한 인구·환경 → RE 권장.
보고 기준 (Cochrane): - 작은 이질성 → FE. - 큰 이질성 → RE 또는 분리.
5.2 RE 의 가중
\[\hat\theta_{\text{RE}} = \frac{\sum w_i^* \hat\theta_i}{\sum w_i^*}, \quad w_i^* = \frac{1}{v_i + \hat\tau^2}\]
\(\hat\tau^2\) 추가로 가중치 평탄화. 작은 연구의 가중치 ↑ (FE 보다).
6 12.3.3~12.3.4 — Heterogeneity
Cochran’s Q: \[Q = \sum_i w_i (\hat\theta_i - \hat\theta_{\text{FE}})^2\]
\(Q\) ~ \(\chi^2_{k-1}\) (귀무: heterogeneity 없음).
I²: \[I^2 = \max\left(0, \frac{Q - (k-1)}{Q}\right) \times 100\%\]
해석: - I² < 25%: 작은 heterogeneity. - I² 25~50%: 중간. - I² > 50%: 큰 heterogeneity → RE 권장.
τ² (between-study variance): DerSimonian-Laird, REML 추정.
6.1 직관 — I² 의 의미
- 추상 정의: I² = “관찰된 분산 중 진성 heterogeneity 의 비율”. 0% = sampling error 만, 100% = 모두 진성 차이.
- 일상어 비유: 여러 학교 점수의 분산 중 학교별 진성 차이의 비율 vs 측정 오차.
- 반사실 시나리오: I² 가 크면 단일 통합 결과 의미 ↓ — 분리 분석 필요. 작으면 통합 정직.
7 12.4 — Investigating Heterogeneity
이질성의 원인 탐색 도구.
| 도구 | 용도 |
|---|---|
| Forest plot | 시각화 |
| Influence analysis | 개별 연구 영향 |
| Sensitivity analysis | Subset 통합 |
| Meta-regression | 효과의 모더레이터 식별 |
상세 H-WOO12-5 에서.
8 12.5 — Tabular Data Pooling
이항 자료 (2x2 표) 의 통합 — IV·MH·Peto.
| 방법 | 활용 |
|---|---|
| Inverse Variance (IV) | 일반 |
| Mantel-Haenszel (MH) | 작은 연구 (zero cells) |
| Peto | OR 가 1 에 가깝고 유사 표본 |
| Zeros 처리 | 0.5 추가 (continuity correction) |
상세 H-WOO12-6 에서.
9 12.6 — IPD vs Aggregate
IPD: 모든 원 자료 (각 환자) 통합. 가장 정확하나 자료 접근 어려움.
Aggregate: 각 연구의 요약 통계 (효과 크기 + SE) 만 통합.
IPD 의 장점: - Subgroup 분석 자유. - 표준화된 분석 (각 연구의 다른 분석 통일). - 시간 의존 변수 분석.
Aggregate 의 강점: - 자료 접근 쉬움. - 출판된 자료만으로 가능.
10 12.7 — Study Quality
각 연구의 quality 평가: - RCT: Cochrane Risk of Bias (RoB 2). - 관찰: ROBINS-I (NIH Quality Assessment, Newcastle-Ottawa).
Quality ↑ 연구의 가중치 ↑ — sensitivity analysis 도구.
11 12.8 — Publication Bias
작은 연구 + 비-유의 결과 → 출판 안 됨 (file drawer problem). 출판된 자료만 통합 → 효과 ↑ 편향.
검출 도구: - Funnel plot: SE vs 효과 — symmetric 이면 OK. - Egger test: regression 검정. - Trim-and-fill: 누락 연구 추정 + 재통합.
상세 H-WOO12-8 에서.
12 관찰 vs RCT Meta-analysis
Schulz Ch.7 (B31) 의 메시지 재확인:
관찰 meta-analysis 가 분산 ↓ 시켜도 bias 그대로.
만약 모든 원 연구가 같은 systematic bias (예: 모두 hospital-based control 사용) 를 갖는다면, meta-analysis 가 그 bias 를 더 정밀히 추정.
“Precisely Wrong”.
3 단계 직관:
- 추상 정의: \(\text{Var}(\bar X) = \sigma^2/n\) 은 ↓, \(E[\bar X] - \mu = \text{bias}\) 그대로.
- 일상어 비유: 흐린 안경 100 개로 측정 — 평균이 100 회 평균보다 정밀하나 진성 결과는 여전히 흐림.
- 반사실 시나리오: RCT meta-analysis 는 randomization 이 bias 제거. 관찰 meta 는 bias 잔존.
13 A/B 테스트의 Meta-analysis
A/B 테스트 플랫폼의 시간에 따른 여러 시험 결과 통합: - 같은 기능의 다른 분기 결과. - 다른 사용자 segment 의 같은 기능 결과. - 다른 지역의 같은 기능 결과.
3 단계 직관:
- 추상 정의: 여러 A/B 의 lift 통합 → 평균 효과 + 효과 분포 추정.
- 일상어 비유: 여러 시장의 평균 매출 효과 통합 — 평균 효과 + 시장 간 변동성.
- 반사실 시나리오: 단일 A/B 결과만 보면 noise 큼. 통합 분석이 효과의 안정성 시사.
활용: - HTE (segment 별 효과 변동). - 외적 타당도 평가. - Multi-region rollout 결정.
14 Bayesian Meta-Analysis — 대안
각 연구의 효과를 random sample from \(N(\mu, \tau^2)\) 가정.
Prior: - \(\mu \sim N(0, 100)\) (vague). - \(\tau \sim \text{Half-Cauchy}(0, 1)\).
Posterior: MCMC 로 산출.
- 추상 정의: Frequentist 의 Hartung-Knapp 보정과 비슷한 보수적 효과. Prior 정보 결합 가능.
- 일상어 비유: 사전 지식 + 자료 결합한 종합 평가.
- 반사실 시나리오: 작은 자료에서 Frequentist 가 unstable, Bayesian 이 robust.
(Stan, brms 패키지 표준).
15 Network Meta-Analysis (NMA)
3+ treatment 의 동시 비교.
예시: Treatment A vs B (직접), B vs C (직접) → A vs C (간접).
가정: Transitivity (A vs B 와 B vs C 의 인구 비슷).
(Salanti, 2012).
- 추상 정의: 모든 가능한 treatment 비교 + ranking.
- 일상어 비유: 여러 약의 종합 평가 — 직접 비교 + 간접 비교 결합.
- 반사실 시나리오: 단일 비교만 시 모든 옵션 평가 어려움. NMA 가 종합 도구.
16 결론 — Ch.12 시리즈 길잡이
| 글 | 주제 |
|---|---|
| H-WOO12-0 (이 글) | Overview |
| H-WOO12-1 | 12.1~12.2 — Systematic review (Cochrane) |
| H-WOO12-2 | 12.3 — IV + Fixed/Random effects |
| H-WOO12-3 | 12.3.3~4 — Heterogeneity (I², τ²) |
| H-WOO12-4 | 12.3.5 — 사례 + RD/Mean/Mixed |
| H-WOO12-5 | 12.4 — Investigating heterogeneity |
| H-WOO12-6 | 12.5 — Tabular data (MH, Peto) |
| H-WOO12-7 | 12.6~12.7 — IPD + Study quality |
| H-WOO12-8 | 12.8 — Publication bias |
17 관련 주제
Phase H WOO Ch.11 시리즈 (선행)
Phase H WOO Ch.12 후속
- 1111-11-11, Systematic Review
- 1111-11-11, IV + Fixed/Random Effects
- 1111-11-11, Heterogeneity
- 1111-11-11, Pooling 사례
- 1111-11-11, Investigating Heterogeneity
- 1111-11-11, Tabular Data Pooling
- 1111-11-11, IPD + Study Quality
- 1111-11-11, Publication Bias
Statistics 크로스링크
Phase B 크로스링크