Meta-analysis 개관 — 여러 연구의 통합 분석

Woodward Ch.12 — Meta-analysis overview

여러 연구 결과를 통합 분석하는 meta-analysis 의 전체 지형을 한 번에 조망한다. Systematic review, fixed vs random effects, 이질성 (I², τ²), forest plot, 출판 편향 (funnel plot, Egger test), IPD vs aggregate, 그리고 관찰 연구의 meta-analysis 의 한계를 추상 → 일상어 → 반사실 3 단계 직관으로 풀어낸다.

Experimentation
Modeling
저자

Kwangmin Kim

공개

2026년 05월 08일

1 왜 Meta-analysis 인가

정의: Meta-analysis

여러 독립 연구의 결과를 통계적으로 통합 하는 분석. 단일 연구보다 더 강한 증거 + 일반화 가능성 (Woodward, 2014, Ch.12).

3 가지 동기:

  1. 검정력 ↑: 단일 연구의 작은 표본 → 통합으로 효과 검출.
  2. 일반화: 다양한 인구·환경의 결과 통합.
  3. 일관성 검증: 결과가 연구 간 일치하는가.

예시: - 같은 약의 여러 RCT 결과 통합 → 평균 효과 추정. - 흡연-폐암 관찰 연구 100+ 통합 → 인과 강도 평가.

1.1 Meta-analysis 의 진화

직관 3 단계: 한 연구 vs 여러 연구
  • 추상 정의: 한 연구의 결과 = \(\hat\theta_1 \pm \text{SE}_1\). 여러 연구 통합 = \(\hat\theta_{\text{pooled}} \pm \text{SE}_{\text{pooled}}\), \(\text{SE}_{\text{pooled}} < \text{SE}_1\).
  • 일상어 비유: 단일 시험관의 측정 vs 100 회 측정의 평균 — 후자가 더 정밀.
  • 반사실 시나리오: 만약 모든 연구가 같은 systematic bias 를 갖는다면 meta-analysis 가 그 bias 를 더 정밀하게 추정 — “precisely wrong”. RCT meta-analysis 는 그 함정 회피, 관찰 meta-analysis 는 위험.

2 Ch.12 전체 구조

WOO Ch.12 — Meta-analysis
│
├── 12.1 Reviewing evidence (Cochrane)       → H-WOO12-1
├── 12.2 Systematic review                   → H-WOO12-1
├── 12.3 General approach to pooling
│   ├── 12.3.1 IV (Inverse Variance)        → H-WOO12-2
│   ├── 12.3.2 Fixed vs Random effects       → H-WOO12-2
│   ├── 12.3.3 Heterogeneity (I², τ²)       → H-WOO12-3
│   ├── 12.3.4 Calculations                 → H-WOO12-3
│   ├── 12.3.5 Case studies                 → H-WOO12-4
├── 12.4 Investigating heterogeneity         → H-WOO12-5
├── 12.5 Pooling tabular data                → H-WOO12-6
├── 12.6 IPD                                 → H-WOO12-7
├── 12.7 Study quality                       → H-WOO12-7
└── 12.8 Publication bias                    → H-WOO12-8

3 12.1~12.2 — Systematic Review

정의: Systematic Review

연구 문헌을 체계적·재현 가능 한 방법으로 모집·평가·통합:

  1. PROTOCOL 사전 등록 (PROSPERO).
  2. Search — 다중 데이터베이스 (PubMed, Embase, Cochrane CENTRAL).
  3. Inclusion/Exclusion criteria 사전 명시.
  4. Quality assessment (RoB 2, ROBINS-I).
  5. Data extraction by 2 reviewers.
  6. Synthesis — meta-analysis 또는 narrative.

(Cochrane Handbook).

3.1 Cochrane vs 일반 Review

직관: Cochrane 의 표준성
  • 추상 정의: Cochrane Collaboration 이 systematic review 의 황금 표준. 표준 protocol + peer review + 정기 갱신.
  • 일상어 비유: 측정 도구의 인증 — Cochrane = ISO 인증.
  • 반사실 시나리오: 비-Cochrane review 는 quality 변동 ↑. 결과 신뢰성 점검 필요.

4 12.3 — Pooling 의 일반 접근

4.1 Inverse Variance (IV) Method

정의: IV Pooling

각 연구 \(i\) 의 효과 \(\hat\theta_i\) 와 분산 \(v_i\). Pooled estimate:

\[\hat\theta_{\text{pooled}} = \frac{\sum_i w_i \hat\theta_i}{\sum_i w_i}, \quad w_i = \frac{1}{v_i}\]

Variance: \[\text{Var}(\hat\theta_{\text{pooled}}) = \frac{1}{\sum_i w_i}\]

4.2 직관 — Inverse Variance Weighting

직관 3 단계: 정밀도 가중
  • 추상 정의: 정밀한 (작은 분산) 연구의 가중치 ↑. Optimal estimator (under known variances).
  • 일상어 비유: 여러 평론가의 평가 평균 — 정확한 평론가 (작은 noise) 의 의견 가중치 ↑.
  • 반사실 시나리오: 단순 평균은 큰 noise 연구도 같은 가중. IV 가 정보량 비례 가중.

5 Fixed vs Random Effects

정의: 두 모형의 가정

Fixed Effects (FE): - 진성 효과 \(\theta\) 가 모든 연구에 동일. - 연구 간 차이 = 오로지 sampling error.

\[\hat\theta_i = \theta + \epsilon_i, \quad \epsilon_i \sim N(0, v_i)\]

Random Effects (RE): - 진성 효과 \(\theta_i\) 가 연구마다 다름 (random distribution). - 연구 간 차이 = sampling error + 진성 heterogeneity.

\[\hat\theta_i = \theta_i + \epsilon_i, \quad \theta_i \sim N(\mu, \tau^2), \quad \epsilon_i \sim N(0, v_i)\]

5.1 직관 — 두 모형의 분업

직관 3 단계: FE vs RE
  • 추상 정의: FE 가 “한 진성 효과 가정”, RE 가 “효과의 분포 가정”. RE 가 더 일반적이며 보수적 (CI wider).
  • 일상어 비유: FE = “모든 학교의 진성 평균 점수 동일”, RE = “학교마다 다른 평균 점수, 분포 모형”.
  • 반사실 시나리오: 만약 진성 효과가 정말 동일하면 FE 가 효율. 보통 다양한 인구·환경 → RE 권장.

보고 기준 (Cochrane): - 작은 이질성 → FE. - 큰 이질성 → RE 또는 분리.

5.2 RE 의 가중

\[\hat\theta_{\text{RE}} = \frac{\sum w_i^* \hat\theta_i}{\sum w_i^*}, \quad w_i^* = \frac{1}{v_i + \hat\tau^2}\]

\(\hat\tau^2\) 추가로 가중치 평탄화. 작은 연구의 가중치 ↑ (FE 보다).

6 12.3.3~12.3.4 — Heterogeneity

정의: I², τ²

Cochran’s Q: \[Q = \sum_i w_i (\hat\theta_i - \hat\theta_{\text{FE}})^2\]

\(Q\) ~ \(\chi^2_{k-1}\) (귀무: heterogeneity 없음).

: \[I^2 = \max\left(0, \frac{Q - (k-1)}{Q}\right) \times 100\%\]

해석: - I² < 25%: 작은 heterogeneity. - I² 25~50%: 중간. - I² > 50%: 큰 heterogeneity → RE 권장.

τ² (between-study variance): DerSimonian-Laird, REML 추정.

6.1 직관 — I² 의 의미

직관 3 단계: I² 의 해석
  • 추상 정의: I² = “관찰된 분산 중 진성 heterogeneity 의 비율”. 0% = sampling error 만, 100% = 모두 진성 차이.
  • 일상어 비유: 여러 학교 점수의 분산 중 학교별 진성 차이의 비율 vs 측정 오차.
  • 반사실 시나리오: I² 가 크면 단일 통합 결과 의미 ↓ — 분리 분석 필요. 작으면 통합 정직.

7 12.4 — Investigating Heterogeneity

이질성의 원인 탐색 도구.

도구 용도
Forest plot 시각화
Influence analysis 개별 연구 영향
Sensitivity analysis Subset 통합
Meta-regression 효과의 모더레이터 식별

상세 H-WOO12-5 에서.

8 12.5 — Tabular Data Pooling

이항 자료 (2x2 표) 의 통합 — IV·MH·Peto.

방법 활용
Inverse Variance (IV) 일반
Mantel-Haenszel (MH) 작은 연구 (zero cells)
Peto OR 가 1 에 가깝고 유사 표본
Zeros 처리 0.5 추가 (continuity correction)

상세 H-WOO12-6 에서.

9 12.6 — IPD vs Aggregate

정의: Individual Patient Data (IPD) vs Aggregate

IPD: 모든 원 자료 (각 환자) 통합. 가장 정확하나 자료 접근 어려움.

Aggregate: 각 연구의 요약 통계 (효과 크기 + SE) 만 통합.

IPD 의 장점: - Subgroup 분석 자유. - 표준화된 분석 (각 연구의 다른 분석 통일). - 시간 의존 변수 분석.

Aggregate 의 강점: - 자료 접근 쉬움. - 출판된 자료만으로 가능.

10 12.7 — Study Quality

각 연구의 quality 평가: - RCT: Cochrane Risk of Bias (RoB 2). - 관찰: ROBINS-I (NIH Quality Assessment, Newcastle-Ottawa).

Quality ↑ 연구의 가중치 ↑ — sensitivity analysis 도구.

11 12.8 — Publication Bias

가정 위반: Publication Bias

작은 연구 + 비-유의 결과 → 출판 안 됨 (file drawer problem). 출판된 자료만 통합 → 효과 ↑ 편향.

검출 도구: - Funnel plot: SE vs 효과 — symmetric 이면 OK. - Egger test: regression 검정. - Trim-and-fill: 누락 연구 추정 + 재통합.

상세 H-WOO12-8 에서.

12 관찰 vs RCT Meta-analysis

가정 위반: 관찰 meta 의 함정

Schulz Ch.7 (B31) 의 메시지 재확인:

관찰 meta-analysis 가 분산 ↓ 시켜도 bias 그대로.

만약 모든 원 연구가 같은 systematic bias (예: 모두 hospital-based control 사용) 를 갖는다면, meta-analysis 가 그 bias 를 더 정밀히 추정.

“Precisely Wrong”.

3 단계 직관:

  • 추상 정의: \(\text{Var}(\bar X) = \sigma^2/n\) 은 ↓, \(E[\bar X] - \mu = \text{bias}\) 그대로.
  • 일상어 비유: 흐린 안경 100 개로 측정 — 평균이 100 회 평균보다 정밀하나 진성 결과는 여전히 흐림.
  • 반사실 시나리오: RCT meta-analysis 는 randomization 이 bias 제거. 관찰 meta 는 bias 잔존.

13 A/B 테스트의 Meta-analysis

사례: 다중 A/B 테스트의 통합

A/B 테스트 플랫폼의 시간에 따른 여러 시험 결과 통합: - 같은 기능의 다른 분기 결과. - 다른 사용자 segment 의 같은 기능 결과. - 다른 지역의 같은 기능 결과.

3 단계 직관:

  • 추상 정의: 여러 A/B 의 lift 통합 → 평균 효과 + 효과 분포 추정.
  • 일상어 비유: 여러 시장의 평균 매출 효과 통합 — 평균 효과 + 시장 간 변동성.
  • 반사실 시나리오: 단일 A/B 결과만 보면 noise 큼. 통합 분석이 효과의 안정성 시사.

활용: - HTE (segment 별 효과 변동). - 외적 타당도 평가. - Multi-region rollout 결정.

14 Bayesian Meta-Analysis — 대안

정의: Bayesian Meta

각 연구의 효과를 random sample from \(N(\mu, \tau^2)\) 가정.

Prior: - \(\mu \sim N(0, 100)\) (vague). - \(\tau \sim \text{Half-Cauchy}(0, 1)\).

Posterior: MCMC 로 산출.

직관 3 단계: Bayesian 의 가치
  • 추상 정의: Frequentist 의 Hartung-Knapp 보정과 비슷한 보수적 효과. Prior 정보 결합 가능.
  • 일상어 비유: 사전 지식 + 자료 결합한 종합 평가.
  • 반사실 시나리오: 작은 자료에서 Frequentist 가 unstable, Bayesian 이 robust.

(Stan, brms 패키지 표준).

15 Network Meta-Analysis (NMA)

정의: NMA

3+ treatment 의 동시 비교.

예시: Treatment A vs B (직접), B vs C (직접) → A vs C (간접).

가정: Transitivity (A vs B 와 B vs C 의 인구 비슷).

(Salanti, 2012).

직관: NMA 의 활용
  • 추상 정의: 모든 가능한 treatment 비교 + ranking.
  • 일상어 비유: 여러 약의 종합 평가 — 직접 비교 + 간접 비교 결합.
  • 반사실 시나리오: 단일 비교만 시 모든 옵션 평가 어려움. NMA 가 종합 도구.

16 결론 — Ch.12 시리즈 길잡이

주제
H-WOO12-0 (이 글) Overview
H-WOO12-1 12.1~12.2 — Systematic review (Cochrane)
H-WOO12-2 12.3 — IV + Fixed/Random effects
H-WOO12-3 12.3.3~4 — Heterogeneity (I², τ²)
H-WOO12-4 12.3.5 — 사례 + RD/Mean/Mixed
H-WOO12-5 12.4 — Investigating heterogeneity
H-WOO12-6 12.5 — Tabular data (MH, Peto)
H-WOO12-7 12.6~12.7 — IPD + Study quality
H-WOO12-8 12.8 — Publication bias

17 관련 주제

Phase H WOO Ch.11 시리즈 (선행)

Phase H WOO Ch.12 후속

Statistics 크로스링크

Phase B 크로스링크

Subscribe

Enjoy this blog? Get notified of new posts by email: