1 Publication Bias 의 정의
작은 표본 + 비-유의 결과 → 출판 안 됨 (file drawer problem).
출판된 자료만 통합 → 효과 ↑ 편향 (Woodward, 2014, Ch.12.8).
1.1 메커니즘
- 유의 결과 (\(p < 0.05\)): 출판 ↑.
- 비-유의 결과: 출판 ↓ (저자·편집자 모두 관심 ↓).
3 단계 직관:
- 추상 정의: \(P(\text{published} \mid \theta, p\text{-value})\) 가 p-value 에 의존. 자기선택 → 출판 풀이 진성보다 효과 ↑ 편향.
- 일상어 비유: 영화 리뷰 평균 — 별점 1 점 받은 영화는 리뷰 안 받음. 평균 별점 부풀려.
- 반사실 시나리오: 모든 연구 (유의 + 비-유의) 출판 시 진성 평균. 출판 selection 이 평균 ↑.
2 Funnel Plot — 1 차 진단
X 축: 효과 크기 (\(\hat\theta_i\)). Y 축: 정밀도 (1/SE 또는 표본 크기 등).
기대 패턴: 정밀도 ↓ 시 효과 분산 ↑ → funnel 형태 (대칭 깔때기).
Asymmetry: 한쪽 (작은 효과 + 작은 표본) 에 연구 부족 → publication bias 의심.
2.1 시각 패턴
1/SE
↑
│ *
│ * * * (큰 정밀도, 효과 변동 작음)
│ * * *
│ * * *
│ * * * *
│ * * * * (작은 정밀도, 효과 변동 큼)
│
└────────────────────→ θ
대칭 funnel = publication bias 약함. 좌측 (효과 ↓) 누락 = publication bias 강함 (작은 + 비-유의 미출판).
3 단계 직관:
- 추상 정의: 정밀도 작을수록 효과 자체의 분산 ↑ — 자연스러운 funnel 형태.
- 일상어 비유: 적은 측정 자료의 결과 변동 ↑, 큰 자료는 안정. Funnel 이 이 패턴 시각.
- 반사실 시나리오: 한쪽이 비대칭 — small studies + 작은 효과 가 미출판 의심.
3 Egger’s Regression Test
Standard Normal Deviate (SND) 와 Precision 의 회귀: \[\text{SND}_i = \alpha + \beta \cdot \text{Precision}_i + \epsilon_i\]
여기서: - \(\text{SND}_i = \hat\theta_i / \text{SE}_i\). - \(\text{Precision}_i = 1/\text{SE}_i\).
검정: \(H_0: \alpha = 0\) — funnel symmetric.
기각 → asymmetry → publication bias 의심.
- 추상 정의: \(\alpha \ne 0\) = SND 와 정밀도의 비례 안 — 작은 연구의 결과가 큰 연구와 다른 경향.
- 일상어 비유: 작은 학교의 평균 점수가 큰 학교와 systematic 차이 — 자기 선택 의심.
- 반사실 시나리오: \(\alpha = 0\) 면 funnel 대칭. \(\alpha > 0\) 이면 작은 + 작은 효과 누락 의심.
3.1 Egger 의 한계
- 작은 \(k\) (\(< 10\)): 검정력 ↓.
- 진성 heterogeneity 와 publication bias 의 구분 어려움.
3 단계 직관:
- 추상 정의: Asymmetry 가 publication bias 만의 결과 아님 — heterogeneity 도 가능.
- 일상어 비유: 한쪽 누락이 자기 선택 vs 진성 차이 — 자료만으로 구분 어려움.
- 반사실 시나리오: Egger 와 함께 sensitivity analysis (RoB, subgroup) 권장.
4 Begg’s Rank Test
각 연구의 효과의 순위와 정밀도의 순위의 Kendall’s \(\tau\).
검정: \(H_0: \tau = 0\) — 순위 무관 = funnel symmetric.
기각 → 순위 상관 → asymmetry.
- Egger: 회귀 (parametric).
- Begg: 순위 (nonparametric).
Egger 가 더 검정력 ↑ — 일반적으로 Egger 우선.
5 Trim-and-Fill
Asymmetric funnel 의 누락 연구 추정 + 보정.
Step 1: Outlier 제거 (trim). Step 2: 누락 연구 가짜로 추가 (fill, mirror image). Step 3: 모든 (실제 + 가짜) 자료로 재통합.
효과: Publication bias 보정된 효과 추정.
5.1 Trim-and-Fill 의 한계
Trim-and-Fill 가정 — 누락이 정밀도와 효과의 결합으로 결정.
진성: 누락 메커니즘이 더 복잡 (예: 출판 시점, 저널 IF, language) 가능.
3 단계 직관:
- 추상 정의: 단순 mirror 보정은 강한 가정. 복잡한 selection 메커니즘이면 부정확.
- 일상어 비유: 누락 자료를 대칭으로 가정 — 실제로는 비대칭 가능.
- 반사실 시나리오: Trim-and-Fill 의 결과는 sensitivity analysis 의 일부. 단독 결론 도출 위험.
6 Selection Models
더 정교한 publication bias 모형 — selection function \(w(\theta, p)\) 를 명시 + 가능도 결합.
| 모형 | 설명 |
|---|---|
| Copas | \(w\) 가 \(1 - \Phi(a + b/\text{SE})\) |
| Hedges | \(w\) 가 p-value 단계 함수 |
6.1 한계
진성 selection function 모름 → 가정 의존.
3 단계 직관:
- 추상 정의: 가정이 결과 좌우 — 다른 가정 → 다른 보정.
- 일상어 비유: 누락 자료의 패턴 모름 → 추측 보정.
- 반사실 시나리오: 다중 selection model 시도 + sensitivity. 단독 결과 신뢰 ↓.
7 File-Drawer Problem
비-유의 결과는 “서랍에 보관” — 출판 안 됨.
Fail-safe N: 통합 결과를 무의미하게 만들기 위해 필요한 누락 연구 수.
\(N_{\text{fs}}\) 가 큼 → robust. 작음 → vulnerable.
7.1 사전 등록 — 근본 해결
- 추상 정의: 모든 연구가 사전 등록 (PROSPERO, ClinicalTrials.gov) 되면 누락 검증 가능.
- 일상어 비유: 모든 시험 응시자 등록부 — 응시 후 누가 통과/실패했는지 추적 가능.
- 반사실 시나리오: 사전 등록 없으면 file-drawer 검출 어려움. 등록이 publication bias 의 근본 해결.
FDA Amendment Act (2007): 미국 임상 trial 사전 등록 의무.
8 A/B 테스트의 Publication Bias 발상
A/B 테스트의 publication bias-like 패턴:
- Successful A/B 만 archive: 실패 시험은 폐기 → archive 의 평균 lift 부풀려.
- 유의 결과만 발표: 비-유의 결과는 보고 안 됨 → portfolio 의 평균 effective.
3 단계 직관:
- 추상 정의: 회사의 A/B archive 가 selection 의 결과면 평균 lift = 진성 평균보다 ↑.
- 일상어 비유: 영화 평론가가 좋아하는 영화만 review → review 평균 별점 ↑.
- 반사실 시나리오: 모든 시험 (성공 + 실패) archive 가 정직. 사전 등록 + 의무 보고가 IT 의 publication bias 회피.
9 코드 예시 — Publication Bias 진단
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
# 가상 자료
studies = pd.DataFrame({
"theta": [0.30, 0.50, 0.45, 0.60, 0.55, 0.65, 0.40, 0.70, 0.75, 0.80],
"se": [0.05, 0.08, 0.06, 0.15, 0.12, 0.18, 0.07, 0.20, 0.22, 0.25],
})
# Funnel plot
plt.figure(figsize=(8, 6))
plt.scatter(studies["theta"], 1/studies["se"])
plt.xlabel("Effect (θ)")
plt.ylabel("Precision (1/SE)")
plt.title("Funnel plot")
# Egger's test
studies["SND"] = studies["theta"] / studies["se"]
studies["precision"] = 1 / studies["se"]
X = sm.add_constant(studies["precision"])
egger = sm.OLS(studies["SND"], X).fit()
print(f"Egger's intercept: {egger.params['const']:.3f}")
print(f"Egger's p-value: {egger.pvalues['const']:.4f}")
print(f" (p < 0.05 → asymmetry, publication bias 의심)")해석: Funnel 시각 + Egger 검정 결합. p < 0.05 시 sensitivity (trim-and-fill, selection model) 시도.
10 Small Study Effect — 출판 편향의 일반화
작은 연구의 효과가 큰 연구와 systematic 차이.
원인: 1. Publication bias: 작은 + 비-유의 미출판. 2. Methodological quality: 작은 연구의 quality ↓ 흔함. 3. True heterogeneity: 작은 연구가 다른 인구·환경. 4. Outcome selection: 작은 연구의 multiple outcomes 중 유의한 것만.
(Sterne et al., 2011).
- 추상 정의: 작은 연구의 다른 패턴이 publication bias 만 아님.
- 일상어 비유: 작은 회사의 매출 패턴이 큰 회사와 다른 다양한 이유.
- 반사실 시나리오: Egger test 가 publication bias 외 다른 원인도 검출. 보완 분석 필요.
11 Copas Selection Model
Selection 확률을 명시 모형: \[P(\text{published}_i) = \Phi(a + b/\text{SE}_i)\]
\(a\): baseline selection. \(b\): precision dependence.
Likelihood 결합 → 보정 추정.
- 추상 정의: Selection function 명시 → 보정 정확도 ↑.
- 일상어 비유: 누락 자료 패턴 모형화.
- 반사실 시나리오: 단순 trim-and-fill 보다 정밀. 단 가정 의존.
12 P-Curve — Hacking 검출
유의 결과 (\(p < 0.05\)) 의 p-value 분포 시각.
진성 효과: P-value 의 right-skewed (작은 p 가 흔함). P-hacking: P-value 의 좌 skewed (0.04~0.05 가 흔함).
(Simonsohn et al., 2014).
- 추상 정의: 진성 효과면 작은 p (강한 신호) 가 흔함. P-hacking 시 0.05 에 모임.
- 일상어 비유: 시험 점수 분포 — 진성 능력자는 고득점, cheating 은 합격선 부근.
- 반사실 시나리오: P-curve 가 publication bias 외에 p-hacking 도 검출. 보완 도구.
13 Q&A — Publication Bias 의 흔한 오해
A: 아니다. Small study effect 의 다중 원인.
3 단계 직관:
- 추상 정의: Asymmetry 가 publication bias 의 1 차 신호. 기타 원인도 가능.
- 일상어 비유: 작은 회사 데이터 누락 — 이유 다양.
- 반사실 시나리오: Sensitivity analysis (sub-group quality) 로 다른 원인 점검.
A: 부분. 가정 의존.
3 단계 직관:
- 추상 정의: Trim-and-fill 가 mirror 가정 — 강한 가정.
- 일상어 비유: 누락 자료를 대칭으로 가정 — 실제로는 비대칭 가능.
- 반사실 시나리오: 다중 sensitivity (Copas, selection model) 결과 비교.
14 결론 — Phase H WOO Ch.12 시리즈 마무리
Phase H WOO Ch.12 시리즈 (9 편 완성)
│
├── H-WOO12-0: Overview
├── H-WOO12-1: Systematic Review
├── H-WOO12-2: Fixed/Random Effects
├── H-WOO12-3: Heterogeneity
├── H-WOO12-4: Pooling 사례
├── H-WOO12-5: Investigating Heterogeneity
├── H-WOO12-6: Tabular Pooling
├── H-WOO12-7: IPD + Quality
└── H-WOO12-8: Publication Bias (이 글)
다음 묶음 (WOO Ch.13 — Risk Scores, H-WOO13-0~9) 은 예측 모형의 평가 도구 (ROC, AUC, calibration, NRI) 를 다룬다.
15 관련 주제
다음 묶음 (WOO Ch.13)
- 1111-11-11, Risk Scores·Decision Rules 개관
Phase B 크로스링크