이 글은 Schulz Ch.16 Blinding in Randomised Trials 시리즈 (4 편) 의 첫 글이다. Ch.12~14 가 무작위 배정과 concealment 를, Ch.15 가 exclusion 과 ITT 를 다뤘다면, Ch.16 은 RCT 의 또 다른 기둥인 blinding 을 다룬다. Schulz full md L:6735~7382.
1 진입 직관 — Concealment 와 Blinding 의 결정적 차이
이전 챕터에서 다룬 allocation concealment 와 이 챕터의 blinding 은 자주 혼동된다. Schulz 가 명확히 분리한다.
| 측면 | Allocation Concealment | Blinding |
|---|---|---|
| 시점 | 배정 전·시점 | 배정 후 |
| 대상 | 모집 인력 | 참여자·연구자·평가자 |
| 목표 | Selection bias 차단 (baseline 균형) | Ascertainment bias 차단 (결과 측정) |
| 항상 가능? | 예 (어떤 시험에서도) | 아니오 (외과 시험 등 불가능) |
| 챕터 | Ch.14 | Ch.16, 17 |
결정적 차이: Concealment 는 baseline 균형 보호, Blinding 은 후속 결과 측정 보호. 두 단계는 시간적·기능적 으로 분리.
비유: Concealment 는 카드 셔플 시점에 카드 패가 새지 않게 하는 것. Blinding 은 게임 진행 중 누가 어떤 카드를 받았는지 모르게 하는 것. 두 보안이 모두 필요.
이 글의 목적: Blinding 의 본질·종류·효과·한계 를 큰 그림으로 정리.
2 정의: Blinding
처치 배정의 정보를 참여자·연구자·평가자 로부터 숨기는 절차. 그들이 처치 정보로 인해 영향받지 않도록 함.
- 역학: Blinding / Masking
- IT: 일반적으로 server-side rendering + DOM obfuscation (관련 개념)
- ICH (International Conference on Harmonisation): “Blinding” 용어 권장
2.1 누구를 blind 하는가?
- Participants — 환자 자신
- Investigators — 시험 수행자 (의료 제공자, 연구원)
- Assessors — 결과 측정자
세 그룹 모두 blinded 시 double-blind (정확히는 triple, 그러나 관습상 double).
두 세기의 역사: Blinding 은 1785 년 Benjamin Franklin 위원회의 mesmerism (메스머리즘) 시험 에서 시작. Franklin 외 (1785) 가 참여자에게 눈가리개 를 씌워 mesmerist 의 영향을 검증. 기적적 치료 효과가 사라짐 — placebo 효과의 첫 입증. blindfolded (눈가리개) 에서 blinding 용어 유래.
3 정의: Ascertainment Bias
Blinding 의 주된 목표는 ascertainment bias (또는 information bias / detection bias) 차단.
Ascertainment Bias: 결과 측정 시점에 처치 정보 가 측정자에게 영향. 같은 사실이라도 처치군/대조군에 따라 다르게 기록 되는 편향.
반사실 사례 — Multiple Sclerosis Trial (Noseworthy 외 1994):
다발성 경화증 시험. 신경과 전문의 두 그룹이 환자 평가: - 비맹검 그룹: 처치군의 호전을 유의하게 보고 - 맹검 그룹: 처치군과 대조군의 차이 없음
같은 환자, 같은 측정. 차이는 측정자의 처치 정보 인지 만. 비맹검 그룹의 신경과 의사가 무의식적으로 새 처치에 호의적 평가.
이 사례가 ascertainment bias 의 결정적 증거. Subjective outcome (의사의 임상 평가) 에서 특히 심각.
4 Panel 16.1 — Blinding 대상별 잠재 효과
Schulz 가 정리한 blinding 효과의 메커니즘 (Schulz 2019, Ch.16, Panel 16.1).
4.1 참여자 Blinding 의 효과
| 효과 | 메커니즘 |
|---|---|
| 편향된 심리·신체 반응 감소 | “내가 새 약 받음” 의 placebo 효과 차단 |
| 순응도 (compliance) 향상 | 두 군이 같은 동기 |
| 추적 손실 (loss to follow-up) 감소 | 비맹검 시 대조군 환자의 시험 이탈 우려 |
| 보조 처치 (co-intervention) 차이 감소 | 환자가 추가 약 복용 을 자제 |
반사실 — 참여자 비맹검: 새 약 군 환자는 기대 로 증상 호전 보고. 대조군은 실망 으로 호전 미보고. 같은 진짜 효과 0 이라도 측정 차이 발생.
4.2 연구자 Blinding 의 효과
| 효과 | 메커니즘 |
|---|---|
| 환자에 대한 태도 전이 차단 | 연구자가 새 약 환자에 더 호의적 행동 차단 |
| Co-intervention 차별 사용 감소 | 위중한 새 약 환자에 추가 약 더 자주 막음 |
| 처치 용량 (dose) 차별 조정 감소 | 무의식적 dose 조정 차단 |
| 차별적 환자 withdrawal 감소 | “이 환자가 잘 안 됨” 인식으로 제외 차단 |
| 차별적 격려·낙담 감소 | “당신은 새 약이니 기대해도 됩니다” 등 차단 |
4.3 평가자 Blinding 의 효과
| 효과 | 메커니즘 |
|---|---|
| 결과 측정 편향 차단 | 가장 직접적 — Noseworthy 1994 사례 |
Schulz 의 강조: “Subjective outcome (통증 점수, 영상 판독, 임상적 호전 등) 에서 평가자 blinding 이 결정적. Objective outcome (사망 등) 에서는 영향 작음.”
5 Lexicon 의 혼란 — Single, Double, Triple, Quadruple
5.1 Single Blind
한 그룹 만 blind. 보통 참여자만 blind. 또는 평가자만 blind (참여자·연구자는 처치 알 수 있음).
5.2 Double Blind
두 그룹 (또는 그 이상) blind. 일반적으로 참여자 + 연구자 + 평가자 모두 blind.
혼란: “Double” 이 3 그룹 을 의미하는 이유? 의학에서 연구자 = 평가자 인 경우 많아 사실상 2 카테고리.
5.3 Triple Blind
Double blind + 데이터 분석가 blind. 또는 참여자·연구자·평가자 (3 별개 그룹) blind.
5.4 Quadruple Blind
Triple + 데이터 분석가 blind. 사실상 5 그룹 도 가능 (모니터링 위원회 blind).
5.5 Devereaux 외 (2001) 의 충격적 발견
“Double blind” 의 17 가지 해석. 의사·교과서마다 다른 정의.
| 해석 | 비율 |
|---|---|
| 참여자 + 연구자 (단순 double) | 다수 |
| 참여자 + 평가자 | 일부 |
| 연구자 + 평가자 | 소수 |
| 참여자 + 연구자 + 평가자 (실제 triple) | 일부 |
| 기타 (오해석 등) | 다수 |
Haahr & Hrobjartsson (2006) 의 후속 분석: “Double blind” 시험 156 편 중 56% 가 누가 blind 됐는지 명시 안 함. 26% 는 어떻게 blind 했는지 명시 안 함.
Schulz 의 결론: “‘Double blind’ 라는 용어만 의존하지 말고, 누가 어떻게 blind 됐는지 명시하라.” (CONSORT 권장)
6 Masking vs Blinding — 용어 선택의 정치
“Masking 이 blinding 보다 적절한가?” — 일부 학자의 제안.
6.1 Masking 옹호 논리
- 시각 장애 환자 시험에서 “blinding” 은 부적절 (혼란)
- 시력 결과 시험에서도 같은 문제
- 더 객관적 어조
6.2 Schulz 의 Blinding 옹호
- 2 세기 역사 — 사용자 인지도 높음
- bias prevention 강력 imagery — 눈가리개의 시각적 강력함
- ICH guidelines — international 표준이 blinding 사용
- Masking 은 눈구멍 같은 부분 노출 imagery (덜 강력)
Schulz 의 결론 (Schulz, Chalmers, Altman 2002): “Blinding 우선. 다만 시험 특성에 따라 masking 이 더 적합하면 사용 가능.”
7 Placebo 와 Blinding
7.1 Placebo 효과
“비효과적 처치 가 참여자에게 심리적 효과 를 주어 결과를 변화 시키는 현상.” (Schulz 2019, Ch.16)
Wolf (1950) 의 고전 연구: Placebo 가 진짜 약과 동등한 효과 를 보인 사례 — 기침·구토·설사·통증 등.
7.2 Placebo Control 의 역할
대조군에 비활성 처치 제공. 두 군의 placebo 효과는 동일 → 진짜 처치 효과 만 측정.
수식: \(\text{Treatment effect} = (\text{Treatment + Placebo effect}) - (\text{Placebo effect alone}) = \text{Treatment effect}\)
7.3 Active Placebo
부작용 mimicking placebo. 진짜 약의 부작용 (입 마름, 발한) 을 모방하여 불완전 blinding 차단.
반사실 — 부작용으로 인한 unblinding: 진짜 약이 분명한 부작용 일으키면 환자가 “내가 진짜 약 받았다” 추측. Blinding 무력화. Active placebo 가 이를 차단.
7.4 Double-Dummy Method
두 활성 약 비교 시 (예: 약 A 캡슐 vs 약 B 알약 비교):
모든 환자가 *2 가지* 받음:
- A 군: 진짜 A 캡슐 + 가짜 B 알약
- B 군: 가짜 A 캡슐 + 진짜 B 알약
결과: 두 군 모두 동일한 수의 약 복용 → blinding 가능.
8 Schulz 의 강한 주장 — “Double blinding 은 sine qua non 이 아니다”
“일부 의학 연구자가 double blinding 을 RCT 의 절대 조건 으로 본다. 틀렸다. RCT 가 methodologically sound 하면서 double blind 가 아닐 수도 있고, double blind 면서 unsound 일 수도 있다.”
8.1 Lasagna 의 통찰 (1955)
“Placebo 와 double blind 가 우리의 사고와 문헌에서 fetish 의 지위에 도달했다. 이들이 가지는 Automatic Aura of Respectability, Infallibility, Scientific Savoir-faire 는 일부 상황에서 부당하게 부여.”
8.2 외과 시험의 한계
외과 시험은 double blind 불가능 — 외과의가 자신이 어떤 술기를 했는지 모를 수 없음.
반사실: 외과 시험에서 평가자만 blind 가능. 결과 (사진·기능 검사 등) 를 외부 평가자가 무관 상태로 평가. 이는 single blind 지만 결과의 객관성 보존.
8.3 Schulz 의 권장
“최소한 평가자 blinding 은 거의 항상 가능. 객관적 결과 (사망) 는 영향 작지만, 주관적 결과 (통증) 는 결정적.”
9 “Test of Blindness” 의 한계
9.1 기존 관행
시험 끝에 참여자·평가자에게 어느 처치를 받았는지 추측 하게 하여 blinding 성공 여부 평가.
9.2 문제
Schulz 의 비판:
- 부작용 단서: 진짜 약의 부작용 으로 추측 → blinding 실패가 아니라 약의 효과 의 추측
- 효과 단서: 임상 호전 으로 추측 → blinding 의 문제가 아니라 효과의 자연 결과
- 전략적 응답: 참여자가 추측을 의도적으로 숨김
이 세 요인 때문에 test of blindness 의 결과 해석 어려움.
9.3 CONSORT 의 변화
CONSORT 2010 은 test of blindness 를 checklist 에서 제외. 이유: 해석 어려움.
새 권장: “Blinding 의 방법론 을 자세히 보고, 성공 여부 평가는 조심스럽게.”
10 Blinding 보고의 충격적 실태
10.1 Devereaux 외 (2001), Haahr & Hrobjartsson (2006) 의 발견
| 항목 | 비율 |
|---|---|
| Blinding 사용 명시 안 함 | 33~51% (분야별) |
| Blinding 방법 (어떻게) 명시 안 함 | 25~42% |
| 누구를 blind 했는지 명시 안 함 | 56% |
| “Double blind” 라고 했지만 실제 0~1 그룹만 blind | 19% |
so what: “Double blind” 라는 라벨이 실제 blinding 의 적절성 을 보장 안 함. CONSORT 의 명시적 보고 강제가 핵심.
11 챕터의 줄기 — 후속 글 안내
Ch.16 의 후속 깊이는 다음으로 분해.
11.1 후속 글 1 — 맹검의 효과와 용어 (32-19)
- Panel 16.1 의 메커니즘 깊이
- Lexicon 의 17 가지 해석 분석
- Devereaux/Haahr 의 실증
11.2 후속 글 2 — Masking vs Blinding + Placebo (32-20)
- 용어 선택 논쟁 (Franklin 1785 의 역사)
- Placebo 의 역할과 active placebo
- Double-dummy method
11.3 후속 글 3 — 편향 방지 효과와 평가 (32-21)
- “Double blind 가 sine qua non 이 아님” 의 깊이
- Multiple sclerosis trial 사례 (Noseworthy 1994)
- CONSORT 의 blinding 보고 권장
12 IT / 디지털 실험 매핑
| 역학 (RCT) | IT (A/B Test) |
|---|---|
| Blinding (참여자) | Hidden experiment ID — 사용자가 본인 군 모름 |
| Blinding (연구자) | Engineer 가 사용자별 처치 모름 |
| Blinding (평가자) | Analyst 가 사용자 분석 시 처치 정보 차단 |
| Placebo control | Holdout group |
| Active placebo | Sham UI change (시각적 변화 있지만 기능 동일) |
| Double-dummy | Multi-variant rendering for parallel features |
| Test of blindness | A/A test |
IT 의 차이: IT 에서는 DOM 검사 등으로 사용자가 본인 군 추측 가능. Server-side rendering 으로 client 에 처치 정보 숨김. Schulz 의 RCT blinding 과 동형.
13 코드 예시 — Ascertainment Bias 시뮬레이션
import numpy as np
from scipy import stats
np.random.seed(42)
n_per_arm = 200
true_effect = 0.0 # 실제 효과 없음
# 환자 객관적 상태
T = np.array([0]*n_per_arm + [1]*n_per_arm)
np.random.shuffle(T)
# 객관적 결과 (사망률 등) — 효과 없음 가정
true_outcome = np.random.binomial(1, 0.20, len(T))
# === 1. Blinded assessment ===
# 평가자가 처치 정보 모름 → 객관적 측정
blinded_outcome = true_outcome.copy()
# === 2. Unblinded assessment ===
# 평가자가 처치 정보 알면 → 주관적 측정에서 *처치군에 호의*
unblinded_outcome = true_outcome.copy()
# 처치군 환자의 borderline 케이스를 'better' 로 분류 (10% 확률)
borderline = np.random.random(len(T)) < 0.10
unblinded_outcome[(T == 0) & borderline & (true_outcome == 1)] = 0 # 처치군 사망 → 호전 분류
# 효과 추정
print("[Ascertainment Bias 시뮬레이션 — true effect = 0]")
print(f"\n[Blinded assessment]")
mort_T_blind = blinded_outcome[T == 0].mean()
mort_C_blind = blinded_outcome[T == 1].mean()
print(f"처치 사망률: {mort_T_blind:.3f}, 대조: {mort_C_blind:.3f}")
print(f"효과: {(mort_C_blind - mort_T_blind):.3f}")
print(f"\n[Unblinded assessment]")
mort_T_unblind = unblinded_outcome[T == 0].mean()
mort_C_unblind = unblinded_outcome[T == 1].mean()
print(f"처치 사망률: {mort_T_unblind:.3f}, 대조: {mort_C_unblind:.3f}")
print(f"효과: {(mort_C_unblind - mort_T_unblind):.3f}")
print("→ Unblinded 평가는 효과 *없는* 시험에서도 효과 *있어 보이게* 만듦")이 코드는 ascertainment bias 가 효과 없는 시험에서도 효과 를 만드는 메커니즘을 보여준다.
14 결론 — Ch.16 의 한 줄 요약
Blinding 은 결과 측정의 객관성을 지키는 방어선. 어떻게 blind 했는가 가 얼마나 blind 했는가 보다 중요.
핵심 메시지:
- Blinding ≠ Allocation Concealment — 시점·대상·목표 모두 다름
- 세 그룹 (참여자·연구자·평가자) 별 효과 (Panel 16.1)
- “Double blind” 의 17 가지 해석 — 용어 의존 위험
- Placebo + Double-dummy — Blinding 의 도구
- Double blind 가 sine qua non 이 아님 — Schulz 의 강한 입장
후속 글에서 각 측면 깊이.
15 관련 주제
선행 지식
Phase C 후속 글
- 맹검의 효과와 용어 (placeholder)
- 맹검 vs masking + 위약 (placeholder)
- 맹검의 편향 방지 효과와 평가 (placeholder)
16 참고문헌
- Schulz, K. F. & Grimes, D. A. (2019). Essential Concepts in Clinical Research (2nd ed.), Ch.16. Elsevier.
- Schulz, K. F., Chalmers, I., Altman, D. G. (2002). The landscape and lexicon of blinding in randomized trials. Ann. Intern. Med. 136, 254-259.
- Devereaux, P. J., Manns, B. J., Ghali, W. A., et al. (2001). Physician interpretations and textbook definitions of blinding terminology. JAMA 285, 2000-2003.
- Haahr, M. T. & Hrobjartsson, A. (2006). Who is blinded in randomized clinical trials? Clin. Trials 3, 360-365.
- Noseworthy, J. H., Ebers, G. C., Vandervoort, M. K., et al. (1994). The impact of blinding on the results of a randomized, placebo-controlled multiple sclerosis clinical trial. Neurology 44, 16-20.
- Lasagna, L. (1955). The controlled trial: theory and practice. J. Chronic Dis. 1, 353-367.
- Franklin, B., Bailly, J., Lavoisier, A. (1785). Rapport des commissaires chargés par le roi, de l’examen du magnetisme animal.
- Wolf, S. (1950). Effects of suggestion and conditioning on action of chemical agents. J. Clin. Invest. 29, 100-109.