Blinding — Ch.16 개관 (Hiding Who Got What)

Ascertainment Bias 차단의 두 세기 역사

Schulz Ch.16 Blinding in Randomised Trials 의 큰 그림을 다룬다. (1) Blinding 과 allocation concealment 의 결정적 차이, (2) Blinding 의 잠재 효과 — 참여자·연구자·평가자 세 그룹별 (Panel 16.1), (3) Lexicon 의 혼란 — single/double/triple/quadruple blind 의 17 가지 해석, (4) Masking vs Blinding (Franklin 1785 mesmerism 시험), (5) Placebo 와 double-dummy 의 역할, (6) “Double blinding 이 trial quality 의 sine qua non 이 아님” Schulz 의 강한 주장. 후속 글의 안내.

Experimentation
Epidemiology
저자

Kwangmin Kim

공개

2026년 05월 08일

이 글은 Schulz Ch.16 Blinding in Randomised Trials 시리즈 (4 편) 의 첫 글이다. Ch.12~14 가 무작위 배정과 concealment 를, Ch.15 가 exclusion 과 ITT 를 다뤘다면, Ch.16 은 RCT 의 또 다른 기둥인 blinding 을 다룬다. Schulz full md L:6735~7382.

1 진입 직관 — Concealment 와 Blinding 의 결정적 차이

이전 챕터에서 다룬 allocation concealment 와 이 챕터의 blinding 은 자주 혼동된다. Schulz 가 명확히 분리한다.

측면 Allocation Concealment Blinding
시점 배정 전·시점 배정
대상 모집 인력 참여자·연구자·평가자
목표 Selection bias 차단 (baseline 균형) Ascertainment bias 차단 (결과 측정)
항상 가능? 예 (어떤 시험에서도) 아니오 (외과 시험 등 불가능)
챕터 Ch.14 Ch.16, 17

결정적 차이: Concealment 는 baseline 균형 보호, Blinding 은 후속 결과 측정 보호. 두 단계는 시간적·기능적 으로 분리.

비유: Concealment 는 카드 셔플 시점에 카드 패가 새지 않게 하는 것. Blinding 은 게임 진행 중 누가 어떤 카드를 받았는지 모르게 하는 것. 두 보안이 모두 필요.

이 글의 목적: Blinding 의 본질·종류·효과·한계 를 큰 그림으로 정리.

2 정의: Blinding

정의: Blinding (Masking)

처치 배정의 정보를 참여자·연구자·평가자 로부터 숨기는 절차. 그들이 처치 정보로 인해 영향받지 않도록 함.

  • 역학: Blinding / Masking
  • IT: 일반적으로 server-side rendering + DOM obfuscation (관련 개념)
  • ICH (International Conference on Harmonisation): “Blinding” 용어 권장

2.1 누구를 blind 하는가?

  1. Participants — 환자 자신
  2. Investigators — 시험 수행자 (의료 제공자, 연구원)
  3. Assessors — 결과 측정자

세 그룹 모두 blinded 시 double-blind (정확히는 triple, 그러나 관습상 double).

두 세기의 역사: Blinding 은 1785 년 Benjamin Franklin 위원회의 mesmerism (메스머리즘) 시험 에서 시작. Franklin 외 (1785) 가 참여자에게 눈가리개 를 씌워 mesmerist 의 영향을 검증. 기적적 치료 효과가 사라짐 — placebo 효과의 첫 입증. blindfolded (눈가리개) 에서 blinding 용어 유래.

3 정의: Ascertainment Bias

Blinding 의 주된 목표는 ascertainment bias (또는 information bias / detection bias) 차단.

Ascertainment Bias: 결과 측정 시점에 처치 정보 가 측정자에게 영향. 같은 사실이라도 처치군/대조군에 따라 다르게 기록 되는 편향.

반사실 사례 — Multiple Sclerosis Trial (Noseworthy 외 1994):

다발성 경화증 시험. 신경과 전문의 두 그룹이 환자 평가: - 비맹검 그룹: 처치군의 호전을 유의하게 보고 - 맹검 그룹: 처치군과 대조군의 차이 없음

같은 환자, 같은 측정. 차이는 측정자의 처치 정보 인지 만. 비맹검 그룹의 신경과 의사가 무의식적으로 새 처치에 호의적 평가.

이 사례가 ascertainment bias 의 결정적 증거. Subjective outcome (의사의 임상 평가) 에서 특히 심각.

4 Panel 16.1 — Blinding 대상별 잠재 효과

Schulz 가 정리한 blinding 효과의 메커니즘 (Schulz 2019, Ch.16, Panel 16.1).

4.1 참여자 Blinding 의 효과

효과 메커니즘
편향된 심리·신체 반응 감소 “내가 새 약 받음” 의 placebo 효과 차단
순응도 (compliance) 향상 두 군이 같은 동기
추적 손실 (loss to follow-up) 감소 비맹검 시 대조군 환자의 시험 이탈 우려
보조 처치 (co-intervention) 차이 감소 환자가 추가 약 복용 을 자제

반사실 — 참여자 비맹검: 새 약 군 환자는 기대 로 증상 호전 보고. 대조군은 실망 으로 호전 미보고. 같은 진짜 효과 0 이라도 측정 차이 발생.

4.2 연구자 Blinding 의 효과

효과 메커니즘
환자에 대한 태도 전이 차단 연구자가 새 약 환자에 더 호의적 행동 차단
Co-intervention 차별 사용 감소 위중한 새 약 환자에 추가 약 더 자주 막음
처치 용량 (dose) 차별 조정 감소 무의식적 dose 조정 차단
차별적 환자 withdrawal 감소 “이 환자가 잘 안 됨” 인식으로 제외 차단
차별적 격려·낙담 감소 “당신은 새 약이니 기대해도 됩니다” 등 차단

4.3 평가자 Blinding 의 효과

효과 메커니즘
결과 측정 편향 차단 가장 직접적 — Noseworthy 1994 사례

Schulz 의 강조: “Subjective outcome (통증 점수, 영상 판독, 임상적 호전 등) 에서 평가자 blinding 이 결정적. Objective outcome (사망 등) 에서는 영향 작음.”

5 Lexicon 의 혼란 — Single, Double, Triple, Quadruple

5.1 Single Blind

한 그룹 만 blind. 보통 참여자만 blind. 또는 평가자만 blind (참여자·연구자는 처치 알 수 있음).

5.2 Double Blind

두 그룹 (또는 그 이상) blind. 일반적으로 참여자 + 연구자 + 평가자 모두 blind.

혼란: “Double” 이 3 그룹 을 의미하는 이유? 의학에서 연구자 = 평가자 인 경우 많아 사실상 2 카테고리.

5.3 Triple Blind

Double blind + 데이터 분석가 blind. 또는 참여자·연구자·평가자 (3 별개 그룹) blind.

5.4 Quadruple Blind

Triple + 데이터 분석가 blind. 사실상 5 그룹 도 가능 (모니터링 위원회 blind).

5.5 Devereaux 외 (2001) 의 충격적 발견

“Double blind” 의 17 가지 해석. 의사·교과서마다 다른 정의.

해석 비율
참여자 + 연구자 (단순 double) 다수
참여자 + 평가자 일부
연구자 + 평가자 소수
참여자 + 연구자 + 평가자 (실제 triple) 일부
기타 (오해석 등) 다수

Haahr & Hrobjartsson (2006) 의 후속 분석: “Double blind” 시험 156 편 중 56% 가 누가 blind 됐는지 명시 안 함. 26% 는 어떻게 blind 했는지 명시 안 함.

Schulz 의 결론: “‘Double blind’ 라는 용어만 의존하지 말고, 누가 어떻게 blind 됐는지 명시하라.” (CONSORT 권장)

6 Masking vs Blinding — 용어 선택의 정치

Maskingblinding 보다 적절한가?” — 일부 학자의 제안.

6.1 Masking 옹호 논리

  • 시각 장애 환자 시험에서 “blinding” 은 부적절 (혼란)
  • 시력 결과 시험에서도 같은 문제
  • 객관적 어조

6.2 Schulz 의 Blinding 옹호

  • 2 세기 역사 — 사용자 인지도 높음
  • bias prevention 강력 imagery — 눈가리개의 시각적 강력함
  • ICH guidelines — international 표준이 blinding 사용
  • Masking눈구멍 같은 부분 노출 imagery (덜 강력)

Schulz 의 결론 (Schulz, Chalmers, Altman 2002): “Blinding 우선. 다만 시험 특성에 따라 masking 이 더 적합하면 사용 가능.”

7 Placebo 와 Blinding

7.1 Placebo 효과

비효과적 처치 가 참여자에게 심리적 효과 를 주어 결과를 변화 시키는 현상.” (Schulz 2019, Ch.16)

Wolf (1950) 의 고전 연구: Placebo 가 진짜 약과 동등한 효과 를 보인 사례 — 기침·구토·설사·통증 등.

7.2 Placebo Control 의 역할

대조군에 비활성 처치 제공. 두 군의 placebo 효과는 동일진짜 처치 효과 만 측정.

수식: \(\text{Treatment effect} = (\text{Treatment + Placebo effect}) - (\text{Placebo effect alone}) = \text{Treatment effect}\)

7.3 Active Placebo

부작용 mimicking placebo. 진짜 약의 부작용 (입 마름, 발한) 을 모방하여 불완전 blinding 차단.

반사실 — 부작용으로 인한 unblinding: 진짜 약이 분명한 부작용 일으키면 환자가 “내가 진짜 약 받았다” 추측. Blinding 무력화. Active placebo 가 이를 차단.

7.4 Double-Dummy Method

두 활성 약 비교 시 (예: 약 A 캡슐 vs 약 B 알약 비교):

모든 환자가 *2 가지* 받음:
- A 군: 진짜 A 캡슐 + 가짜 B 알약
- B 군: 가짜 A 캡슐 + 진짜 B 알약

결과: 두 군 모두 동일한 수의 약 복용 → blinding 가능.

8 Schulz 의 강한 주장 — “Double blinding 은 sine qua non 이 아니다”

“일부 의학 연구자가 double blinding 을 RCT 의 절대 조건 으로 본다. 틀렸다. RCT 가 methodologically sound 하면서 double blind 가 아닐 수도 있고, double blind 면서 unsound 일 수도 있다.”

8.1 Lasagna 의 통찰 (1955)

“Placebo 와 double blind 가 우리의 사고와 문헌에서 fetish 의 지위에 도달했다. 이들이 가지는 Automatic Aura of Respectability, Infallibility, Scientific Savoir-faire 는 일부 상황에서 부당하게 부여.”

8.2 외과 시험의 한계

외과 시험은 double blind 불가능 — 외과의가 자신이 어떤 술기를 했는지 모를 수 없음.

반사실: 외과 시험에서 평가자만 blind 가능. 결과 (사진·기능 검사 등) 를 외부 평가자가 무관 상태로 평가. 이는 single blind 지만 결과의 객관성 보존.

8.3 Schulz 의 권장

최소한 평가자 blinding 은 거의 항상 가능. 객관적 결과 (사망) 는 영향 작지만, 주관적 결과 (통증) 는 결정적.”

9 “Test of Blindness” 의 한계

9.1 기존 관행

시험 끝에 참여자·평가자에게 어느 처치를 받았는지 추측 하게 하여 blinding 성공 여부 평가.

9.2 문제

Schulz 의 비판:

  1. 부작용 단서: 진짜 약의 부작용 으로 추측 → blinding 실패가 아니라 약의 효과 의 추측
  2. 효과 단서: 임상 호전 으로 추측 → blinding 의 문제가 아니라 효과의 자연 결과
  3. 전략적 응답: 참여자가 추측을 의도적으로 숨김

이 세 요인 때문에 test of blindness 의 결과 해석 어려움.

9.3 CONSORT 의 변화

CONSORT 2010 은 test of blindness 를 checklist 에서 제외. 이유: 해석 어려움.

새 권장: “Blinding 의 방법론 을 자세히 보고, 성공 여부 평가는 조심스럽게.”

10 Blinding 보고의 충격적 실태

10.1 Devereaux 외 (2001), Haahr & Hrobjartsson (2006) 의 발견

항목 비율
Blinding 사용 명시 안 함 33~51% (분야별)
Blinding 방법 (어떻게) 명시 안 함 25~42%
누구를 blind 했는지 명시 안 함 56%
“Double blind” 라고 했지만 실제 0~1 그룹만 blind 19%

so what: “Double blind” 라는 라벨이 실제 blinding 의 적절성 을 보장 안 함. CONSORT 의 명시적 보고 강제가 핵심.

11 챕터의 줄기 — 후속 글 안내

Ch.16 의 후속 깊이는 다음으로 분해.

11.1 후속 글 1 — 맹검의 효과와 용어 (32-19)

  • Panel 16.1 의 메커니즘 깊이
  • Lexicon 의 17 가지 해석 분석
  • Devereaux/Haahr 의 실증

11.2 후속 글 2 — Masking vs Blinding + Placebo (32-20)

  • 용어 선택 논쟁 (Franklin 1785 의 역사)
  • Placebo 의 역할과 active placebo
  • Double-dummy method

11.3 후속 글 3 — 편향 방지 효과와 평가 (32-21)

  • “Double blind 가 sine qua non 이 아님” 의 깊이
  • Multiple sclerosis trial 사례 (Noseworthy 1994)
  • CONSORT 의 blinding 보고 권장

12 IT / 디지털 실험 매핑

역학 (RCT) IT (A/B Test)
Blinding (참여자) Hidden experiment ID — 사용자가 본인 군 모름
Blinding (연구자) Engineer 가 사용자별 처치 모름
Blinding (평가자) Analyst 가 사용자 분석 시 처치 정보 차단
Placebo control Holdout group
Active placebo Sham UI change (시각적 변화 있지만 기능 동일)
Double-dummy Multi-variant rendering for parallel features
Test of blindness A/A test

IT 의 차이: IT 에서는 DOM 검사 등으로 사용자가 본인 군 추측 가능. Server-side rendering 으로 client 에 처치 정보 숨김. Schulz 의 RCT blinding 과 동형.

13 코드 예시 — Ascertainment Bias 시뮬레이션

import numpy as np
from scipy import stats

np.random.seed(42)

n_per_arm = 200
true_effect = 0.0   # 실제 효과 없음

# 환자 객관적 상태
T = np.array([0]*n_per_arm + [1]*n_per_arm)
np.random.shuffle(T)

# 객관적 결과 (사망률 등) — 효과 없음 가정
true_outcome = np.random.binomial(1, 0.20, len(T))

# === 1. Blinded assessment ===
# 평가자가 처치 정보 모름 → 객관적 측정
blinded_outcome = true_outcome.copy()

# === 2. Unblinded assessment ===
# 평가자가 처치 정보 알면 → 주관적 측정에서 *처치군에 호의*
unblinded_outcome = true_outcome.copy()
# 처치군 환자의 borderline 케이스를 'better' 로 분류 (10% 확률)
borderline = np.random.random(len(T)) < 0.10
unblinded_outcome[(T == 0) & borderline & (true_outcome == 1)] = 0   # 처치군 사망 → 호전 분류

# 효과 추정
print("[Ascertainment Bias 시뮬레이션 — true effect = 0]")
print(f"\n[Blinded assessment]")
mort_T_blind = blinded_outcome[T == 0].mean()
mort_C_blind = blinded_outcome[T == 1].mean()
print(f"처치 사망률: {mort_T_blind:.3f}, 대조: {mort_C_blind:.3f}")
print(f"효과: {(mort_C_blind - mort_T_blind):.3f}")

print(f"\n[Unblinded assessment]")
mort_T_unblind = unblinded_outcome[T == 0].mean()
mort_C_unblind = unblinded_outcome[T == 1].mean()
print(f"처치 사망률: {mort_T_unblind:.3f}, 대조: {mort_C_unblind:.3f}")
print(f"효과: {(mort_C_unblind - mort_T_unblind):.3f}")
print("→ Unblinded 평가는 효과 *없는* 시험에서도 효과 *있어 보이게* 만듦")

이 코드는 ascertainment bias 가 효과 없는 시험에서도 효과 를 만드는 메커니즘을 보여준다.

14 결론 — Ch.16 의 한 줄 요약

Blinding 은 결과 측정의 객관성을 지키는 방어선. 어떻게 blind 했는가얼마나 blind 했는가 보다 중요.

핵심 메시지:

  1. Blinding ≠ Allocation Concealment — 시점·대상·목표 모두 다름
  2. 세 그룹 (참여자·연구자·평가자) 별 효과 (Panel 16.1)
  3. “Double blind” 의 17 가지 해석 — 용어 의존 위험
  4. Placebo + Double-dummy — Blinding 의 도구
  5. Double blind 가 sine qua non 이 아님 — Schulz 의 강한 입장

후속 글에서 각 측면 깊이.

15 관련 주제

선행 지식

Phase C 후속 글

16 참고문헌

  • Schulz, K. F. & Grimes, D. A. (2019). Essential Concepts in Clinical Research (2nd ed.), Ch.16. Elsevier.
  • Schulz, K. F., Chalmers, I., Altman, D. G. (2002). The landscape and lexicon of blinding in randomized trials. Ann. Intern. Med. 136, 254-259.
  • Devereaux, P. J., Manns, B. J., Ghali, W. A., et al. (2001). Physician interpretations and textbook definitions of blinding terminology. JAMA 285, 2000-2003.
  • Haahr, M. T. & Hrobjartsson, A. (2006). Who is blinded in randomized clinical trials? Clin. Trials 3, 360-365.
  • Noseworthy, J. H., Ebers, G. C., Vandervoort, M. K., et al. (1994). The impact of blinding on the results of a randomized, placebo-controlled multiple sclerosis clinical trial. Neurology 44, 16-20.
  • Lasagna, L. (1955). The controlled trial: theory and practice. J. Chronic Dis. 1, 353-367.
  • Franklin, B., Bailly, J., Lavoisier, A. (1785). Rapport des commissaires chargés par le roi, de l’examen du magnetisme animal.
  • Wolf, S. (1950). Effects of suggestion and conditioning on action of chemical agents. J. Clin. Invest. 29, 100-109.

Subscribe

Enjoy this blog? Get notified of new posts by email: