Kwangmin Kim - Blinding — Ch.16 개관 (Hiding Who Got What)

이 글은 Schulz Ch.16 Blinding in Randomised Trials 시리즈 (4 편) 의 첫 글이다. Ch.12~14 가 무작위 배정과 concealment 를, Ch.15 가 exclusion 과 ITT 를 다뤘다면, Ch.16 은 RCT 의 또 다른 기둥인 blinding 을 다룬다. Schulz full md L:6735~7382.

1 진입 직관 — Concealment 와 Blinding 의 결정적 차이

이전 챕터에서 다룬 allocation concealment 와 이 챕터의 blinding 은 자주 혼동된다. Schulz 가 명확히 분리한다.

측면	Allocation Concealment	Blinding
시점	배정 전·시점	배정 후
대상	모집 인력	참여자·연구자·평가자
목표	Selection bias 차단 (baseline 균형)	Ascertainment bias 차단 (결과 측정)
항상 가능?	예 (어떤 시험에서도)	아니오 (외과 시험 등 불가능)
챕터	Ch.14	Ch.16, 17

결정적 차이: Concealment 는 baseline 균형 보호, Blinding 은 후속 결과 측정 보호. 두 단계는 시간적·기능적 으로 분리.

비유: Concealment 는 카드 셔플 시점에 카드 패가 새지 않게 하는 것. Blinding 은 게임 진행 중 누가 어떤 카드를 받았는지 모르게 하는 것. 두 보안이 모두 필요.

이 글의 목적: Blinding 의 본질·종류·효과·한계 를 큰 그림으로 정리.

2 정의: Blinding

정의: Blinding (Masking)

처치 배정의 정보를 참여자·연구자·평가자 로부터 숨기는 절차. 그들이 처치 정보로 인해 영향받지 않도록 함.

역학: Blinding / Masking
IT: 일반적으로 server-side rendering + DOM obfuscation (관련 개념)
ICH (International Conference on Harmonisation): “Blinding” 용어 권장

두 세기의 역사: Blinding 은 1785 년 Benjamin Franklin 위원회의 mesmerism (메스머리즘) 시험 에서 시작. Franklin 외 (1785) 가 참여자에게 눈가리개 를 씌워 mesmerist 의 영향을 검증. 기적적 치료 효과가 사라짐 — placebo 효과의 첫 입증. blindfolded (눈가리개) 에서 blinding 용어 유래.

3 정의: Ascertainment Bias

Blinding 의 주된 목표는 ascertainment bias (또는 information bias / detection bias) 차단.

Ascertainment Bias: 결과 측정 시점에 처치 정보 가 측정자에게 영향. 같은 사실이라도 처치군/대조군에 따라 다르게 기록 되는 편향.

반사실 사례 — Multiple Sclerosis Trial (Noseworthy 외 1994):

다발성 경화증 시험. 신경과 전문의 두 그룹이 환자 평가: - 비맹검 그룹: 처치군의 호전을 유의하게 보고 - 맹검 그룹: 처치군과 대조군의 차이 없음

같은 환자, 같은 측정. 차이는 측정자의 처치 정보 인지 만. 비맹검 그룹의 신경과 의사가 무의식적으로 새 처치에 호의적 평가.

이 사례가 ascertainment bias 의 결정적 증거. Subjective outcome (의사의 임상 평가) 에서 특히 심각.

4 Panel 16.1 — Blinding 대상별 잠재 효과

Schulz 가 정리한 blinding 효과의 메커니즘 (Schulz 2019, Ch.16, Panel 16.1).

4.1 참여자 Blinding 의 효과

효과	메커니즘
편향된 심리·신체 반응 감소	“내가 새 약 받음” 의 placebo 효과 차단
순응도 (compliance) 향상	두 군이 같은 동기
추적 손실 (loss to follow-up) 감소	비맹검 시 대조군 환자의 시험 이탈 우려
보조 처치 (co-intervention) 차이 감소	환자가 추가 약 복용 을 자제

반사실 — 참여자 비맹검: 새 약 군 환자는 기대 로 증상 호전 보고. 대조군은 실망 으로 호전 미보고. 같은 진짜 효과 0 이라도 측정 차이 발생.

4.2 연구자 Blinding 의 효과

효과	메커니즘
환자에 대한 태도 전이 차단	연구자가 새 약 환자에 더 호의적 행동 차단
Co-intervention 차별 사용 감소	위중한 새 약 환자에 추가 약 더 자주 막음
처치 용량 (dose) 차별 조정 감소	무의식적 dose 조정 차단
차별적 환자 withdrawal 감소	“이 환자가 잘 안 됨” 인식으로 제외 차단
차별적 격려·낙담 감소	“당신은 새 약이니 기대해도 됩니다” 등 차단

4.3 평가자 Blinding 의 효과

효과	메커니즘
결과 측정 편향 차단	가장 직접적 — Noseworthy 1994 사례

Schulz 의 강조: “Subjective outcome (통증 점수, 영상 판독, 임상적 호전 등) 에서 평가자 blinding 이 결정적. Objective outcome (사망 등) 에서는 영향 작음.”

5 Lexicon 의 혼란 — Single, Double, Triple, Quadruple

5.5 Devereaux 외 (2001) 의 충격적 발견

“Double blind” 의 17 가지 해석. 의사·교과서마다 다른 정의.

해석	비율
참여자 + 연구자 (단순 double)	다수
참여자 + 평가자	일부
연구자 + 평가자	소수
참여자 + 연구자 + 평가자 (실제 triple)	일부
기타 (오해석 등)	다수

Haahr & Hrobjartsson (2006) 의 후속 분석: “Double blind” 시험 156 편 중 56% 가 누가 blind 됐는지 명시 안 함. 26% 는 어떻게 blind 했는지 명시 안 함.

Schulz 의 결론: “‘Double blind’ 라는 용어만 의존하지 말고, 누가 어떻게 blind 됐는지 명시하라.” (CONSORT 권장)

6 Masking vs Blinding — 용어 선택의 정치

“Masking 이 blinding 보다 적절한가?” — 일부 학자의 제안.

6.1 Masking 옹호 논리

시각 장애 환자 시험에서 “blinding” 은 부적절 (혼란)
시력 결과 시험에서도 같은 문제
더 객관적 어조

6.2 Schulz 의 Blinding 옹호

2 세기 역사 — 사용자 인지도 높음
bias prevention 강력 imagery — 눈가리개의 시각적 강력함
ICH guidelines — international 표준이 blinding 사용
Masking 은 눈구멍 같은 부분 노출 imagery (덜 강력)

Schulz 의 결론 (Schulz, Chalmers, Altman 2002): “Blinding 우선. 다만 시험 특성에 따라 masking 이 더 적합하면 사용 가능.”

7 Placebo 와 Blinding

7.1 Placebo 효과

“비효과적 처치 가 참여자에게 심리적 효과 를 주어 결과를 변화 시키는 현상.” (Schulz 2019, Ch.16)

Wolf (1950) 의 고전 연구: Placebo 가 진짜 약과 동등한 효과 를 보인 사례 — 기침·구토·설사·통증 등.

7.2 Placebo Control 의 역할

대조군에 비활성 처치 제공. 두 군의 placebo 효과는 동일 → 진짜 처치 효과 만 측정.

수식: \(\text{Treatment effect} = (\text{Treatment + Placebo effect}) - (\text{Placebo effect alone}) = \text{Treatment effect}\)

7.3 Active Placebo

부작용 mimicking placebo. 진짜 약의 부작용 (입 마름, 발한) 을 모방하여 불완전 blinding 차단.

반사실 — 부작용으로 인한 unblinding: 진짜 약이 분명한 부작용 일으키면 환자가 “내가 진짜 약 받았다” 추측. Blinding 무력화. Active placebo 가 이를 차단.

7.4 Double-Dummy Method

두 활성 약 비교 시 (예: 약 A 캡슐 vs 약 B 알약 비교):

모든 환자가 *2 가지* 받음:
- A 군: 진짜 A 캡슐 + 가짜 B 알약
- B 군: 가짜 A 캡슐 + 진짜 B 알약

결과: 두 군 모두 동일한 수의 약 복용 → blinding 가능.

8 Schulz 의 강한 주장 — “Double blinding 은 sine qua non 이 아니다”

“일부 의학 연구자가 double blinding 을 RCT 의 절대 조건 으로 본다. 틀렸다. RCT 가 methodologically sound 하면서 double blind 가 아닐 수도 있고, double blind 면서 unsound 일 수도 있다.”

8.1 Lasagna 의 통찰 (1955)

“Placebo 와 double blind 가 우리의 사고와 문헌에서 fetish 의 지위에 도달했다. 이들이 가지는 Automatic Aura of Respectability, Infallibility, Scientific Savoir-faire 는 일부 상황에서 부당하게 부여.”

8.2 외과 시험의 한계

외과 시험은 double blind 불가능 — 외과의가 자신이 어떤 술기를 했는지 모를 수 없음.

반사실: 외과 시험에서 평가자만 blind 가능. 결과 (사진·기능 검사 등) 를 외부 평가자가 무관 상태로 평가. 이는 single blind 지만 결과의 객관성 보존.

8.3 Schulz 의 권장

“최소한 평가자 blinding 은 거의 항상 가능. 객관적 결과 (사망) 는 영향 작지만, 주관적 결과 (통증) 는 결정적.”

9 “Test of Blindness” 의 한계

9.1 기존 관행

시험 끝에 참여자·평가자에게 어느 처치를 받았는지 추측 하게 하여 blinding 성공 여부 평가.

9.2 문제

Schulz 의 비판:

부작용 단서: 진짜 약의 부작용 으로 추측 → blinding 실패가 아니라 약의 효과 의 추측

효과 단서: 임상 호전 으로 추측 → blinding 의 문제가 아니라 효과의 자연 결과

전략적 응답: 참여자가 추측을 의도적으로 숨김

이 세 요인 때문에 test of blindness 의 결과 해석 어려움.

9.3 CONSORT 의 변화

CONSORT 2010 은 test of blindness 를 checklist 에서 제외. 이유: 해석 어려움.

새 권장: “Blinding 의 방법론 을 자세히 보고, 성공 여부 평가는 조심스럽게.”

10 Blinding 보고의 충격적 실태

10.1 Devereaux 외 (2001), Haahr & Hrobjartsson (2006) 의 발견

항목	비율
Blinding 사용 명시 안 함	33~51% (분야별)
Blinding 방법 (어떻게) 명시 안 함	25~42%
누구를 blind 했는지 명시 안 함	56%
“Double blind” 라고 했지만 실제 0~1 그룹만 blind	19%

so what: “Double blind” 라는 라벨이 실제 blinding 의 적절성 을 보장 안 함. CONSORT 의 명시적 보고 강제가 핵심.

11 챕터의 줄기 — 후속 글 안내

Ch.16 의 후속 깊이는 다음으로 분해.

11.1 후속 글 1 — 맹검의 효과와 용어 (32-19)

Panel 16.1 의 메커니즘 깊이
Lexicon 의 17 가지 해석 분석
Devereaux/Haahr 의 실증

11.2 후속 글 2 — Masking vs Blinding + Placebo (32-20)

용어 선택 논쟁 (Franklin 1785 의 역사)
Placebo 의 역할과 active placebo
Double-dummy method

11.3 후속 글 3 — 편향 방지 효과와 평가 (32-21)

“Double blind 가 sine qua non 이 아님” 의 깊이
Multiple sclerosis trial 사례 (Noseworthy 1994)
CONSORT 의 blinding 보고 권장

12 IT / 디지털 실험 매핑

역학 (RCT)	IT (A/B Test)
Blinding (참여자)	Hidden experiment ID — 사용자가 본인 군 모름
Blinding (연구자)	Engineer 가 사용자별 처치 모름
Blinding (평가자)	Analyst 가 사용자 분석 시 처치 정보 차단
Placebo control	Holdout group
Active placebo	Sham UI change (시각적 변화 있지만 기능 동일)
Double-dummy	Multi-variant rendering for parallel features
Test of blindness	A/A test

IT 의 차이: IT 에서는 DOM 검사 등으로 사용자가 본인 군 추측 가능. Server-side rendering 으로 client 에 처치 정보 숨김. Schulz 의 RCT blinding 과 동형.

13 코드 예시 — Ascertainment Bias 시뮬레이션

import numpy as np
from scipy import stats

np.random.seed(42)

n_per_arm = 200
true_effect = 0.0   # 실제 효과 없음

# 환자 객관적 상태
T = np.array([0]*n_per_arm + [1]*n_per_arm)
np.random.shuffle(T)

# 객관적 결과 (사망률 등) — 효과 없음 가정
true_outcome = np.random.binomial(1, 0.20, len(T))

# === 1. Blinded assessment ===
# 평가자가 처치 정보 모름 → 객관적 측정
blinded_outcome = true_outcome.copy()

# === 2. Unblinded assessment ===
# 평가자가 처치 정보 알면 → 주관적 측정에서 *처치군에 호의*
unblinded_outcome = true_outcome.copy()
# 처치군 환자의 borderline 케이스를 'better' 로 분류 (10% 확률)
borderline = np.random.random(len(T)) < 0.10
unblinded_outcome[(T == 0) & borderline & (true_outcome == 1)] = 0   # 처치군 사망 → 호전 분류

# 효과 추정
print("[Ascertainment Bias 시뮬레이션 — true effect = 0]")
print(f"\n[Blinded assessment]")
mort_T_blind = blinded_outcome[T == 0].mean()
mort_C_blind = blinded_outcome[T == 1].mean()
print(f"처치 사망률: {mort_T_blind:.3f}, 대조: {mort_C_blind:.3f}")
print(f"효과: {(mort_C_blind - mort_T_blind):.3f}")

print(f"\n[Unblinded assessment]")
mort_T_unblind = unblinded_outcome[T == 0].mean()
mort_C_unblind = unblinded_outcome[T == 1].mean()
print(f"처치 사망률: {mort_T_unblind:.3f}, 대조: {mort_C_unblind:.3f}")
print(f"효과: {(mort_C_unblind - mort_T_unblind):.3f}")
print("→ Unblinded 평가는 효과 *없는* 시험에서도 효과 *있어 보이게* 만듦")

이 코드는 ascertainment bias 가 효과 없는 시험에서도 효과 를 만드는 메커니즘을 보여준다.

14 결론 — Ch.16 의 한 줄 요약

Blinding 은 결과 측정의 객관성을 지키는 방어선. 어떻게 blind 했는가 가 얼마나 blind 했는가 보다 중요.

핵심 메시지:

Blinding ≠ Allocation Concealment — 시점·대상·목표 모두 다름
세 그룹 (참여자·연구자·평가자) 별 효과 (Panel 16.1)
“Double blind” 의 17 가지 해석 — 용어 의존 위험
Placebo + Double-dummy — Blinding 의 도구
Double blind 가 sine qua non 이 아님 — Schulz 의 강한 입장

후속 글에서 각 측면 깊이.

15 관련 주제

선행 지식

Phase C 후속 글

16 참고문헌

Schulz, K. F. & Grimes, D. A. (2019). Essential Concepts in Clinical Research (2nd ed.), Ch.16. Elsevier.
Schulz, K. F., Chalmers, I., Altman, D. G. (2002). The landscape and lexicon of blinding in randomized trials. Ann. Intern. Med. 136, 254-259.
Devereaux, P. J., Manns, B. J., Ghali, W. A., et al. (2001). Physician interpretations and textbook definitions of blinding terminology. JAMA 285, 2000-2003.
Haahr, M. T. & Hrobjartsson, A. (2006). Who is blinded in randomized clinical trials? Clin. Trials 3, 360-365.
Noseworthy, J. H., Ebers, G. C., Vandervoort, M. K., et al. (1994). The impact of blinding on the results of a randomized, placebo-controlled multiple sclerosis clinical trial. Neurology 44, 16-20.
Lasagna, L. (1955). The controlled trial: theory and practice. J. Chronic Dis. 1, 353-367.
Franklin, B., Bailly, J., Lavoisier, A. (1785). Rapport des commissaires chargés par le roi, de l’examen du magnetisme animal.
Wolf, S. (1950). Effects of suggestion and conditioning on action of chemical agents. J. Clin. Invest. 29, 100-109.