이 글은 Schulz & Grimes (2019) Ch.10 의 두 번째 글이다. Ch.10 개관 에서 제시한 큰 그림 중 모집 어려움의 정량화 부분 (Schulz full md L:17401~17800) 을 깊이 다룬다. 다음 글 C-SCH10-2 에서는 개선 전략을 다룬다.
1 진입 직관 — 왜 정량화가 중요한가
RCT 신청서에 “12 개월 내 500 명 모집” 이라고 적힌 추정치를 그대로 믿으면, 5 시험 중 4 개는 출발선에서 좌초한다 (UK 31% 도달률). 그렇다고 “그냥 더 많이 잡아두자” 식의 막연한 보정도 해롭다. 자금 신청에서 과대 산정은 신뢰를 잃고, 과소 산정은 시험 자체가 불가능해진다.
핵심 질문: 얼마나 보정해야 하는가? 그리고 그 보정의 어떤 부분이 가장 큰 손실을 만드는가?
이 질문에 답하기 위해 Schulz Ch.10 은 두 종류의 도구를 제공한다.
- 경험 법칙 (Rules of Thumb) — Lasagna 법칙·Muench 제3법칙·π 규칙 → 최종 모집 수와 기간의 비관적 보정 배율
- 단계별 분수 (Stage-wise Fractions) — Eligibility · Enrolment · Recruitment fraction → 깔때기의 어디가 막혔는지 진단
전자는 “얼마나 적게 / 얼마나 늦게” 를, 후자는 “왜 / 어디서” 를 답한다. 두 도구는 보완적이다.
2 Lasagna 법칙 — 8000 → 100 의 단계별 분해
2.1 일화의 배경
1979 년 Louis Lasagna (임상 약리학 선구자) 가 보고한 단회 진통제 시험 일화다 (Schulz & Grimes, 2019, Ch.10, Lasagna 1979 인용).
모집 기간 중 외과 서비스에는 8000 명 이상의 수술 환자가 있었지만, 실제로 등록된 사람은 100 명에 불과했다.
연구자는 사전에 “한 달 200 명 모집 가능” 으로 추정했지만, 실제로는 80 분의 1 만 등록되었다. 이 거대한 격차가 “Lasagna 법칙” 으로 임상시험계에 회자되었다.
2.2 왜 80 분의 1 인가? — 단계별 손실 분해
8000 명이 100 명으로 줄어드는 과정은 단일 거부 가 아니라 다단계 funnel 의 곱셈적 손실이다. Schulz 의 단편적 서술과 Lasagna 원문을 종합하면 대략 다음과 같이 분해된다.
| 단계 | 설명 | 통과율 (추정) | 누적 |
|---|---|---|---|
| 8000 명 | 외과 서비스 전체 환자 | - | 8000 |
| 시험 대상 수술 종류 | 진통제 시험 가능한 통증 유형 (예: 골절·복부수술) | 50% | 4000 |
| 동반 질환 없음 | 기존 진통제 알러지·간기능 저하 등 배제 | 50% | 2000 |
| 연구자 가용 시간대 | 연구자가 깨어 있고 병동 방문 가능 시간 | 30% | 600 |
| 인지 상태 | 통증 평가가 가능한 의식 수준 (마취 회복 후) | 50% | 300 |
| 동의 권유 시간 | 수술 후 동의서 받을 시간 여유 | 70% | 210 |
| 본인 동의 | 무작위 배정 + 진통제 미상에 대한 동의 | 50% | 105 |
각 단계의 통과율은 그럴듯해 보인다 — 30~70%. 그러나 이 일곱 단계의 곱셈 은 다음과 같다.
\[ 0.5 \times 0.5 \times 0.3 \times 0.5 \times 0.7 \times 0.5 \approx 0.013 \]
즉 약 1.3% 만 최종 등록. \(8000 \times 0.013 = 104 \approx 100\).
수식 직관: 인간의 직관은 합산 으로 손실을 추정하는 데 익숙하지만, 다단계 funnel 은 곱셈 으로 손실이 누적된다. “각 단계에서 30~50% 손실, 합쳐서 50% 손실 정도?” 라는 직관은 완전히 틀린다. 5~7 단계의 50~70% 통과는 1~5% 만 옥상에 도달 시킨다. 80 배라는 격차는 마법이 아니라 곱셈의 자연스러운 결과 다.
반사실 — 단계 하나만 줄여도: 만약 위 분해에서 “연구자 가용 시간대” 30% 를 60% 로 끌어올리면 (예: 24 시간 모집 인력 배치) 최종 등록이 100 → 200 명 으로 두 배 증가. 또는 “본인 동의” 50% 를 70% 로 (전화 follow-up·인센티브 추가) 하면 100 → 140 명. 단일 병목을 찾아 깰 수 있다면 효과가 곱셈적으로 커진다.
2.3 80 의 의미 — 정확성보다 충격
Lasagna 의 “80 배” 는 정밀한 숫자가 아니다. 단지 “연구자의 추정이 1~2 자릿수 단위로 부풀려져 있을 수 있다” 는 경고다. 이 경고를 내면화하는 것이 신청서 작성·자금 산정·기간 추정의 출발점이다.
실무 적용: 신청서에 “한 달 200 명 모집 가능” 이라고 쓴 직후, 즉시 “Lasagna 보정: 80 으로 나누면 한 달 2.5 명, 즉 12 개월 30 명” 을 적어두면 자기 검증이 된다. 두 추정치가 너무 다르면 어느 쪽 가정이 어디서 깨졌는지 단계별로 추적 가능하다.
3 Muench 제3법칙 — 왜 1/10 이 자연수처럼 등장하는가
3.1 정의와 출처
Ederer (1975) 가 임상 시험계의 농담 같은 격언을 정리한 것이다.
\[ N_\text{realistic} = \frac{N_\text{estimated}}{10} \]
연구자가 추정하는 모집 가능 환자 수를 10 으로 나누면 더 현실적인 값이 된다.
Lasagna 의 80 배보다 보수적이지만, 신청서 단계의 1 차 보정으로 충분하다는 것이 임상시험계의 경험칙이다.
3.2 왜 하필 10 인가? — 곱셈 funnel 의 자연스러운 누적률
Lasagna 분해에서 보았듯, 5 단계의 50~70% 통과 는 다음과 같이 누적된다.
\[ 0.6^5 \approx 0.078, \qquad 0.7^5 \approx 0.168 \]
즉 5 단계 funnel 은 평균 8~17% 의 누적 도달률을 가진다. 이 범위의 중앙값이 1/10 근처에 안착한다. 즉 Muench 제3법칙은 마법이 아니라 전형적 5 단계 funnel 의 통계적 평균 이다.
수식 직관: 만약 각 단계의 통과율이 동일한 \(p\) 이고 단계 수가 \(k\) 라면 누적 도달률은 \(p^k\). 다음 표가 의미하는 바는 단순하다.
단계 수 \(k\) 단계별 통과 60% 단계별 통과 70% 단계별 통과 80% 3 21.6% 34.3% 51.2% 4 13.0% 24.0% 41.0% 5 7.8% 16.8% 32.8% 6 4.7% 11.8% 26.2% 7 2.8% 8.2% 21.0% 5~6 단계의 60~70% 통과 funnel 의 누적 도달률은 5~17% 범위. 이 중앙값이 약 10%, 즉 1/10. Muench 의 10 은 인간 행동 funnel 의 자연 상수다.
3.3 Lasagna (80) 와 Muench (10) 의 차이
두 법칙이 다른 배율을 제시하는 이유는 단계 수와 단계별 거부율의 차이 다.
- Muench 1/10: 5 단계, 단계별 약 60% 통과 (덜 까다로운 시험)
- Lasagna 1/80: 7 단계, 단계별 약 50% 통과 (수술 환자 + 단회 진통제처럼 시간 압박이 큰 시험)
실무 권고: 시험의 모집 funnel 단계 수와 각 단계 거부율을 사전에 추정해보면, 1/10 ~ 1/80 사이 어느 보정 배율이 자기 시험에 맞는지 가늠할 수 있다. 단순 진통제 시험은 1/10 가까이, 침습적·장기 추적 시험은 1/80 에 가깝다.
4 π 규칙 — 모집 기간의 비관적 보정
4.1 정의
\[ T_\text{actual} \approx \pi \cdot T_\text{planned} \]
계획한 모집 기간에 약 3.14 를 곱하면 실제 소요 기간에 근접한다. 개도국 등 물류 도전 환경에서는 \(2\pi\) 를 곱한다 (Schulz & Grimes, 2019, Ch.10).
4.2 왜 π 인가? — 세 가지 지연 요인의 곱
π 는 정확한 수학 상수가 아니라 “약 3 배” 를 부르는 문학적 표현이다. 실제 모집 지연은 다음 세 가지 곱셈적 지연 요인 이 누적된 결과다.
4.2.1 1. 램프 업 지연 (Ramp-up Delay) — 약 1.5 배
첫 환자 등록까지 IRB 승인·인력 훈련·서류 준비·시스템 설정에 예상보다 50% 더 걸린다. 신청서가 “1 개월 내 시작” 이라고 적었어도 실제 첫 환자는 보통 2~3 개월 후에 등록된다.
비유: 새 식당 오픈일을 정해놓아도 인테리어·인허가·인력 채용에 보통 50% 더 걸리는 것과 같다.
4.2.2 2. 분기별 변동 (Seasonal Variability) — 약 1.3 배
휴가·명절·인플루엔자 시즌 등으로 일부 분기는 모집이 거의 0 이다. 평균적으로 4 분기 중 1~1.5 분기가 “잃어버린 분기” 가 되며, 이는 전체 기간을 약 30% 늘린다.
사례: 12 월~1 월 (연말 연시), 7 월~8 월 (휴가), 학회 기간 (5 월·10 월) 등이 합쳐지면 1 년 중 3~4 개월은 모집이 정체된다.
4.2.3 3. 꼬리 길이 (Long Tail) — 약 1.5 배
마지막 환자 모집은 처음보다 2~3 배 느리다. 쉬운 적격자는 초기에 등록되고, 후기에는 까다로운 케이스만 남는다. 예상의 80% 까지 도달하는 시간보다 마지막 20% 를 채우는 시간이 더 길다.
수식: Pareto-like 분포에서 80% 까지 시간 = \(T_{80}\), 100% 까지 시간 = \(T_{100} \approx 1.5 \cdot T_{80}\). 이는 의료 모집뿐 아니라 소프트웨어 버그 픽스, 마케팅 캠페인 도달 등 다양한 영역에서 관측되는 현상이다.
4.2.4 곱하면 π
\[ 1.5 \times 1.3 \times 1.5 = 2.925 \approx \pi \]
세 지연 요인의 곱이 자연스럽게 π 근처에 떨어진다. 이것이 Schulz 의 “π 규칙” 의 수학적 직관이다. 개도국에서 \(2\pi\) 가 되는 이유는 물류·통신·규제 라는 추가 요인이 한 단계 더 곱해지기 때문이다 (\(\approx 1.5 \times 1.3 \times 1.5 \times 2 \approx 5.85 \approx 2\pi\)).
실무 적용: 신청서에 “12 개월 내 500 명” 이라고 적었다면, 즉시 “π 보정: 약 38 개월 = 3 년 2 개월” 을 사이드 노트로 적어두자. 이 두 값을 자금 기관에 동시 제시하면 (1) 자기 검증, (2) 후속 연장 요청의 근거, (3) 다단계 모집 전략 설계 에 모두 도움이 된다.
5 단계별 분수 — 깔때기의 어디가 막혔는가
세 가지 경험 법칙은 총량 과 기간 의 보정 배율을 제공하지만, 어느 단계가 문제인지 는 알려주지 않는다. 그 진단을 위해 Schulz 는 세 가지 분수 (fraction) 를 도입한다.
5.1 정의 재확인
A: Approached (잠재 참여자 — 접근됨)
↓ Eligibility screening
B: Eligible (적격 — 의학적 기준 충족)
↓ Informed consent
C: Enrolled (등록됨 — 동의 후 실제 참여)
\[ \text{Eligibility fraction} = \frac{B}{A}, \qquad \text{Enrolment fraction} = \frac{C}{B}, \qquad \text{Recruitment fraction} = \frac{C}{A} = \frac{B}{A} \cdot \frac{C}{B} \]
세 분수의 관계는 단순한 곱셈이지만, 각 분수가 다른 인과 책임자 를 가리킨다는 점이 핵심이다.
5.2 책임 분담
| 분수 | 직접 책임자 | 일상어 비유 |
|---|---|---|
| \(B/A\) Eligibility fraction | 연구 설계자 — 적격 기준 작성자 | 콘서트 입장 자격 (나이·티켓 종류) |
| \(C/B\) Enrolment fraction | 연구 인력 — 동의 절차 운영자 | 매표소 직원의 친절·설명 능력 |
| \(C/A\) Recruitment fraction | 두 책임의 곱 | 광고 본 사람 중 실제 입장한 비율 |
5.3 Eligibility Fraction 깊이 — 적격 기준의 trade-off
\(B/A\) 가 낮은 시험 (예: 30%) 은 적격 기준이 좁은 시험이다.
- 장점 — 동질한 표본 → 처치 효과의 분산 감소 → 검정력 증가
- 단점 — 외적 타당도 손실 → 결과를 일반 환자에 적용 불가
반사실: 만약 한 항암 시험이 “ECOG 0~1 + 신기능 정상 + 동반 질환 없음 + 18~65 세” 로 적격을 좁히면 \(B/A = 20\%\) 정도로 떨어질 수 있다. 결과 “60% 반응” 이 나와도 일반 진료에서 같은 약을 처방하면 ECOG 2~3, 신기능 저하, 노인 환자가 다수라 반응률이 30~40% 로 낮아질 수 있다. Eligibility fraction 의 낮음은 결과의 외적 타당도를 직접 제약 한다.
실무 권고: 적격 기준의 각 항목이 “\(B/A\) 를 얼마나 줄이는가” 를 사전에 모의 측정한다. “이 기준 하나로 적격자가 30% 줄어든다면, 그만한 가치가 있는가?” 를 물어야 한다.
5.4 Enrolment Fraction 깊이 — 동의의 행동학
\(C/B\) 가 낮은 시험 (예: 30%) 은 적격자 중 다수가 동의를 거부하는 시험이다. 이는 연구 인력의 행동 디자인 영역이다.
거부의 흔한 이유:
| 이유 | 메커니즘 | 처방 |
|---|---|---|
| 동의서가 너무 길다 | 인지 부담·이해 실패 | 단순화·시각화·구두 설명 보강 |
| 무작위 배정에 대한 거부감 | “내가 어느 군에 갈지 모름” | 시험 목적의 재설명, equipoise 강조 |
| 추적 검사 부담 | 시간·교통·체력 | 일정 유연화·교통비 지원 |
| 의료진 신뢰 부족 | 정보 비대칭 | 임상의의 직접 설명 (전화 follow-up) |
| 가족 동의 부재 | 한국·일본 등 가족 의사결정 문화 | 가족 동반 상담 |
반사실: 만약 동의 절차를 5 분 → 30 분으로 늘리고, 임상의가 직접 설명하며, 가족과 함께 결정하게 한다면? 행동 경제학·임상 경험 모두 \(C/B\) 가 30% → 60% 로 두 배 증가할 가능성을 시사한다. 이는 Cochrane 4 전략 (전화 contact·인센티브 등) 의 메커니즘이기도 하다 (다음 글에서 깊게).
5.5 진단 매트릭스
| Eligibility \(B/A\) | Enrolment \(C/B\) | 진단 — 어디가 막혔는가 | 처방 |
|---|---|---|---|
| 낮음 (예: 30%) | 높음 (예: 90%) | 적격 기준이 너무 엄격 — 외래 환자 대부분이 떨어짐 | 적격 기준 완화 (효과 vs 외적 타당도 trade-off 평가) |
| 높음 (예: 80%) | 낮음 (예: 30%) | 동의 거부 다수 — 정보 비대칭·신뢰 부족·시간 부담 | 동의 절차 단순화·전화 follow-up·인센티브 |
| 둘 다 낮음 | 깔때기 전반 부실 — 모집 채널·홍보·연구자 동기 문제 | 모집 전략 전면 재설계 | |
| 둘 다 높음 | 정상 — 단, 일반화 가능성 점검 (cherry-picking 위험) | 진행 + run-in / enrichment 의도적 사용 여부 점검 |
반사실 — 두 시험 비교:
시험 X: \(B/A = 80\%, C/B = 30\%\) → \(C/A = 24\%\)
시험 Y: \(B/A = 30\%, C/B = 90\%\) → \(C/A = 27\%\)
두 시험의 최종 등록률은 비슷하지만 (24% vs 27%), 처방은 정반대다. 시험 X 에는 동의 절차 개선을, 시험 Y 에는 기준 완화를 적용해야 한다. 분수를 단계별로 측정하지 않으면 wrong intervention 이 적용된다.
6 Gross 외 (2002) — 172 개 RCT 의 실증 분포
Gross, Mallory, Heiat, Krumholz (2002) 가 Annals of Internal Medicine 에 발표한 분석은 172 개 RCT 보고서를 검토하여 모집 보고의 실태를 정량화했다 (Schulz & Grimes, 2019, Ch.10 인용).
| 지표 | 중앙값 | 사분위 범위 (IQR) |
|---|---|---|
| 한 명 등록을 위한 심사 수 | 1.8 | 1 ~ 68 |
| Eligibility fraction \(B/A\) | 65% | 41~82% |
| Enrolment fraction \(C/B\) | 93% | 79~100% |
| Recruitment fraction \(C/A\) | 54% | 32~77% |
이 표는 두 가지 충격을 준다.
6.1 충격 1: 보고 자체가 불충분
172 개 시험 중 다수가 이 분수들을 계산할 정보조차 보고하지 않았다. 외적 타당도를 판단할 수 없는 시험이 출판된다는 뜻이다.
so what: 메타분석가·임상 가이드라인 작성자·정책 결정자는 “이 시험 결과를 어느 환자에게 적용할 수 있는가?” 를 알아야 한다. 분수 보고가 없으면 답할 수 없다. CONSORT flow diagram 이 권장되는 이유.
6.2 충격 2: 1.8 ~ 68 의 거대한 범위
한 명 등록을 위한 심사 수 (recruitment fraction 의 역수) 가 시험마다 1.8 명 ~ 68 명. 즉 어떤 시험은 매우 효율적 (한 명 심사하면 한 명 등록), 어떤 시험은 극도로 비효율적 (68 명 심사해야 한 명 등록) 이다.
숫자 일상어 번역: 1.8 명 심사 = “마트 시식대에서 시식자 1 명 안내하기 위해 두 명에게만 말 걸면 됨”. 68 명 심사 = “광고 전단을 68 장 돌려야 한 명 시식”. 이 두 시험의 모집 인력 부담은 38 배 차이.
6.3 충격 3: \(C/B = 93\%\) 중앙값
대부분 시험에서 적격자 중 동의율은 매우 높다 (중앙값 93%). 즉 모집 부진의 주범은 Enrolment fraction 보다 Eligibility fraction 일 가능성이 더 크다.
반사실: 만약 Eligibility fraction 의 중앙값이 65% 가 아니라 30% 라면 Recruitment fraction 도 비례해 떨어진다. 적격 기준의 엄격함이 모집 부진의 가장 큰 단일 원인이다. 동의 절차 개선보다 적격 기준 완화의 marginal return 이 클 수 있다는 함의다.
단, 주의: Gross 분석에서 \(C/B\) 가 100% 인 보고가 20 건 있었다. 이는 “거부자를 부적격(ineligible) 으로 재분류한 보고 관행” 일 가능성이 있다. 즉 진짜 동의율은 더 낮을 수 있다. CONSORT flow diagram 의 강제 보고가 이런 왜곡을 줄인다.
7 CONSORT Flow Diagram — 표준 보고 양식
CONSORT 2010 (Schulz, Altman, Moher 외) 은 RCT 보고의 국제 표준이다 (Ch.22 에서 깊이 다룸). 그 핵심에 flow diagram 이 있다.
Assessed for eligibility (n=...)
│
┌──────────┴──────────┐
│ │
Excluded (n=...) │
- Not meeting criteria
- Declined to participate
- Other reasons
│
Randomised (n=...)
│
┌───────────────┴───────────────┐
│ │
Allocated to intervention (n=...) Allocated to control (n=...)
- Received intervention - Received control
- Did not receive - Did not receive
│ │
Lost to follow-up (n=...) Lost to follow-up (n=...)
Discontinued (n=...) Discontinued (n=...)
│ │
Analysed (n=...) Analysed (n=...)
이 다이어그램은 모든 단계의 환자 수를 보고하도록 강제 한다. 이로써 독자가 직접 분수들을 계산할 수 있고, 모집·유지·분석의 외적 타당도를 평가할 수 있다.
so what: CONSORT flow 가 잘 보고된 시험은 “이 결과는 어느 환자에 적용 가능한가?” 에 대해 정량적 답을 제공한다. 보고가 없으면 그 답이 불가능하다. 의학 학술지 다수가 CONSORT 준수를 게재 조건으로 삼는 이유다.
8 IT / 디지털 실험 매핑 — Funnel 분석의 동형
RCT 의 모집 분수는 IT A/B 테스트의 funnel analysis 와 정확히 동형이다.
| 역학 (RCT) | IT (A/B Test / Marketing) |
|---|---|
| Approached → Eligible 전환율 | Visitor → Qualified Lead 전환율 |
| Eligible → Enrolled 전환율 | Qualified Lead → Customer 전환율 |
| Recruitment fraction \(C/A\) | Overall conversion rate |
| 적격 기준 좁힘으로 \(B/A\) 감소 | Targeting 좁힘으로 segment match 감소 |
| 동의 절차 개선으로 \(C/B\) 증가 | Checkout UX 개선으로 conversion 증가 |
| Lasagna 80 배·Muench 10 배 보정 | “광고 노출 → 실제 구매 1~10%” 마케팅 경험칙 |
| π 규칙 (3 배 기간) | “프로젝트 일정은 1.5~3 배 잡으라” 소프트웨어 경험칙 |
왜 동형인가?: 두 영역 모두 다단계 funnel 의 곱셈적 손실 을 다루기 때문이다. 인간 의사결정의 단계별 거부 패턴은 의료든 마케팅이든 비슷한 구조를 가진다 (정보 비대칭·시간 압박·신뢰·인센티브). 따라서 동일한 진단·처방 도구가 동작한다.
8.1 IT 의 funnel 진단 도구
IT 실험 플랫폼에서 분수 진단은 보통 다음과 같이 자동화된다.
- Exposure logging — 실험 진입점 도달 사용자 수 (\(A\))
- Eligibility evaluation — feature flag 평가 통과 사용자 수 (\(B\))
- Assignment — 처치/대조군 할당 사용자 수 (\(C\))
- SRM check — \(C/B\) 가 처치/대조에서 다르면 경보
이 자동화 덕분에 IT 실험은 임상 RCT 보다 funnel 진단이 훨씬 빠르다. 그러나 분수 자체의 의미와 trade-off 는 동일 하다.
9 코드 예시 — Funnel 진단 시뮬레이션
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
# Lasagna 일화 단계별 분해
stages = [
("외과 환자 전체", 1.00),
("시험 대상 수술", 0.50),
("동반 질환 없음", 0.50),
("연구자 가용 시간", 0.30),
("인지 상태", 0.50),
("동의 시간 여유", 0.70),
("본인 동의", 0.50),
]
N0 = 8000
n_stage = N0
print(f"{'단계':<20} {'통과율':>8} {'누적':>8}")
for name, p in stages:
n_stage *= p
print(f"{name:<20} {p:>8.0%} {n_stage:>8.0f}")
print(f"\n예상 등록 ≈ {n_stage:.0f} (Lasagna 보고 100 명과 일치)")
# Muench 1/10 의 자연성 — 단계별 통과율 변화
print("\n[Muench 1/10 의 자연성]")
print(f"{'단계 수':>6} {'p=0.6':>8} {'p=0.7':>8} {'p=0.8':>8}")
for k in range(3, 8):
print(f"{k:>6} {0.6**k:>8.1%} {0.7**k:>8.1%} {0.8**k:>8.1%}")
# π 규칙 — 세 지연 요인 곱
ramp_up = 1.5
seasonal = 1.3
long_tail = 1.5
total_delay = ramp_up * seasonal * long_tail
print(f"\nπ 규칙 = {ramp_up} × {seasonal} × {long_tail} = {total_delay:.2f} ≈ π")
print(f"개도국 ($2π$) = {total_delay * 2:.2f} ≈ 2π")
# Fraction 진단 매트릭스
print("\n[진단 매트릭스 — 두 시험 비교]")
trials = [
("X (적격 다수, 동의 부족)", 0.80, 0.30),
("Y (적격 부족, 동의 다수)", 0.30, 0.90),
]
for name, ba, cb in trials:
ca = ba * cb
print(f"{name}: B/A={ba:.0%}, C/B={cb:.0%}, C/A={ca:.0%}")
# Gross 외 (2002) 분포 시뮬레이션
np.random.seed(42)
N_trials = 172
ba_dist = np.random.beta(2, 1, N_trials) * 0.7 + 0.3 # 30~100%
cb_dist = np.random.beta(5, 1, N_trials) * 0.5 + 0.5 # 50~100%
ca_dist = ba_dist * cb_dist
print(f"\n[Gross 외 (2002) 분포 시뮬레이션]")
print(f"B/A 중앙값: {np.median(ba_dist):.1%} (관측: 65%)")
print(f"C/B 중앙값: {np.median(cb_dist):.1%} (관측: 93%)")
print(f"C/A 중앙값: {np.median(ca_dist):.1%} (관측: 54%)")
# 한 명 등록을 위한 심사 수
inv_ca = 1 / ca_dist
print(f"심사 수 중앙값: {np.median(inv_ca):.1f} (관측: 1.8)")
print(f"심사 수 IQR: {np.percentile(inv_ca, 25):.1f} ~ {np.percentile(inv_ca, 75):.1f}")이 코드는 (1) Lasagna 의 80 배가 곱셈 funnel 의 결과임을, (2) Muench 의 1/10 이 단계별 통과율의 자연 누적임을, (3) π 규칙이 세 지연 요인 곱임을, (4) 진단 매트릭스의 처방 분기를, (5) Gross 외의 실증 분포를 한 번에 보여준다.
10 결론 — 정량화의 핵심 메시지
모집은 측정 가능하다. 그러나 측정하지 않으면 보정할 수 없다.
세 가지 경험 법칙 (Lasagna 80·Muench 10·π) 은 총량과 기간의 비관적 보정 도구다. 세 가지 분수 (\(B/A, C/B, C/A\)) 는 어디가 막혔는지 진단 도구다. 두 도구를 함께 쓰면 신청서 단계의 추정·중간 점검·사후 보고 모두에 적용 가능하다.
핵심은 다음 세 가지 행동이다.
- 신청서 단계 — Lasagna · Muench 보정과 π 규칙을 추정치 옆에 함께 적어두기
- 중간 점검 단계 — Eligibility/Enrolment fraction 을 분기마다 측정해 깔때기 어디가 막혔는지 진단
- 보고 단계 — CONSORT flow diagram 으로 모든 단계의 환자 수를 보고
이 세 행동이 정착되어야 모집 부진이 진단 가능한 문제 가 된다. 다음 글에서는 이 진단을 바탕으로 실제 개선 전략 (Zelen · cmRCT · Cochrane 4 전략) 을 다룬다.
11 관련 주제
선행 지식
- RCT 모집의 현실 — Ch.10 개관 — 본 글의 큰 그림
- RCT 와 A/B 테스트의 설계 원칙 — RCT 5 요소
- 표본 크기와 검정력 — sample size 계산의 IT 버전
Phase C 후속 글
- 모집 개선 전략 — Ch.10.2 — Zelen · cmRCT · Cochrane 4 전략
- CONSORT 보고 지침 — Ch.22 시리즈 — flow diagram 의 표준화
다른 카테고리 연결
- Engineering 카테고리 — 실험 플랫폼의 funnel logging (placeholder)
- Surveilance 카테고리 — FDA 의 CONSORT-like 보고 요구 (placeholder)
12 참고문헌
- Schulz, K. F. & Grimes, D. A. (2019). Essential Concepts in Clinical Research (2nd ed.), Ch.10. Elsevier.
- Lasagna, L. (1979). Problems in publication of clinical trial methodology. Clin. Pharmacol. Ther. 25, 751-753.
- Ederer, F. (1975). Practical problems in collaborative clinical trials. Am. J. Epidemiol. 102, 111-118.
- Gross, C. P., Mallory, R., Heiat, A., Krumholz, H. M. (2002). Reporting the recruitment process in clinical trials: who are these patients and how did they get there? Ann. Intern. Med. 137, 10-16.
- Schulz, K. F., Altman, D. G., Moher, D., CONSORT Group. (2010). CONSORT 2010 statement: updated guidelines for reporting parallel group randomised trials. BMJ 340, c332.