Kwangmin Kim - RCT 모집 어려움의 정량화 — Lasagna · Muench · π

이 글은 Schulz & Grimes (2019) Ch.10 의 두 번째 글이다. Ch.10 개관 에서 제시한 큰 그림 중 모집 어려움의 정량화 부분 (Schulz full md L:17401~17800) 을 깊이 다룬다. 다음 글 C-SCH10-2 에서는 개선 전략을 다룬다.

1 진입 직관 — 왜 정량화가 중요한가

RCT 신청서에 “12 개월 내 500 명 모집” 이라고 적힌 추정치를 그대로 믿으면, 5 시험 중 4 개는 출발선에서 좌초한다 (UK 31% 도달률). 그렇다고 “그냥 더 많이 잡아두자” 식의 막연한 보정도 해롭다. 자금 신청에서 과대 산정은 신뢰를 잃고, 과소 산정은 시험 자체가 불가능해진다.

핵심 질문: 얼마나 보정해야 하는가? 그리고 그 보정의 어떤 부분이 가장 큰 손실을 만드는가?

이 질문에 답하기 위해 Schulz Ch.10 은 두 종류의 도구를 제공한다.

경험 법칙 (Rules of Thumb) — Lasagna 법칙·Muench 제3법칙·π 규칙 → 최종 모집 수와 기간의 비관적 보정 배율
단계별 분수 (Stage-wise Fractions) — Eligibility · Enrolment · Recruitment fraction → 깔때기의 어디가 막혔는지 진단

전자는 “얼마나 적게 / 얼마나 늦게” 를, 후자는 “왜 / 어디서” 를 답한다. 두 도구는 보완적이다.

2 Lasagna 법칙 — 8000 → 100 의 단계별 분해

2.1 일화의 배경

1979 년 Louis Lasagna (임상 약리학 선구자) 가 보고한 단회 진통제 시험 일화다 (Schulz & Grimes, 2019, Ch.10, Lasagna 1979 인용).

모집 기간 중 외과 서비스에는 8000 명 이상의 수술 환자가 있었지만, 실제로 등록된 사람은 100 명에 불과했다.

연구자는 사전에 “한 달 200 명 모집 가능” 으로 추정했지만, 실제로는 80 분의 1 만 등록되었다. 이 거대한 격차가 “Lasagna 법칙” 으로 임상시험계에 회자되었다.

2.2 왜 80 분의 1 인가? — 단계별 손실 분해

8000 명이 100 명으로 줄어드는 과정은 단일 거부 가 아니라 다단계 funnel 의 곱셈적 손실이다. Schulz 의 단편적 서술과 Lasagna 원문을 종합하면 대략 다음과 같이 분해된다.

단계	설명	통과율 (추정)	누적
8000 명	외과 서비스 전체 환자	-	8000
시험 대상 수술 종류	진통제 시험 가능한 통증 유형 (예: 골절·복부수술)	50%	4000
동반 질환 없음	기존 진통제 알러지·간기능 저하 등 배제	50%	2000
연구자 가용 시간대	연구자가 깨어 있고 병동 방문 가능 시간	30%	600
인지 상태	통증 평가가 가능한 의식 수준 (마취 회복 후)	50%	300
동의 권유 시간	수술 후 동의서 받을 시간 여유	70%	210
본인 동의	무작위 배정 + 진통제 미상에 대한 동의	50%	105

각 단계의 통과율은 그럴듯해 보인다 — 30~70%. 그러나 이 일곱 단계의 곱셈 은 다음과 같다.

\[ 0.5 \times 0.5 \times 0.3 \times 0.5 \times 0.7 \times 0.5 \approx 0.013 \]

즉 약 1.3% 만 최종 등록. \(8000 \times 0.013 = 104 \approx 100\).

수식 직관: 인간의 직관은 합산 으로 손실을 추정하는 데 익숙하지만, 다단계 funnel 은 곱셈 으로 손실이 누적된다. “각 단계에서 30~50% 손실, 합쳐서 50% 손실 정도?” 라는 직관은 완전히 틀린다. 5~7 단계의 50~70% 통과는 1~5% 만 옥상에 도달 시킨다. 80 배라는 격차는 마법이 아니라 곱셈의 자연스러운 결과 다.

반사실 — 단계 하나만 줄여도: 만약 위 분해에서 “연구자 가용 시간대” 30% 를 60% 로 끌어올리면 (예: 24 시간 모집 인력 배치) 최종 등록이 100 → 200 명 으로 두 배 증가. 또는 “본인 동의” 50% 를 70% 로 (전화 follow-up·인센티브 추가) 하면 100 → 140 명. 단일 병목을 찾아 깰 수 있다면 효과가 곱셈적으로 커진다.

2.3 80 의 의미 — 정확성보다 충격

Lasagna 의 “80 배” 는 정밀한 숫자가 아니다. 단지 “연구자의 추정이 1~2 자릿수 단위로 부풀려져 있을 수 있다” 는 경고다. 이 경고를 내면화하는 것이 신청서 작성·자금 산정·기간 추정의 출발점이다.

실무 적용: 신청서에 “한 달 200 명 모집 가능” 이라고 쓴 직후, 즉시 “Lasagna 보정: 80 으로 나누면 한 달 2.5 명, 즉 12 개월 30 명” 을 적어두면 자기 검증이 된다. 두 추정치가 너무 다르면 어느 쪽 가정이 어디서 깨졌는지 단계별로 추적 가능하다.

3 Muench 제3법칙 — 왜 1/10 이 자연수처럼 등장하는가

3.1 정의와 출처

Ederer (1975) 가 임상 시험계의 농담 같은 격언을 정리한 것이다.

\[ N_\text{realistic} = \frac{N_\text{estimated}}{10} \]

연구자가 추정하는 모집 가능 환자 수를 10 으로 나누면 더 현실적인 값이 된다.

Lasagna 의 80 배보다 보수적이지만, 신청서 단계의 1 차 보정으로 충분하다는 것이 임상시험계의 경험칙이다.

3.2 왜 하필 10 인가? — 곱셈 funnel 의 자연스러운 누적률

Lasagna 분해에서 보았듯, 5 단계의 50~70% 통과 는 다음과 같이 누적된다.

\[ 0.6^5 \approx 0.078, \qquad 0.7^5 \approx 0.168 \]

즉 5 단계 funnel 은 평균 8~17% 의 누적 도달률을 가진다. 이 범위의 중앙값이 1/10 근처에 안착한다. 즉 Muench 제3법칙은 마법이 아니라 전형적 5 단계 funnel 의 통계적 평균 이다.

수식 직관: 만약 각 단계의 통과율이 동일한 \(p\) 이고 단계 수가 \(k\) 라면 누적 도달률은 \(p^k\). 다음 표가 의미하는 바는 단순하다.

단계 수 \(k\) 단계별 통과 60% 단계별 통과 70% 단계별 통과 80%

3 21.6% 34.3% 51.2%

4 13.0% 24.0% 41.0%

5 7.8% 16.8% 32.8%

6 4.7% 11.8% 26.2%

7 2.8% 8.2% 21.0%

5~6 단계의 60~70% 통과 funnel 의 누적 도달률은 5~17% 범위. 이 중앙값이 약 10%, 즉 1/10. Muench 의 10 은 인간 행동 funnel 의 자연 상수다.

단계 수 \(k\)	단계별 통과 60%	단계별 통과 70%	단계별 통과 80%
3	21.6%	34.3%	51.2%
4	13.0%	24.0%	41.0%
5	7.8%	16.8%	32.8%
6	4.7%	11.8%	26.2%
7	2.8%	8.2%	21.0%

3.3 Lasagna (80) 와 Muench (10) 의 차이

두 법칙이 다른 배율을 제시하는 이유는 단계 수와 단계별 거부율의 차이 다.

Muench 1/10: 5 단계, 단계별 약 60% 통과 (덜 까다로운 시험)
Lasagna 1/80: 7 단계, 단계별 약 50% 통과 (수술 환자 + 단회 진통제처럼 시간 압박이 큰 시험)

실무 권고: 시험의 모집 funnel 단계 수와 각 단계 거부율을 사전에 추정해보면, 1/10 ~ 1/80 사이 어느 보정 배율이 자기 시험에 맞는지 가늠할 수 있다. 단순 진통제 시험은 1/10 가까이, 침습적·장기 추적 시험은 1/80 에 가깝다.

4 π 규칙 — 모집 기간의 비관적 보정

4.1 정의

\[ T_\text{actual} \approx \pi \cdot T_\text{planned} \]

계획한 모집 기간에 약 3.14 를 곱하면 실제 소요 기간에 근접한다. 개도국 등 물류 도전 환경에서는 \(2\pi\) 를 곱한다 (Schulz & Grimes, 2019, Ch.10).

4.2 왜 π 인가? — 세 가지 지연 요인의 곱

π 는 정확한 수학 상수가 아니라 “약 3 배” 를 부르는 문학적 표현이다. 실제 모집 지연은 다음 세 가지 곱셈적 지연 요인 이 누적된 결과다.

4.2.1 1. 램프 업 지연 (Ramp-up Delay) — 약 1.5 배

첫 환자 등록까지 IRB 승인·인력 훈련·서류 준비·시스템 설정에 예상보다 50% 더 걸린다. 신청서가 “1 개월 내 시작” 이라고 적었어도 실제 첫 환자는 보통 2~3 개월 후에 등록된다.

비유: 새 식당 오픈일을 정해놓아도 인테리어·인허가·인력 채용에 보통 50% 더 걸리는 것과 같다.

4.2.2 2. 분기별 변동 (Seasonal Variability) — 약 1.3 배

휴가·명절·인플루엔자 시즌 등으로 일부 분기는 모집이 거의 0 이다. 평균적으로 4 분기 중 1~1.5 분기가 “잃어버린 분기” 가 되며, 이는 전체 기간을 약 30% 늘린다.

사례: 12 월~1 월 (연말 연시), 7 월~8 월 (휴가), 학회 기간 (5 월·10 월) 등이 합쳐지면 1 년 중 3~4 개월은 모집이 정체된다.

4.2.3 3. 꼬리 길이 (Long Tail) — 약 1.5 배

마지막 환자 모집은 처음보다 2~3 배 느리다. 쉬운 적격자는 초기에 등록되고, 후기에는 까다로운 케이스만 남는다. 예상의 80% 까지 도달하는 시간보다 마지막 20% 를 채우는 시간이 더 길다.

수식: Pareto-like 분포에서 80% 까지 시간 = \(T_{80}\), 100% 까지 시간 = \(T_{100} \approx 1.5 \cdot T_{80}\). 이는 의료 모집뿐 아니라 소프트웨어 버그 픽스, 마케팅 캠페인 도달 등 다양한 영역에서 관측되는 현상이다.

4.2.4 곱하면 π

\[ 1.5 \times 1.3 \times 1.5 = 2.925 \approx \pi \]

세 지연 요인의 곱이 자연스럽게 π 근처에 떨어진다. 이것이 Schulz 의 “π 규칙” 의 수학적 직관이다. 개도국에서 \(2\pi\) 가 되는 이유는 물류·통신·규제 라는 추가 요인이 한 단계 더 곱해지기 때문이다 (\(\approx 1.5 \times 1.3 \times 1.5 \times 2 \approx 5.85 \approx 2\pi\)).

실무 적용: 신청서에 “12 개월 내 500 명” 이라고 적었다면, 즉시 “π 보정: 약 38 개월 = 3 년 2 개월” 을 사이드 노트로 적어두자. 이 두 값을 자금 기관에 동시 제시하면 (1) 자기 검증, (2) 후속 연장 요청의 근거, (3) 다단계 모집 전략 설계 에 모두 도움이 된다.

5 단계별 분수 — 깔때기의 어디가 막혔는가

세 가지 경험 법칙은 총량 과 기간 의 보정 배율을 제공하지만, 어느 단계가 문제인지 는 알려주지 않는다. 그 진단을 위해 Schulz 는 세 가지 분수 (fraction) 를 도입한다.

5.1 정의 재확인

A: Approached (잠재 참여자 — 접근됨)
        ↓ Eligibility screening
B: Eligible (적격 — 의학적 기준 충족)
        ↓ Informed consent
C: Enrolled (등록됨 — 동의 후 실제 참여)

\[ \text{Eligibility fraction} = \frac{B}{A}, \qquad \text{Enrolment fraction} = \frac{C}{B}, \qquad \text{Recruitment fraction} = \frac{C}{A} = \frac{B}{A} \cdot \frac{C}{B} \]

세 분수의 관계는 단순한 곱셈이지만, 각 분수가 다른 인과 책임자 를 가리킨다는 점이 핵심이다.

5.2 책임 분담

분수	직접 책임자	일상어 비유
\(B/A\) Eligibility fraction	연구 설계자 — 적격 기준 작성자	콘서트 입장 자격 (나이·티켓 종류)
\(C/B\) Enrolment fraction	연구 인력 — 동의 절차 운영자	매표소 직원의 친절·설명 능력
\(C/A\) Recruitment fraction	두 책임의 곱	광고 본 사람 중 실제 입장한 비율

5.3 Eligibility Fraction 깊이 — 적격 기준의 trade-off

\(B/A\) 가 낮은 시험 (예: 30%) 은 적격 기준이 좁은 시험이다.

장점 — 동질한 표본 → 처치 효과의 분산 감소 → 검정력 증가
단점 — 외적 타당도 손실 → 결과를 일반 환자에 적용 불가

반사실: 만약 한 항암 시험이 “ECOG 0~1 + 신기능 정상 + 동반 질환 없음 + 18~65 세” 로 적격을 좁히면 \(B/A = 20\%\) 정도로 떨어질 수 있다. 결과 “60% 반응” 이 나와도 일반 진료에서 같은 약을 처방하면 ECOG 2~3, 신기능 저하, 노인 환자가 다수라 반응률이 30~40% 로 낮아질 수 있다. Eligibility fraction 의 낮음은 결과의 외적 타당도를 직접 제약 한다.

실무 권고: 적격 기준의 각 항목이 “\(B/A\) 를 얼마나 줄이는가” 를 사전에 모의 측정한다. “이 기준 하나로 적격자가 30% 줄어든다면, 그만한 가치가 있는가?” 를 물어야 한다.

5.4 Enrolment Fraction 깊이 — 동의의 행동학

\(C/B\) 가 낮은 시험 (예: 30%) 은 적격자 중 다수가 동의를 거부하는 시험이다. 이는 연구 인력의 행동 디자인 영역이다.

거부의 흔한 이유:

이유	메커니즘	처방
동의서가 너무 길다	인지 부담·이해 실패	단순화·시각화·구두 설명 보강
무작위 배정에 대한 거부감	“내가 어느 군에 갈지 모름”	시험 목적의 재설명, equipoise 강조
추적 검사 부담	시간·교통·체력	일정 유연화·교통비 지원
의료진 신뢰 부족	정보 비대칭	임상의의 직접 설명 (전화 follow-up)
가족 동의 부재	한국·일본 등 가족 의사결정 문화	가족 동반 상담

반사실: 만약 동의 절차를 5 분 → 30 분으로 늘리고, 임상의가 직접 설명하며, 가족과 함께 결정하게 한다면? 행동 경제학·임상 경험 모두 \(C/B\) 가 30% → 60% 로 두 배 증가할 가능성을 시사한다. 이는 Cochrane 4 전략 (전화 contact·인센티브 등) 의 메커니즘이기도 하다 (다음 글에서 깊게).

5.5 진단 매트릭스

Eligibility \(B/A\)	Enrolment \(C/B\)	진단 — 어디가 막혔는가	처방
낮음 (예: 30%)	높음 (예: 90%)	적격 기준이 너무 엄격 — 외래 환자 대부분이 떨어짐	적격 기준 완화 (효과 vs 외적 타당도 trade-off 평가)
높음 (예: 80%)	낮음 (예: 30%)	동의 거부 다수 — 정보 비대칭·신뢰 부족·시간 부담	동의 절차 단순화·전화 follow-up·인센티브
둘 다 낮음		깔때기 전반 부실 — 모집 채널·홍보·연구자 동기 문제	모집 전략 전면 재설계
둘 다 높음		정상 — 단, 일반화 가능성 점검 (cherry-picking 위험)	진행 + run-in / enrichment 의도적 사용 여부 점검

반사실 — 두 시험 비교:

시험 X: \(B/A = 80\%, C/B = 30\%\) → \(C/A = 24\%\)

시험 Y: \(B/A = 30\%, C/B = 90\%\) → \(C/A = 27\%\)

두 시험의 최종 등록률은 비슷하지만 (24% vs 27%), 처방은 정반대다. 시험 X 에는 동의 절차 개선을, 시험 Y 에는 기준 완화를 적용해야 한다. 분수를 단계별로 측정하지 않으면 wrong intervention 이 적용된다.

6 Gross 외 (2002) — 172 개 RCT 의 실증 분포

Gross, Mallory, Heiat, Krumholz (2002) 가 Annals of Internal Medicine 에 발표한 분석은 172 개 RCT 보고서를 검토하여 모집 보고의 실태를 정량화했다 (Schulz & Grimes, 2019, Ch.10 인용).

지표	중앙값	사분위 범위 (IQR)
한 명 등록을 위한 심사 수	1.8	1 ~ 68
Eligibility fraction \(B/A\)	65%	41~82%
Enrolment fraction \(C/B\)	93%	79~100%
Recruitment fraction \(C/A\)	54%	32~77%

이 표는 두 가지 충격을 준다.

6.1 충격 1: 보고 자체가 불충분

172 개 시험 중 다수가 이 분수들을 계산할 정보조차 보고하지 않았다. 외적 타당도를 판단할 수 없는 시험이 출판된다는 뜻이다.

so what: 메타분석가·임상 가이드라인 작성자·정책 결정자는 “이 시험 결과를 어느 환자에게 적용할 수 있는가?” 를 알아야 한다. 분수 보고가 없으면 답할 수 없다. CONSORT flow diagram 이 권장되는 이유.

6.2 충격 2: 1.8 ~ 68 의 거대한 범위

한 명 등록을 위한 심사 수 (recruitment fraction 의 역수) 가 시험마다 1.8 명 ~ 68 명. 즉 어떤 시험은 매우 효율적 (한 명 심사하면 한 명 등록), 어떤 시험은 극도로 비효율적 (68 명 심사해야 한 명 등록) 이다.

숫자 일상어 번역: 1.8 명 심사 = “마트 시식대에서 시식자 1 명 안내하기 위해 두 명에게만 말 걸면 됨”. 68 명 심사 = “광고 전단을 68 장 돌려야 한 명 시식”. 이 두 시험의 모집 인력 부담은 38 배 차이.

6.3 충격 3: \(C/B = 93\%\) 중앙값

대부분 시험에서 적격자 중 동의율은 매우 높다 (중앙값 93%). 즉 모집 부진의 주범은 Enrolment fraction 보다 Eligibility fraction 일 가능성이 더 크다.

반사실: 만약 Eligibility fraction 의 중앙값이 65% 가 아니라 30% 라면 Recruitment fraction 도 비례해 떨어진다. 적격 기준의 엄격함이 모집 부진의 가장 큰 단일 원인이다. 동의 절차 개선보다 적격 기준 완화의 marginal return 이 클 수 있다는 함의다.

단, 주의: Gross 분석에서 \(C/B\) 가 100% 인 보고가 20 건 있었다. 이는 “거부자를 부적격(ineligible) 으로 재분류한 보고 관행” 일 가능성이 있다. 즉 진짜 동의율은 더 낮을 수 있다. CONSORT flow diagram 의 강제 보고가 이런 왜곡을 줄인다.

7 CONSORT Flow Diagram — 표준 보고 양식

CONSORT 2010 (Schulz, Altman, Moher 외) 은 RCT 보고의 국제 표준이다 (Ch.22 에서 깊이 다룸). 그 핵심에 flow diagram 이 있다.

         Assessed for eligibility (n=...)
                    │
         ┌──────────┴──────────┐
         │                     │
  Excluded (n=...)            │
   - Not meeting criteria
   - Declined to participate
   - Other reasons
                              │
                  Randomised (n=...)
                              │
              ┌───────────────┴───────────────┐
              │                               │
   Allocated to intervention (n=...)   Allocated to control (n=...)
   - Received intervention             - Received control
   - Did not receive                   - Did not receive
              │                               │
   Lost to follow-up (n=...)           Lost to follow-up (n=...)
   Discontinued (n=...)                Discontinued (n=...)
              │                               │
   Analysed (n=...)                    Analysed (n=...)

이 다이어그램은 모든 단계의 환자 수를 보고하도록 강제 한다. 이로써 독자가 직접 분수들을 계산할 수 있고, 모집·유지·분석의 외적 타당도를 평가할 수 있다.

so what: CONSORT flow 가 잘 보고된 시험은 “이 결과는 어느 환자에 적용 가능한가?” 에 대해 정량적 답을 제공한다. 보고가 없으면 그 답이 불가능하다. 의학 학술지 다수가 CONSORT 준수를 게재 조건으로 삼는 이유다.

8 IT / 디지털 실험 매핑 — Funnel 분석의 동형

RCT 의 모집 분수는 IT A/B 테스트의 funnel analysis 와 정확히 동형이다.

역학 (RCT)	IT (A/B Test / Marketing)
Approached → Eligible 전환율	Visitor → Qualified Lead 전환율
Eligible → Enrolled 전환율	Qualified Lead → Customer 전환율
Recruitment fraction \(C/A\)	Overall conversion rate
적격 기준 좁힘으로 \(B/A\) 감소	Targeting 좁힘으로 segment match 감소
동의 절차 개선으로 \(C/B\) 증가	Checkout UX 개선으로 conversion 증가
Lasagna 80 배·Muench 10 배 보정	“광고 노출 → 실제 구매 1~10%” 마케팅 경험칙
π 규칙 (3 배 기간)	“프로젝트 일정은 1.5~3 배 잡으라” 소프트웨어 경험칙

왜 동형인가?: 두 영역 모두 다단계 funnel 의 곱셈적 손실 을 다루기 때문이다. 인간 의사결정의 단계별 거부 패턴은 의료든 마케팅이든 비슷한 구조를 가진다 (정보 비대칭·시간 압박·신뢰·인센티브). 따라서 동일한 진단·처방 도구가 동작한다.

8.1 IT 의 funnel 진단 도구

IT 실험 플랫폼에서 분수 진단은 보통 다음과 같이 자동화된다.

Exposure logging — 실험 진입점 도달 사용자 수 (\(A\))
Eligibility evaluation — feature flag 평가 통과 사용자 수 (\(B\))
Assignment — 처치/대조군 할당 사용자 수 (\(C\))
SRM check — \(C/B\) 가 처치/대조에서 다르면 경보

이 자동화 덕분에 IT 실험은 임상 RCT 보다 funnel 진단이 훨씬 빠르다. 그러나 분수 자체의 의미와 trade-off 는 동일 하다.

9 코드 예시 — Funnel 진단 시뮬레이션

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

# Lasagna 일화 단계별 분해
stages = [
    ("외과 환자 전체", 1.00),
    ("시험 대상 수술", 0.50),
    ("동반 질환 없음", 0.50),
    ("연구자 가용 시간", 0.30),
    ("인지 상태", 0.50),
    ("동의 시간 여유", 0.70),
    ("본인 동의", 0.50),
]

N0 = 8000
n_stage = N0
print(f"{'단계':<20} {'통과율':>8} {'누적':>8}")
for name, p in stages:
    n_stage *= p
    print(f"{name:<20} {p:>8.0%} {n_stage:>8.0f}")
print(f"\n예상 등록 ≈ {n_stage:.0f} (Lasagna 보고 100 명과 일치)")

# Muench 1/10 의 자연성 — 단계별 통과율 변화
print("\n[Muench 1/10 의 자연성]")
print(f"{'단계 수':>6} {'p=0.6':>8} {'p=0.7':>8} {'p=0.8':>8}")
for k in range(3, 8):
    print(f"{k:>6} {0.6**k:>8.1%} {0.7**k:>8.1%} {0.8**k:>8.1%}")

# π 규칙 — 세 지연 요인 곱
ramp_up = 1.5
seasonal = 1.3
long_tail = 1.5
total_delay = ramp_up * seasonal * long_tail
print(f"\nπ 규칙 = {ramp_up} × {seasonal} × {long_tail} = {total_delay:.2f} ≈ π")
print(f"개도국 ($2π$) = {total_delay * 2:.2f} ≈ 2π")

# Fraction 진단 매트릭스
print("\n[진단 매트릭스 — 두 시험 비교]")
trials = [
    ("X (적격 다수, 동의 부족)", 0.80, 0.30),
    ("Y (적격 부족, 동의 다수)", 0.30, 0.90),
]
for name, ba, cb in trials:
    ca = ba * cb
    print(f"{name}: B/A={ba:.0%}, C/B={cb:.0%}, C/A={ca:.0%}")

# Gross 외 (2002) 분포 시뮬레이션
np.random.seed(42)
N_trials = 172
ba_dist = np.random.beta(2, 1, N_trials) * 0.7 + 0.3   # 30~100%
cb_dist = np.random.beta(5, 1, N_trials) * 0.5 + 0.5   # 50~100%
ca_dist = ba_dist * cb_dist

print(f"\n[Gross 외 (2002) 분포 시뮬레이션]")
print(f"B/A 중앙값: {np.median(ba_dist):.1%} (관측: 65%)")
print(f"C/B 중앙값: {np.median(cb_dist):.1%} (관측: 93%)")
print(f"C/A 중앙값: {np.median(ca_dist):.1%} (관측: 54%)")

# 한 명 등록을 위한 심사 수
inv_ca = 1 / ca_dist
print(f"심사 수 중앙값: {np.median(inv_ca):.1f} (관측: 1.8)")
print(f"심사 수 IQR: {np.percentile(inv_ca, 25):.1f} ~ {np.percentile(inv_ca, 75):.1f}")

이 코드는 (1) Lasagna 의 80 배가 곱셈 funnel 의 결과임을, (2) Muench 의 1/10 이 단계별 통과율의 자연 누적임을, (3) π 규칙이 세 지연 요인 곱임을, (4) 진단 매트릭스의 처방 분기를, (5) Gross 외의 실증 분포를 한 번에 보여준다.

10 결론 — 정량화의 핵심 메시지

모집은 측정 가능하다. 그러나 측정하지 않으면 보정할 수 없다.

세 가지 경험 법칙 (Lasagna 80·Muench 10·π) 은 총량과 기간의 비관적 보정 도구다. 세 가지 분수 (\(B/A, C/B, C/A\)) 는 어디가 막혔는지 진단 도구다. 두 도구를 함께 쓰면 신청서 단계의 추정·중간 점검·사후 보고 모두에 적용 가능하다.

핵심은 다음 세 가지 행동이다.

신청서 단계 — Lasagna · Muench 보정과 π 규칙을 추정치 옆에 함께 적어두기
중간 점검 단계 — Eligibility/Enrolment fraction 을 분기마다 측정해 깔때기 어디가 막혔는지 진단
보고 단계 — CONSORT flow diagram 으로 모든 단계의 환자 수를 보고

이 세 행동이 정착되어야 모집 부진이 진단 가능한 문제 가 된다. 다음 글에서는 이 진단을 바탕으로 실제 개선 전략 (Zelen · cmRCT · Cochrane 4 전략) 을 다룬다.

11 관련 주제

선행 지식

RCT 모집의 현실 — Ch.10 개관 — 본 글의 큰 그림
RCT 와 A/B 테스트의 설계 원칙 — RCT 5 요소
표본 크기와 검정력 — sample size 계산의 IT 버전

Phase C 후속 글

모집 개선 전략 — Ch.10.2 — Zelen · cmRCT · Cochrane 4 전략
CONSORT 보고 지침 — Ch.22 시리즈 — flow diagram 의 표준화

다른 카테고리 연결

Engineering 카테고리 — 실험 플랫폼의 funnel logging (placeholder)
Surveilance 카테고리 — FDA 의 CONSORT-like 보고 요구 (placeholder)

12 참고문헌

Schulz, K. F. & Grimes, D. A. (2019). Essential Concepts in Clinical Research (2nd ed.), Ch.10. Elsevier.
Lasagna, L. (1979). Problems in publication of clinical trial methodology. Clin. Pharmacol. Ther. 25, 751-753.
Ederer, F. (1975). Practical problems in collaborative clinical trials. Am. J. Epidemiol. 102, 111-118.
Gross, C. P., Mallory, R., Heiat, A., Krumholz, H. M. (2002). Reporting the recruitment process in clinical trials: who are these patients and how did they get there? Ann. Intern. Med. 137, 10-16.
Schulz, K. F., Altman, D. G., Moher, D., CONSORT Group. (2010). CONSORT 2010 statement: updated guidelines for reporting parallel group randomised trials. BMJ 340, c332.