Kwangmin Kim - 코호트 연구 개관 — 노출에서 결과로 행진하다

1 들어가며 — “Cohort” 의 어원

“Cohort” 는 의학에서가 아니라 로마 군대에서 나온 용어다 (Schulz & Grimes, 2019, Ch.4). 한 cohort 는 300~600 명의 단위였고, 10 cohort 가 1 군단(legion)을 이루었다. Frost (1935) 가 결핵 사망률 연구에서 처음 의학에 도입했다.

이 어원이 바로 코호트 연구의 직관적 정의를 제공한다 — 노출(exposure)에서 결과(outcome)를 향해 시간 축에서 함께 행진하는 사람들의 무리. Schulz 의 이 비유가 다른 어떤 동의어(incidence, longitudinal, panel, forward-looking, follow-up, concurrent, prospective)보다 핵심을 압축한다.

정의: 코호트 연구 (Cohort Study)

두 개 이상의 집단을 노출에서 결과로 시간 축에서 추적하는 연구 (Schulz & Grimes, 2019, Ch.4).

역학: Cohort Study (Prospective / Retrospective / Ambidirectional)
IT/실험: Cohort Analysis (가입 시점·획득 채널 기준의 retention/conversion 추적)

핵심 지표: 발생률(incidence rate), 상대위험(relative risk, RR), 95% CI. 기술 연구의 prevalence 와 다르다.

이 글은 Ch.4 전체를 압축하여 시간 방향 · 장단점 · 평가 기준 · 변형 · 보고 표준 까지를 한 번에 조망한다. 세부는 후속 4 편으로 분해한다.

2 핵심 정의 — 방향이 곧 정체성

코호트 연구의 정체성은 방향(direction) 이다 — 노출에서 결과로 (Schulz & Grimes, 2019, Ch.4.1).

시간축:    과거 ──────────── 현재 ──────────── 미래

Concurrent (전향):                노출 ──────→ 결과
Retrospective (후향):  노출 ──────→ 결과 │
Ambidirectional:       노출 ─→ 결과(과거) + 결과(미래)

시간 방향	데이터 수집 시점	강점	약점
Concurrent (전향)	결과 발생 전에 시작	데이터 품질 우수, 노출 정의 사전 통제	비용 큼, 시간 김
Retrospective (후향)	노출·결과 모두 과거에서 추출	시간·비용 작음	기존 데이터 한계, 회상 편향
Ambidirectional	양방향 데이터 수집	단·장기 결과 동시 추적	운영 복잡

Retrospective cohort 는 historical cohort, historical prospective, nonconcurrent prospective, 심지어 모순적이게도 “prospective study in retrospect” 로도 불린다 (Porta, 2014). 용어가 헷갈려도 핵심은 변하지 않는다 — 노출 → 결과 방향이 보존되는 한 cohort 다.

직관: 데이터가 과거에서 와도 연구는 미래로 간다

Retrospective cohort 는 “과거 자료 사용” 이지 “방향이 거꾸로” 가 아니다. 1985 년에 노출된 사람들의 의무기록을 2025 년에 열어 결과를 추적해도, 연구의 논리적 시간선은 노출(1985) → 결과(2025) 로 흐른다. 데이터 수집 시점과 연구 방향을 혼동하지 않는 것이 출발점이다.

3 강점 5 가지

코호트 연구가 살아남는 이유는 다음 다섯 가지 강점 때문이다 (Schulz & Grimes, 2019, Ch.4.2).

3.1 1. 발생률·자연사 추적

발생률(incidence)과 질병 자연사(natural history)를 가장 정확히 추정할 수 있는 설계다. 노출 기준으로 관찰을 시작하므로 결과 시점이 명확 하다.

3.2 2. 시간 선후의 명료성

Cross-sectional 연구가 빠지는 “닭이 먼저인가 달걀이 먼저인가” 의 함정에서 자유롭다 (Schulz & Grimes, 2019, Ch.4.2). 만성 통증과 우울증의 관계가 대표적 — cross-sectional 자료만으로는 통증이 우울을 유발하는지, 우울이 통증 인지를 강화하는지 구분 불가하다 (Buonanotte et al., 2015).

3.3 3. 단일 노출 → 다중 결과

흡연(노출) 1 개로 뇌졸중·기종·구강암·심장병(결과 다수)을 동시에 추적할 수 있다 (Schulz & Grimes, 2019, Ch.4.2).

직관: 다중 결과의 양날 — P-hacking

다중 결과 추적은 강점이지만, “100 개 연관 중 유의한 것만 보고” 하면 곧 P-hacking (data mining, snooping, fishing, significance chasing) 이 된다 — “원하는 결과가 나올 때까지 다양한 것을 시도” (Bin Abd Razak et al., 2016).

한 리뷰에서 관찰 연구 10 편이 100 건 이상의 노출-결과 연관을 검정했고 최대 264 건에 달했다 (Pocock et al., 2004). 다중 검정의 알파 오류 누적이 무시되면 거짓 양성이 폭증한다.

자기 절제: 일차·이차 가설을 사전 명시(prespecify) 하고, 검정한 모든 연관을 보고 한다. 가설 생성성(hypothesis generation) 분석은 명시적으로 그렇게 표시한다.

3.4 4. 희귀 노출 연구

직업·산업 노출(예: 이온화 방사선·화학물질)은 일반 인구에서 드물지만 특정 공장·병원에서 집중된다. Case-control 이 희귀 결과에 강한 반대로, cohort 는 희귀 노출에 강하다. 노출자 표본 비율을 높게, 비노출자 비율을 낮게 잡아 효율을 높일 수 있다 (Setia, 2016).

3.5 5. Neyman bias 회피

급사 질병(rapidly fatal disease)을 case-control 로 연구하면 이미 사망한 사례가 누락되어 표본이 가장 심한 환자를 놓친다 (Hill et al., 2003). Schulz 의 비유 — “병원 기반 case-control 로 눈 치우기와 심근경색의 연관을 보면, 진입로에서 삽을 든 채 사망한 사례를 모두 놓친다.” Cohort 설계는 이 Neyman bias 에서 자유롭다.

4 약점 4 가지

약점	의미	사례
Selection bias	노출자가 다른 면에서도 비노출자와 다름	조깅군 연구 — 조깅하는 사람이 식이·흡연도 다름
희귀 결과 부적합	발병 0 인 결과는 cohort 가 비효율	경피증(scleroderma) 같은 희귀 자가면역질환
장기 비용	암 같은 장잠복 질환은 수십 년 추적	단, Framingham/Nurses’ Health/British Physicians 같이 큰 성과도 가능
회고 자료 품질	Retrospective 의 기존 데이터는 불완전·부정확 가능	프라이버시 규제로 보충 정보 접근 불가
Loss to follow-up	차별 손실(differential loss)이 결과 왜곡	부작용 심한 약 복용자가 응답 거부 → 약이 좋아 보임
Exposure 변화 (contamination)	시간이 지나면서 노출 상태 변경	경구피임약 사용자가 IUD 로 전환 — duration 으로 분할 분석

5 평가 기준 4가지 — “이 코호트 보고를 어떻게 읽나”

Schulz 는 cohort 보고를 평가하는 4 가지 질문을 제시한다 (Ch.4.4).

질문	핵심
Who is at risk?	결과 발생 가능성이 0 인 자를 제외하는가 (예: 자궁절제 후 자궁경부암 연구 제외)
Who is exposed?	노출 정의가 명확하고 측정 가능한가 (예: 흡연자 = “최소 6 개월간 매일 1 개비 이상”)
Who is appropriate control?	비노출자가 노출자와 노출 외 모든 면에서 비슷한가 (internal > external)
Have outcomes been assessed equally?	결과 측정이 노출 상태와 무관하게 동일하게 이루어졌는가 (정보 편향)

Healthy worker effect 는 이 평가의 고전적 함정이다 — 외부 인구를 대조군으로 쓰면, 일하는 사람은 일반 인구보다 평균적으로 건강하다는 사실이 결과를 왜곡한다.

6 추적 — Loss to Follow-up

코호트의 가장 큰 운영 도전은 추적 손실(loss to follow-up)이다 (Schulz & Grimes, 2019, Ch.4.5). 핵심은 차별 손실(differential loss) 의 회피.

대응 전략	효과
완료 가능성 높은 자만 등록	표본 외적 타당도 감소하나 손실 감소
가족·지인 연락처 사전 확보	이사 시 추적 가능
가정의(family doctor) 기록 활용	의료 이용 추적
차량 등록·주민등록·국가 사망 색인	거시 추적 인프라
응답자 시간 보상	참여 유지

장기 코호트도 다단계(multi-stage) 추적 절차로 높은 유지율을 달성할 수 있다 (Dinger et al., 2014).

7 보고 표준 — STROBE

코호트(및 모든 관찰 연구) 의 보고 표준은 STROBE (Strengthening the Reporting of Observational Studies in Epidemiology) 가이드라인이다 (von Elm et al., 2007). RCT 의 CONSORT 와 같은 계열이다.

STROBE 체크리스트 22 항목 (Panel 4.2)
│
├── Title/Abstract (1)        : 설계명을 제목·초록에 명시
├── Introduction (2~3)        : 배경·목적·사전 가설
├── Methods (4~12)            : 설계·세팅·참여자·변수·자료원·편향·표본 크기·통계
├── Results (13~17)           : 흐름도·기술 통계·결과 데이터·주 결과·기타 분석
└── Discussion (18~22)        : 핵심 결과·한계·해석·외적 타당도·자금원

도입 10 년 후에도 보고 품질은 미흡하다 — 고임팩트 일반 의학지의 cohort 보고도 STROBE 항목의 70% 만 충족 (Poorolajal et al., 2011), 전문 분과지(수부외과·성형외과·신장학·피부과)는 더 낮다.

8 변형 2 가지

8.1 Before-After Studies

같은 참여자를 개입 전후로 비교한다. 시계열(time series) 의 일종이지만 cohort 의 변형으로 분류된다 (Schulz & Grimes, 2019, Ch.4.7).

직관: Before-After 의 3 가지 함정

Regression to the mean — 극단값으로 등록된 표본은 시간이 지나며 평균에 회귀. 처치와 무관하게 좋아진 것처럼 보임 (Cockrell Skinner et al., 2016).
Secular trends — 폐렴 발생률의 계절성처럼 시간 자체의 추세가 결과에 영향.
Carryover effect — 약물의 잔류 효과가 후속 측정에 침투. Washout period 가 필요.

이 세 함정은 IT 의 “기능 출시 전후 비교” 에도 그대로 적용된다 (cross-link: 전후 비교가 위험한 이유).

8.2 Nested Case-Control

코호트 안에 case-control 을 배태한 설계 (Schulz & Grimes, 2019, Ch.4.7).

작동 방식: 코호트 등록 시 모든 참여자의 혈청을 채취·동결. 추적 종료 후 결과 발생자(case)와 미발생자 무작위 표본(control) 에 대해서만 비싼 검사(예: 정교한 혈액 검사) 를 수행. 노출이 결과 이전에 결정되어 있음을 보장하면서 검사 비용을 대폭 절감한다.

대표 사례: 미토콘드리아 DNA 복제수와 전립선암의 관계를 본 nested case-control — 800 명 case + 동수 control 만 DNA 추출 (Moore et al., 2017). 자궁 내 차원과 IUD 제거(Liang et al., 2014), 폐기능과 폐암(Maldonado et al., 2010) 등으로 응용.

9 IT 대응 — 코호트 분석의 두 의미

IT 에서 “cohort analysis” 는 두 가지 다른 의미를 가지므로 구분이 필요하다.

의미	설계	비교군	인과 추론
가입월별 retention curve	Cohort study (이름만 cohort, 실제로는 cross-sectional 시점 묶음의 시계열)	없음	약함
노출-비노출 비교 cohort	진성 cohort study (Schulz 의 정의)	있음 (비노출군)	강함 (관찰 연구 한계 내)

A/B 테스트가 무작위 배정으로 selection bias 를 제거한 cohort 의 실험적 형태라면, 관찰 코호트는 무작위 배정 없이 비교군을 끌어오는 노력이다. healthy worker effect 의 IT 판 은 “실험에 참여 동의한 사용자가 거부 사용자보다 활성도가 높음” 같은 자기선택 편향이다.

10 결론 및 후속

코호트 연구는 방향(노출 → 결과) 이 정체성이다. 강점(시간 선후 명료, 발생률 추정, 다중 결과, 희귀 노출, Neyman 회피)과 약점(선택 편향, 희귀 결과 부적합, 장기 비용, loss to follow-up, contamination)이 모두 이 방향에서 파생된다. 좋은 코호트 보고의 표지는 STROBE 22 항목의 충족과 평가 4 질문(at risk · exposed · control · outcome assessment)에 대한 명시적 답이다.

후속 글들은 이 개관을 4 편으로 분해한다.

11 관련 주제

Phase B 후속 글 (분해)

선행 / 다른 카테고리

기술 연구 5 유형 — Case Report부터 Ecological까지 — Cross-sectional 과 cohort 의 시간 구조 차이
관찰 연구 설계: 코호트, 케이스-컨트롤, 단면 연구 — IT/실험 맥락의 통합 정리
전후 비교(Before-and-After)가 위험한 이유 — Before-after 의 3 함정의 IT 판