1 들어가며 — “Cohort” 의 어원
“Cohort” 는 의학에서가 아니라 로마 군대에서 나온 용어다 (Schulz & Grimes, 2019, Ch.4). 한 cohort 는 300~600 명의 단위였고, 10 cohort 가 1 군단(legion)을 이루었다. Frost (1935) 가 결핵 사망률 연구에서 처음 의학에 도입했다.
이 어원이 바로 코호트 연구의 직관적 정의를 제공한다 — 노출(exposure)에서 결과(outcome)를 향해 시간 축에서 함께 행진하는 사람들의 무리. Schulz 의 이 비유가 다른 어떤 동의어(incidence, longitudinal, panel, forward-looking, follow-up, concurrent, prospective)보다 핵심을 압축한다.
두 개 이상의 집단을 노출에서 결과로 시간 축에서 추적하는 연구 (Schulz & Grimes, 2019, Ch.4).
- 역학: Cohort Study (Prospective / Retrospective / Ambidirectional)
- IT/실험: Cohort Analysis (가입 시점·획득 채널 기준의 retention/conversion 추적)
핵심 지표: 발생률(incidence rate), 상대위험(relative risk, RR), 95% CI. 기술 연구의 prevalence 와 다르다.
이 글은 Ch.4 전체를 압축하여 시간 방향 · 장단점 · 평가 기준 · 변형 · 보고 표준 까지를 한 번에 조망한다. 세부는 후속 4 편으로 분해한다.
2 핵심 정의 — 방향이 곧 정체성
코호트 연구의 정체성은 방향(direction) 이다 — 노출에서 결과로 (Schulz & Grimes, 2019, Ch.4.1).
시간축: 과거 ──────────── 현재 ──────────── 미래
Concurrent (전향): 노출 ──────→ 결과
Retrospective (후향): 노출 ──────→ 결과 │
Ambidirectional: 노출 ─→ 결과(과거) + 결과(미래)
| 시간 방향 | 데이터 수집 시점 | 강점 | 약점 |
|---|---|---|---|
| Concurrent (전향) | 결과 발생 전에 시작 | 데이터 품질 우수, 노출 정의 사전 통제 | 비용 큼, 시간 김 |
| Retrospective (후향) | 노출·결과 모두 과거에서 추출 | 시간·비용 작음 | 기존 데이터 한계, 회상 편향 |
| Ambidirectional | 양방향 데이터 수집 | 단·장기 결과 동시 추적 | 운영 복잡 |
Retrospective cohort 는 historical cohort, historical prospective, nonconcurrent prospective, 심지어 모순적이게도 “prospective study in retrospect” 로도 불린다 (Porta, 2014). 용어가 헷갈려도 핵심은 변하지 않는다 — 노출 → 결과 방향이 보존되는 한 cohort 다.
Retrospective cohort 는 “과거 자료 사용” 이지 “방향이 거꾸로” 가 아니다. 1985 년에 노출된 사람들의 의무기록을 2025 년에 열어 결과를 추적해도, 연구의 논리적 시간선은 노출(1985) → 결과(2025) 로 흐른다. 데이터 수집 시점과 연구 방향을 혼동하지 않는 것이 출발점이다.
3 강점 5 가지
코호트 연구가 살아남는 이유는 다음 다섯 가지 강점 때문이다 (Schulz & Grimes, 2019, Ch.4.2).
3.1 1. 발생률·자연사 추적
발생률(incidence)과 질병 자연사(natural history)를 가장 정확히 추정할 수 있는 설계다. 노출 기준으로 관찰을 시작하므로 결과 시점이 명확 하다.
3.2 2. 시간 선후의 명료성
Cross-sectional 연구가 빠지는 “닭이 먼저인가 달걀이 먼저인가” 의 함정에서 자유롭다 (Schulz & Grimes, 2019, Ch.4.2). 만성 통증과 우울증의 관계가 대표적 — cross-sectional 자료만으로는 통증이 우울을 유발하는지, 우울이 통증 인지를 강화하는지 구분 불가하다 (Buonanotte et al., 2015).
3.3 3. 단일 노출 → 다중 결과
흡연(노출) 1 개로 뇌졸중·기종·구강암·심장병(결과 다수)을 동시에 추적할 수 있다 (Schulz & Grimes, 2019, Ch.4.2).
다중 결과 추적은 강점이지만, “100 개 연관 중 유의한 것만 보고” 하면 곧 P-hacking (data mining, snooping, fishing, significance chasing) 이 된다 — “원하는 결과가 나올 때까지 다양한 것을 시도” (Bin Abd Razak et al., 2016).
한 리뷰에서 관찰 연구 10 편이 100 건 이상의 노출-결과 연관을 검정했고 최대 264 건에 달했다 (Pocock et al., 2004). 다중 검정의 알파 오류 누적이 무시되면 거짓 양성이 폭증한다.
자기 절제: 일차·이차 가설을 사전 명시(prespecify) 하고, 검정한 모든 연관을 보고 한다. 가설 생성성(hypothesis generation) 분석은 명시적으로 그렇게 표시한다.
3.4 4. 희귀 노출 연구
직업·산업 노출(예: 이온화 방사선·화학물질)은 일반 인구에서 드물지만 특정 공장·병원에서 집중된다. Case-control 이 희귀 결과에 강한 반대로, cohort 는 희귀 노출에 강하다. 노출자 표본 비율을 높게, 비노출자 비율을 낮게 잡아 효율을 높일 수 있다 (Setia, 2016).
3.5 5. Neyman bias 회피
급사 질병(rapidly fatal disease)을 case-control 로 연구하면 이미 사망한 사례가 누락되어 표본이 가장 심한 환자를 놓친다 (Hill et al., 2003). Schulz 의 비유 — “병원 기반 case-control 로 눈 치우기와 심근경색의 연관을 보면, 진입로에서 삽을 든 채 사망한 사례를 모두 놓친다.” Cohort 설계는 이 Neyman bias 에서 자유롭다.
4 약점 4 가지
| 약점 | 의미 | 사례 |
|---|---|---|
| Selection bias | 노출자가 다른 면에서도 비노출자와 다름 | 조깅군 연구 — 조깅하는 사람이 식이·흡연도 다름 |
| 희귀 결과 부적합 | 발병 0 인 결과는 cohort 가 비효율 | 경피증(scleroderma) 같은 희귀 자가면역질환 |
| 장기 비용 | 암 같은 장잠복 질환은 수십 년 추적 | 단, Framingham/Nurses’ Health/British Physicians 같이 큰 성과도 가능 |
| 회고 자료 품질 | Retrospective 의 기존 데이터는 불완전·부정확 가능 | 프라이버시 규제로 보충 정보 접근 불가 |
| Loss to follow-up | 차별 손실(differential loss)이 결과 왜곡 | 부작용 심한 약 복용자가 응답 거부 → 약이 좋아 보임 |
| Exposure 변화 (contamination) | 시간이 지나면서 노출 상태 변경 | 경구피임약 사용자가 IUD 로 전환 — duration 으로 분할 분석 |
5 평가 기준 4가지 — “이 코호트 보고를 어떻게 읽나”
Schulz 는 cohort 보고를 평가하는 4 가지 질문을 제시한다 (Ch.4.4).
| 질문 | 핵심 |
|---|---|
| Who is at risk? | 결과 발생 가능성이 0 인 자를 제외하는가 (예: 자궁절제 후 자궁경부암 연구 제외) |
| Who is exposed? | 노출 정의가 명확하고 측정 가능한가 (예: 흡연자 = “최소 6 개월간 매일 1 개비 이상”) |
| Who is appropriate control? | 비노출자가 노출자와 노출 외 모든 면에서 비슷한가 (internal > external) |
| Have outcomes been assessed equally? | 결과 측정이 노출 상태와 무관하게 동일하게 이루어졌는가 (정보 편향) |
Healthy worker effect 는 이 평가의 고전적 함정이다 — 외부 인구를 대조군으로 쓰면, 일하는 사람은 일반 인구보다 평균적으로 건강하다는 사실이 결과를 왜곡한다.
6 추적 — Loss to Follow-up
코호트의 가장 큰 운영 도전은 추적 손실(loss to follow-up)이다 (Schulz & Grimes, 2019, Ch.4.5). 핵심은 차별 손실(differential loss) 의 회피.
| 대응 전략 | 효과 |
|---|---|
| 완료 가능성 높은 자만 등록 | 표본 외적 타당도 감소하나 손실 감소 |
| 가족·지인 연락처 사전 확보 | 이사 시 추적 가능 |
| 가정의(family doctor) 기록 활용 | 의료 이용 추적 |
| 차량 등록·주민등록·국가 사망 색인 | 거시 추적 인프라 |
| 응답자 시간 보상 | 참여 유지 |
장기 코호트도 다단계(multi-stage) 추적 절차로 높은 유지율을 달성할 수 있다 (Dinger et al., 2014).
7 보고 표준 — STROBE
코호트(및 모든 관찰 연구) 의 보고 표준은 STROBE (Strengthening the Reporting of Observational Studies in Epidemiology) 가이드라인이다 (von Elm et al., 2007). RCT 의 CONSORT 와 같은 계열이다.
STROBE 체크리스트 22 항목 (Panel 4.2)
│
├── Title/Abstract (1) : 설계명을 제목·초록에 명시
├── Introduction (2~3) : 배경·목적·사전 가설
├── Methods (4~12) : 설계·세팅·참여자·변수·자료원·편향·표본 크기·통계
├── Results (13~17) : 흐름도·기술 통계·결과 데이터·주 결과·기타 분석
└── Discussion (18~22) : 핵심 결과·한계·해석·외적 타당도·자금원
도입 10 년 후에도 보고 품질은 미흡하다 — 고임팩트 일반 의학지의 cohort 보고도 STROBE 항목의 70% 만 충족 (Poorolajal et al., 2011), 전문 분과지(수부외과·성형외과·신장학·피부과)는 더 낮다.
8 변형 2 가지
8.1 Before-After Studies
같은 참여자를 개입 전후로 비교한다. 시계열(time series) 의 일종이지만 cohort 의 변형으로 분류된다 (Schulz & Grimes, 2019, Ch.4.7).
- Regression to the mean — 극단값으로 등록된 표본은 시간이 지나며 평균에 회귀. 처치와 무관하게 좋아진 것처럼 보임 (Cockrell Skinner et al., 2016).
- Secular trends — 폐렴 발생률의 계절성처럼 시간 자체의 추세가 결과에 영향.
- Carryover effect — 약물의 잔류 효과가 후속 측정에 침투. Washout period 가 필요.
이 세 함정은 IT 의 “기능 출시 전후 비교” 에도 그대로 적용된다 (cross-link: 전후 비교가 위험한 이유).
8.2 Nested Case-Control
코호트 안에 case-control 을 배태한 설계 (Schulz & Grimes, 2019, Ch.4.7).
작동 방식: 코호트 등록 시 모든 참여자의 혈청을 채취·동결. 추적 종료 후 결과 발생자(case)와 미발생자 무작위 표본(control) 에 대해서만 비싼 검사(예: 정교한 혈액 검사) 를 수행. 노출이 결과 이전에 결정되어 있음을 보장하면서 검사 비용을 대폭 절감한다.
대표 사례: 미토콘드리아 DNA 복제수와 전립선암의 관계를 본 nested case-control — 800 명 case + 동수 control 만 DNA 추출 (Moore et al., 2017). 자궁 내 차원과 IUD 제거(Liang et al., 2014), 폐기능과 폐암(Maldonado et al., 2010) 등으로 응용.
9 IT 대응 — 코호트 분석의 두 의미
IT 에서 “cohort analysis” 는 두 가지 다른 의미를 가지므로 구분이 필요하다.
| 의미 | 설계 | 비교군 | 인과 추론 |
|---|---|---|---|
| 가입월별 retention curve | Cohort study (이름만 cohort, 실제로는 cross-sectional 시점 묶음의 시계열) | 없음 | 약함 |
| 노출-비노출 비교 cohort | 진성 cohort study (Schulz 의 정의) | 있음 (비노출군) | 강함 (관찰 연구 한계 내) |
A/B 테스트가 무작위 배정으로 selection bias 를 제거한 cohort 의 실험적 형태라면, 관찰 코호트는 무작위 배정 없이 비교군을 끌어오는 노력이다. healthy worker effect 의 IT 판 은 “실험에 참여 동의한 사용자가 거부 사용자보다 활성도가 높음” 같은 자기선택 편향이다.
10 결론 및 후속
코호트 연구는 방향(노출 → 결과) 이 정체성이다. 강점(시간 선후 명료, 발생률 추정, 다중 결과, 희귀 노출, Neyman 회피)과 약점(선택 편향, 희귀 결과 부적합, 장기 비용, loss to follow-up, contamination)이 모두 이 방향에서 파생된다. 좋은 코호트 보고의 표지는 STROBE 22 항목의 충족과 평가 4 질문(at risk · exposed · control · outcome assessment)에 대한 명시적 답이다.
후속 글들은 이 개관을 4 편으로 분해한다.
11 관련 주제
Phase B 후속 글 (분해)
선행 / 다른 카테고리
- 기술 연구 5 유형 — Case Report부터 Ecological까지 — Cross-sectional 과 cohort 의 시간 구조 차이
- 관찰 연구 설계: 코호트, 케이스-컨트롤, 단면 연구 — IT/실험 맥락의 통합 정리
- 전후 비교(Before-and-After)가 위험한 이유 — Before-after 의 3 함정의 IT 판