1 들어가며
새로운 질병·노출·현상에 처음 접근할 때 연구자가 가장 먼저 시도하는 설계는 무엇인가. 비교군을 두고 처치 효과를 따지기 전에, 우선 “누가, 무엇을, 언제, 어디서, 왜” 겪고 있는지 기술하는 단계가 필요하다. 이 단계의 설계가 기술 연구(descriptive study)다 (Schulz & Grimes, 2019, Ch.2).
기술 연구는 의학·역학에서 새 영역의 “첫 번째 과학적 발끝(scientific toe in the water)” 역할을 하지만, 동시에 비교군이 없다는 구조적 한계 때문에 인과 추론의 근거로 오용되기 쉽다. 이 글은 Ch.2 전체를 압축하여 정의·구조·5 유형·3가지 활용·핵심 위험까지를 한 번에 조망한다. 세부 내용은 후속 글에서 분해한다.
2 정의
인과 관계나 가설을 본격적으로 다루지 않고, 변수의 기존 분포(existing distribution)를 기술하기 위해서만 설계된 연구이다 (Porta, 2014; Schulz & Grimes, 2019, Ch.2).
- 역학: Descriptive Study (Case Report, Case-Series, Cross-Sectional, Surveillance, Ecological)
- IT/실험: Logging, Funnel Analysis, KPI Dashboard, Cohort Snapshot, Anomaly Surveillance
핵심 한정어는 “without much regard to causal relationships”. 이 한정어를 잊으면 곧바로 “관찰된 분포”를 “원인의 효과”로 오역하는 오류로 이어진다.
기술 연구의 정체성은 “비교 없는 관찰”에 있다. 두 집단을 나란히 놓고 차이를 따지는 분석 연구(analytical study, 즉 cohort·case-control·RCT)와 달리, 기술 연구는 한 집단의 분포 자체를 묘사한다. 이 차이가 연구의 강점(저비용·빠른 탐색)과 약점(인과 미식별)을 동시에 결정한다.
3 핵심 원리: 5W + So What
기술 역학은 전통적으로 사람·장소·시간(person, place, time) 의 3 요소로 정리되었으나, Schulz & Grimes 는 신문 보도의 5W 프레임을 채택한다 (Schulz & Grimes, 2019, Ch.2.1).
| 질문 | 핵심 내용 | 예시 |
|---|---|---|
| Who | 누가 (인구학적·직업적·행동적 특성) | Klinefelter 증후군 남성의 유방암 위험 20배 (Brinton et al., 2014) |
| What | 무엇을 (명확하고 측정 가능한 사례 정의) | 독성 쇼크 증후군의 다장기 침범 기준 |
| Why | 왜 (가설 생성의 단서 — Panel 2.1) | 영아 망막증 ↔︎ 인큐베이터 고농도 산소 |
| When | 언제 (잠복기·계절성·시간 추세) | 식중독은 수 시간, 중피종은 수십 년 |
| Where | 어디서 (지리·환경) | 말라리아 발생률은 해발 고도와 역상관 |
| So What | 그래서 무엇 (공중보건적 의의) | 심각성·규모·신규성·사회적 함의 |
5W 가 사실 묘사라면, “So what” 은 그 사실이 왜 중요한가를 묻는 메타 질문이다. So what 이 약하면 “이력서만 두꺼워지고 숲은 얇아진다(thicker CVs at the expense of thinner forests)”는 Schulz 의 풍자(2019, Ch.2.1)는 IT 분석 보고서에도 그대로 적용된다 — 대시보드 숫자가 의사 결정으로 이어지지 못하면 logging 비용만 누적된다.
신문 1 면 기사는 비교군을 가진 통제 실험이 아니다. 그러나 독자가 사건을 머릿속에서 재구성할 수 있으려면 누가·무엇을·언제·어디서·왜가 빠짐없이 채워져야 한다. 기술 연구의 보고도 같다 — 재현 가능한 사례 정의(case definition) 없이는 후속 연구가 같은 현상을 추적할 수 없다. So what 은 편집장이 “그래서 1면에 갈 가치가 있는가”를 묻는 질문에 해당한다.
4 기술 연구 5 유형 (Triad → Pentad)
기술 연구는 개인 단위(individuals) 4 종과 집단 단위(populations) 1 종으로 갈린다.
기술 연구
├── 개인 단위
│ ├── Case Report (단일 사례 보고)
│ ├── Case-Series Report (다중 사례 묶음)
│ ├── Cross-Sectional (특정 시점 단면)
│ └── Surveillance (지속 감시)
└── 집단 단위
└── Ecological (집단 평균 상관)
| 유형 | 단위 | 시점 | 핵심 특징 | 대표 사례 |
|---|---|---|---|---|
| Case Report | 개인 1 명 | 1 회 | 의학 문헌의 최소 발표 단위 | 경구피임약 ↔︎ 간세포선종 (Schenken, 1976) |
| Case-Series Report | 개인 N 명 | 1 회 | 단기간 유사 사례 묶음, 신종 유행의 신호 | LA 동성애 남성 폐포자충 폐렴 → AIDS 인지 (CDC, 1981) |
| Cross-Sectional | 인구 표본 | 1 시점 | 노출·결과 동시 측정 → 유병률(prevalence) | 푸에르토리코 제약 공장 여성형 유방 유병률 → 에스트로겐 분진 가설 (Harrington, 1978) |
| Surveillance | 인구 집단 | 지속 | 능동(active) vs 수동(passive), 피드백 루프 필수 | 천연두·소아마비 박멸 캠페인의 데이터 인프라 |
| Ecological | 인구 집단 평균 | 다양 | 집단 단위 노출-결과 상관, 개인 수준 추론 불가 | 1 인당 담배 판매량 ↔︎ 관상동맥 사망률 |
각 유형의 세부 정의·장단점·재현 가능성 기준은 후속 글 B-SCH2-2 (5 유형 상세) 에서 다룬다. 여기서는 개인 단위와 집단 단위의 구분이 곧 추론 단위(unit of inference)의 구분 임을 강조한다 — 집단 평균 간 상관을 개인의 인과로 옮기면 생태학적 오류(ecological fallacy) 가 발생한다.
Case-control 은 결과(사례·대조)를 기준으로 노출을 역추적한다. Cross-sectional 은 같은 시점에 노출과 결과를 한꺼번에 측정한다. 두 설계 모두 시간적 선후 관계를 직접 관찰하지 않는다. 그래서 cross-sectional 은 “case-control 의 인구판 하이브리드”로 묘사된다 (Schulz & Grimes, 2019, Ch.2.2). 단, 성별·혈액형처럼 결과보다 명백히 먼저 정해진 노출은 예외다.
5 왜 기술 연구가 필요한가
비교군이 없는 설계가 왜 21 세기에도 살아남는가. Schulz 는 세 가지 활용을 든다 (Ch.2.3).
| 활용 | 내용 | 의학 사례 | IT/실험 대응 |
|---|---|---|---|
| Trend Analysis | 인구 건강 추세 모니터링 | 미국 비만 추세 (Flegal et al., 2016), 러시아 매독·HIV 유행 | DAU/WAU 추이, 결제 전환율 시계열, 오류율 모니터링 |
| Planning | 의료 자원·정책 계획 | 복강경 도입 → 난관 결찰 외래 전환 (Chan & Westhoff, 2010) | 인프라 캐파시티 산정, 콜센터 인력 배치 |
| Clues About Cause | 가설 생성 (Panel 2.1) | 인큐베이터 고농도 산소 → 신생아 실명 가설 → 후속 RCT (Silverman, 1991) | 이상 패턴 감지 → A/B 가설 후보, funnel drop-off → UI 가설 |
핵심 메시지: 기술 연구는 인과를 검증하는 설계가 아니라 인과 가설의 우물을 파는 설계이다. RCT 가 가설 검증의 골든 스탠다드라면, 기술 연구는 가설이 태어나는 산실이다. IT 실험 파이프라인에서도 같은 분업이 작동한다 — 로그·대시보드·이상 탐지가 가설을 발굴하면, A/B 테스트가 인과를 검증한다.
6 응용: 역학 ↔︎ IT 매핑
| 역학 (기술 연구) | IT/디지털 실험 | 공통 한계 |
|---|---|---|
| Case Report | 사고 사후분석(post-mortem) 1 건 | N=1, 외적 타당도 없음 |
| Case-Series Report | 동일 오류 코드 클러스터 보고 | 비교군 없음, 분모 미상 |
| Cross-Sectional Survey | 특정 날짜 사용자 코호트 스냅샷 | 시간 선후 추론 불가 |
| Surveillance | 실시간 KPI 대시보드, SLO 알람 | 능동/수동에 따라 sensitivity 5 배 차이 (Schulz Ch.2 사례) |
| Ecological Study | 국가·지역별 평균 지표 비교 | Ecological fallacy — 개인 행동 추론 금지 |
이 매핑은 단순한 용어 대응이 아니다 — IT 분석가가 “전후 비교(before-after)”를 인과로 해석하는 오류가 곧 의학에서의 post hoc ergo propter hoc 오류다. 두 분야 모두 비교군 없는 시간 비교를 인과로 옮기는 순간 같은 함정에 빠진다.
7 핵심 위험: Overstepping the Data
기술 연구의 최대 위험은 “비교군 없이 인과를 결론내는 것”이다. Schulz 는 두 가지 사례로 그 비용을 보여준다 (Ch.2.5).
7.1 사례 1: 1980 년대 다상성 경구피임약 패닉
캘리포니아 Pasadena 의 한 의사가 다상성(multiphasic) 경구피임약을 복용하던 7 명의 여성에게서 기능성 난소낭종을 관찰하고 case-series 로 보고했다 (Caillouette & Koehler, 1987). 비교군은 없었다. 미디어가 보도하면서 전 세계 여성이 피임약을 중단했고, 5 년 뒤 cohort·case-control 연구가 연관 없음을 확인했지만, 그동안 비계획 임신과 예방 가능한 낙태가 발생했다.
7.2 사례 2: 1990 년대 전자 태아 모니터링 도입
연속 태아 심박 모니터링 도입 시점과 주산기 사망률 감소가 시간적으로 일치하자, 저명한 산과 의사들이 모니터링이 신생아에게 이롭다고 결론내렸다. 기술 연구는 이 시간 일치만 보였을 뿐이다. 후속 RCT 들은 routine electronic fetal monitoring 이 신생아에게 지속 이익이 없고 수술 분만만 늘린다는 것을 보였으나(Alfirevic et al., 2017), 미국 분만의 대부분이 여전히 이 기술을 사용한다.
위 두 사례가 처음부터 case-control 또는 cohort 로 설계되었다면 — 즉 다상성 미사용 여성, 모니터링 미사용 분만과의 비교가 동시에 측정되었다면 — 인과 결론은 다르게 나왔거나 적어도 보류되었을 것이다. 기술 연구의 한계는 데이터의 한계가 아니라 설계의 한계다. 같은 데이터에 비교군을 추가하는 것이 곧 분석 연구로의 도약이다.
이 위험은 IT 실험에서도 동일하다. “기능 출시 후 매출이 늘었다 → 기능이 효과 있다”는 추론은 계절성·외부 이벤트·자연 회복을 통제하지 못한 채 시간 일치를 인과로 오역하는 전형적 overstep 이다 (cross-link: 전후 비교가 위험한 이유).
8 결론
기술 연구는 새 현상에 대한 첫 접근이다. 강점은 저비용·빠른 가설 생성·윤리 부담 없음이고, 약점은 인과 미식별과 시간 선후 모호성이다. 좋은 기술 연구의 표지는 다음 세 가지다.
- 명확한 사례 정의(case definition) — 누가 사례인지 재현 가능하게 정의되었는가.
- 5W + So What — 누가·무엇·왜·언제·어디서가 빠짐없이 채워졌고, 공중보건적 의의가 명시되었는가.
- 추론의 자기 절제 — 비교군이 없는 한 인과를 주장하지 않고, 가설 생성으로 절제했는가.
이 세 가지가 결여된 기술 연구는 의학과 IT 모두에서 자원을 낭비하고 잘못된 의사결정을 유발한다. 후속 글들은 이 개관을 5W (B-SCH2-1), 5 유형 (B-SCH2-2), 활용·장단점·overstep 위험 (B-SCH2-3) 으로 분해한다.
9 관련 주제
선행 지식
- 연구 설계 대분류 — Overview — 기술 연구가 위치하는 전체 분류 체계
Phase B 후속 글 (분해)
다른 카테고리 연결
- 전후 비교(Before-and-After)가 위험한 이유 — 비교군 없는 시간 비교의 IT 판
- 관찰 연구 설계: 코호트, 케이스-컨트롤, 단면 연구 — 비교군이 추가된 분석 연구