Kwangmin Kim - 기술 연구 개관 — 무엇을 할 수 있고 무엇을 할 수 없는가

1 들어가며

새로운 질병·노출·현상에 처음 접근할 때 연구자가 가장 먼저 시도하는 설계는 무엇인가. 비교군을 두고 처치 효과를 따지기 전에, 우선 “누가, 무엇을, 언제, 어디서, 왜” 겪고 있는지 기술하는 단계가 필요하다. 이 단계의 설계가 기술 연구(descriptive study)다 (Schulz & Grimes, 2019, Ch.2).

기술 연구는 의학·역학에서 새 영역의 “첫 번째 과학적 발끝(scientific toe in the water)” 역할을 하지만, 동시에 비교군이 없다는 구조적 한계 때문에 인과 추론의 근거로 오용되기 쉽다. 이 글은 Ch.2 전체를 압축하여 정의·구조·5 유형·3가지 활용·핵심 위험까지를 한 번에 조망한다. 세부 내용은 후속 글에서 분해한다.

2 정의

정의: 기술 연구 (Descriptive Study)

인과 관계나 가설을 본격적으로 다루지 않고, 변수의 기존 분포(existing distribution)를 기술하기 위해서만 설계된 연구이다 (Porta, 2014; Schulz & Grimes, 2019, Ch.2).

역학: Descriptive Study (Case Report, Case-Series, Cross-Sectional, Surveillance, Ecological)
IT/실험: Logging, Funnel Analysis, KPI Dashboard, Cohort Snapshot, Anomaly Surveillance

핵심 한정어는 “without much regard to causal relationships”. 이 한정어를 잊으면 곧바로 “관찰된 분포”를 “원인의 효과”로 오역하는 오류로 이어진다.

기술 연구의 정체성은 “비교 없는 관찰”에 있다. 두 집단을 나란히 놓고 차이를 따지는 분석 연구(analytical study, 즉 cohort·case-control·RCT)와 달리, 기술 연구는 한 집단의 분포 자체를 묘사한다. 이 차이가 연구의 강점(저비용·빠른 탐색)과 약점(인과 미식별)을 동시에 결정한다.

3 핵심 원리: 5W + So What

기술 역학은 전통적으로 사람·장소·시간(person, place, time) 의 3 요소로 정리되었으나, Schulz & Grimes 는 신문 보도의 5W 프레임을 채택한다 (Schulz & Grimes, 2019, Ch.2.1).

질문	핵심 내용	예시
Who	누가 (인구학적·직업적·행동적 특성)	Klinefelter 증후군 남성의 유방암 위험 20배 (Brinton et al., 2014)
What	무엇을 (명확하고 측정 가능한 사례 정의)	독성 쇼크 증후군의 다장기 침범 기준
Why	왜 (가설 생성의 단서 — Panel 2.1)	영아 망막증 ↔︎ 인큐베이터 고농도 산소
When	언제 (잠복기·계절성·시간 추세)	식중독은 수 시간, 중피종은 수십 년
Where	어디서 (지리·환경)	말라리아 발생률은 해발 고도와 역상관
So What	그래서 무엇 (공중보건적 의의)	심각성·규모·신규성·사회적 함의

5W 가 사실 묘사라면, “So what” 은 그 사실이 왜 중요한가를 묻는 메타 질문이다. So what 이 약하면 “이력서만 두꺼워지고 숲은 얇아진다(thicker CVs at the expense of thinner forests)”는 Schulz 의 풍자(2019, Ch.2.1)는 IT 분석 보고서에도 그대로 적용된다 — 대시보드 숫자가 의사 결정으로 이어지지 못하면 logging 비용만 누적된다.

직관: 5W 는 왜 신문 비유인가

신문 1 면 기사는 비교군을 가진 통제 실험이 아니다. 그러나 독자가 사건을 머릿속에서 재구성할 수 있으려면 누가·무엇을·언제·어디서·왜가 빠짐없이 채워져야 한다. 기술 연구의 보고도 같다 — 재현 가능한 사례 정의(case definition) 없이는 후속 연구가 같은 현상을 추적할 수 없다. So what 은 편집장이 “그래서 1면에 갈 가치가 있는가”를 묻는 질문에 해당한다.

4 기술 연구 5 유형 (Triad → Pentad)

기술 연구는 개인 단위(individuals) 4 종과 집단 단위(populations) 1 종으로 갈린다.

기술 연구
├── 개인 단위
│   ├── Case Report          (단일 사례 보고)
│   ├── Case-Series Report   (다중 사례 묶음)
│   ├── Cross-Sectional      (특정 시점 단면)
│   └── Surveillance         (지속 감시)
└── 집단 단위
    └── Ecological           (집단 평균 상관)

유형	단위	시점	핵심 특징	대표 사례
Case Report	개인 1 명	1 회	의학 문헌의 최소 발표 단위	경구피임약 ↔︎ 간세포선종 (Schenken, 1976)
Case-Series Report	개인 N 명	1 회	단기간 유사 사례 묶음, 신종 유행의 신호	LA 동성애 남성 폐포자충 폐렴 → AIDS 인지 (CDC, 1981)
Cross-Sectional	인구 표본	1 시점	노출·결과 동시 측정 → 유병률(prevalence)	푸에르토리코 제약 공장 여성형 유방 유병률 → 에스트로겐 분진 가설 (Harrington, 1978)
Surveillance	인구 집단	지속	능동(active) vs 수동(passive), 피드백 루프 필수	천연두·소아마비 박멸 캠페인의 데이터 인프라
Ecological	인구 집단 평균	다양	집단 단위 노출-결과 상관, 개인 수준 추론 불가	1 인당 담배 판매량 ↔︎ 관상동맥 사망률

각 유형의 세부 정의·장단점·재현 가능성 기준은 후속 글 B-SCH2-2 (5 유형 상세) 에서 다룬다. 여기서는 개인 단위와 집단 단위의 구분이 곧 추론 단위(unit of inference)의 구분 임을 강조한다 — 집단 평균 간 상관을 개인의 인과로 옮기면 생태학적 오류(ecological fallacy) 가 발생한다.

직관: 단면 연구가 “case-control 의 인구판” 인 이유

Case-control 은 결과(사례·대조)를 기준으로 노출을 역추적한다. Cross-sectional 은 같은 시점에 노출과 결과를 한꺼번에 측정한다. 두 설계 모두 시간적 선후 관계를 직접 관찰하지 않는다. 그래서 cross-sectional 은 “case-control 의 인구판 하이브리드”로 묘사된다 (Schulz & Grimes, 2019, Ch.2.2). 단, 성별·혈액형처럼 결과보다 명백히 먼저 정해진 노출은 예외다.

5 왜 기술 연구가 필요한가

비교군이 없는 설계가 왜 21 세기에도 살아남는가. Schulz 는 세 가지 활용을 든다 (Ch.2.3).

활용	내용	의학 사례	IT/실험 대응
Trend Analysis	인구 건강 추세 모니터링	미국 비만 추세 (Flegal et al., 2016), 러시아 매독·HIV 유행	DAU/WAU 추이, 결제 전환율 시계열, 오류율 모니터링
Planning	의료 자원·정책 계획	복강경 도입 → 난관 결찰 외래 전환 (Chan & Westhoff, 2010)	인프라 캐파시티 산정, 콜센터 인력 배치
Clues About Cause	가설 생성 (Panel 2.1)	인큐베이터 고농도 산소 → 신생아 실명 가설 → 후속 RCT (Silverman, 1991)	이상 패턴 감지 → A/B 가설 후보, funnel drop-off → UI 가설

핵심 메시지: 기술 연구는 인과를 검증하는 설계가 아니라 인과 가설의 우물을 파는 설계이다. RCT 가 가설 검증의 골든 스탠다드라면, 기술 연구는 가설이 태어나는 산실이다. IT 실험 파이프라인에서도 같은 분업이 작동한다 — 로그·대시보드·이상 탐지가 가설을 발굴하면, A/B 테스트가 인과를 검증한다.

6 응용: 역학 ↔︎ IT 매핑

역학 (기술 연구)	IT/디지털 실험	공통 한계
Case Report	사고 사후분석(post-mortem) 1 건	N=1, 외적 타당도 없음
Case-Series Report	동일 오류 코드 클러스터 보고	비교군 없음, 분모 미상
Cross-Sectional Survey	특정 날짜 사용자 코호트 스냅샷	시간 선후 추론 불가
Surveillance	실시간 KPI 대시보드, SLO 알람	능동/수동에 따라 sensitivity 5 배 차이 (Schulz Ch.2 사례)
Ecological Study	국가·지역별 평균 지표 비교	Ecological fallacy — 개인 행동 추론 금지

이 매핑은 단순한 용어 대응이 아니다 — IT 분석가가 “전후 비교(before-after)”를 인과로 해석하는 오류가 곧 의학에서의 post hoc ergo propter hoc 오류다. 두 분야 모두 비교군 없는 시간 비교를 인과로 옮기는 순간 같은 함정에 빠진다.

7 핵심 위험: Overstepping the Data

기술 연구의 최대 위험은 “비교군 없이 인과를 결론내는 것”이다. Schulz 는 두 가지 사례로 그 비용을 보여준다 (Ch.2.5).

7.1 사례 1: 1980 년대 다상성 경구피임약 패닉

캘리포니아 Pasadena 의 한 의사가 다상성(multiphasic) 경구피임약을 복용하던 7 명의 여성에게서 기능성 난소낭종을 관찰하고 case-series 로 보고했다 (Caillouette & Koehler, 1987). 비교군은 없었다. 미디어가 보도하면서 전 세계 여성이 피임약을 중단했고, 5 년 뒤 cohort·case-control 연구가 연관 없음을 확인했지만, 그동안 비계획 임신과 예방 가능한 낙태가 발생했다.

7.2 사례 2: 1990 년대 전자 태아 모니터링 도입

연속 태아 심박 모니터링 도입 시점과 주산기 사망률 감소가 시간적으로 일치하자, 저명한 산과 의사들이 모니터링이 신생아에게 이롭다고 결론내렸다. 기술 연구는 이 시간 일치만 보였을 뿐이다. 후속 RCT 들은 routine electronic fetal monitoring 이 신생아에게 지속 이익이 없고 수술 분만만 늘린다는 것을 보였으나(Alfirevic et al., 2017), 미국 분만의 대부분이 여전히 이 기술을 사용한다.

반사실: 비교군이 있었다면?

위 두 사례가 처음부터 case-control 또는 cohort 로 설계되었다면 — 즉 다상성 미사용 여성, 모니터링 미사용 분만과의 비교가 동시에 측정되었다면 — 인과 결론은 다르게 나왔거나 적어도 보류되었을 것이다. 기술 연구의 한계는 데이터의 한계가 아니라 설계의 한계다. 같은 데이터에 비교군을 추가하는 것이 곧 분석 연구로의 도약이다.

이 위험은 IT 실험에서도 동일하다. “기능 출시 후 매출이 늘었다 → 기능이 효과 있다”는 추론은 계절성·외부 이벤트·자연 회복을 통제하지 못한 채 시간 일치를 인과로 오역하는 전형적 overstep 이다 (cross-link: 전후 비교가 위험한 이유).

8 결론

기술 연구는 새 현상에 대한 첫 접근이다. 강점은 저비용·빠른 가설 생성·윤리 부담 없음이고, 약점은 인과 미식별과 시간 선후 모호성이다. 좋은 기술 연구의 표지는 다음 세 가지다.

명확한 사례 정의(case definition) — 누가 사례인지 재현 가능하게 정의되었는가.
5W + So What — 누가·무엇·왜·언제·어디서가 빠짐없이 채워졌고, 공중보건적 의의가 명시되었는가.
추론의 자기 절제 — 비교군이 없는 한 인과를 주장하지 않고, 가설 생성으로 절제했는가.

이 세 가지가 결여된 기술 연구는 의학과 IT 모두에서 자원을 낭비하고 잘못된 의사결정을 유발한다. 후속 글들은 이 개관을 5W (B-SCH2-1), 5 유형 (B-SCH2-2), 활용·장단점·overstep 위험 (B-SCH2-3) 으로 분해한다.

9 관련 주제

선행 지식

연구 설계 대분류 — Overview — 기술 연구가 위치하는 전체 분류 체계

Phase B 후속 글 (분해)

다른 카테고리 연결

전후 비교(Before-and-After)가 위험한 이유 — 비교군 없는 시간 비교의 IT 판
관찰 연구 설계: 코호트, 케이스-컨트롤, 단면 연구 — 비교군이 추가된 분석 연구