Klein § 4.7~4.8 — Competing Risks · Ch.4 Exercises

3 곡선 (1-KM hypothetical · CIF real-world · CP conditional) 의 의미 차이 — 같은 데이터에서 25~40% 다른 추정 / CIF 식 4.7.1 = ∑ Ŝ(t_i^-) · r_i/Y_i 의 cause-specific hazard 가중 도출 + 분산 식 4.7.2 / Conditional Probability 식 4.7.3 = CI_K/(1-CI_{K^c}) — 다른 사건 안 일어난 사람만의 발생률 + 분산 식 4.7.4 / Klein Table 4.8 BMT ALL 38 명 손풀이 (1 년 relapse CIF 0.238 vs 1-KM 0.299 vs CP 0.302) / 100 명 BMT hypothetical 예제 — 1-KM 의 무의미성 (10/70~10/100 사이 random) / Ch.4 의 10 exercises 풀이 가이드 (4.1 tongue cancer · 4.2 BMT AML 두 군 · 4.3 lung interim vs complete · 4.4 dialysis · 4.5 black female KT · 4.6 burn study · 4.7 diabetes · 4.8 psychiatric · 4.9 Hoel-Walburg 3 risks · 4.10 BMT AML competing) — Ch.4 시리즈 마무리

Klein & Moeschberger Ch.4 의 § 4.7 (Competing Risks) + § 4.8 (Exercises) 를 풀어내며 Ch.4 시리즈를 마무리한다. 04-1·4·2·4·3 이 단일 사건 (event of interest) 의 비모수 추정을 다뤘다면, 본 편은 (1) 여러 경쟁 위험이 공존할 때의 3 가지 다른 곡선과 (2) 10 개 exercises 의 풀이 가이드를 다룬다. § 4.7 — Competing Risks Summary Curves: 같은 데이터에서 “사건 K 의 발생률” 을 추정하는 3 가지 방법이 모두 다른 답을 준다. (1) 1-KM (다른 사건을 censoring 처리): “다른 위험이 0 인 가상 세계” 의 발생률 — Klein 비추천. (2) CIF (cumulative incidence function, 식 4.7.1) = ∑ Ŝ(t_i^-) · r_i/Y_i: “현실 세계” 의 발생률, cause-specific hazard 의 누적합 + overall survival 가중. (3) CP (conditional probability, 식 4.7.3) = CI_K/(1-CI_{K^c}): 다른 사건 안 일어난 생존자 한정 발생률. 3 곡선의 부등식: CP ≥ 1-KM ≥ CIF (보통). 100 명 BMT hypothetical 예제 — 10 명 재발·30 명 무재발 사망 시 CIF=0.10, 1-KM 은 사건 패턴에 따라 0.10~0.143 사이 임의 값, CP=10/70=0.143 (재발 가능했던 사람 한정). 분산 식 4.7.2 (CIF) + 4.7.4 (CP). BMT ALL 38 명 (Klein Table 4.8) 24 행 손풀이 — 1 년 시점 relapse CIF 0.238 (95% CI 0.103~0.373) vs CP 0.302 (CI 0.131~0.473). § 4.7 핵심 그래프 — disease-free survival = 1 - (relapse CIF + TRM CIF), CIF 합 = 1-Ŝ overall. Theoretical Notes: cause-specific hazard 정의, Kalbfleisch-Prentice 1980 의 CIF 도출, Pepe-Mori 1993 + Gooley 1999 의 추가 분산 추정 논의. cmprsk R + lifelines AalenJohansen + scikit-survival 매핑. § 4.8 — 10 Exercises: 단일 군 분석 (4.1 tongue cancer, 4.5 black female KT), 두 군 비교 (4.2 BMT AML, 4.4 dialysis, 4.6 burn study), tail 처리 (4.3 lung interim vs complete + BHK), 좌절단 (4.7 hypothetical diabetics, 4.8 psychiatric), competing risks (4.9 Hoel-Walburg mice 3 cause, 4.10 BMT AML CIF·CP). 각 문제의 핵심 풀이 패턴 + Klein 본문 결과 비교 + 코드 매핑. Ch.4 통합 7 가지 교훈: d_i/Y_i building block · 5 가지 KM 유도 · log/arcsine 변환 우월성 · pointwise vs band 차이 · RMST 의 PH 위반 시대 부각 · 좌절단의 Y_i 재정의 단순함 · CIF ≠ 1-KM 함정. Ch.5 (다른 sampling scheme) 예고.

Statistics
Survival Analysis
Klein-Moeschberger
Competing-Risks
CIF
Exercises
저자

Kwangmin Kim

공개

2026년 04월 28일

1 들어가며 — Ch.4 시리즈의 마무리

주제
Ch.4 Overview 7 개 절 조망
§ 4.1~4.2 KM·NA 점추정 + 분산
§ 4.3~4.4 Pointwise CI + Confidence Bands
§ 4.5~4.6 Mean·Median + Left-Truncation
§ 4.7~4.8 (본 편) Competing Risks 3 곡선 + Ch.4 Exercises
§ 4.7~4.8 의 한 줄 요약

“§ 4.7 의 competing risks 에서 같은 데이터의 같은 사건 발생률을 묻는데도 1-KM·CIF·CP 세 곡선이 모두 다른 답을 준다 — 1-KM 은 ‘다른 위험이 0 인 가상 세계’ 라 임상적으로 무의미하고, CIF 가 현실 세계의 표준이며, CP 는 생존자 한정 조건부 발생률이다. 차이는 25~40% 에 달할 수 있어 잘못된 곡선을 보고하면 결론이 정반대로 갈 수 있다. § 4.8 의 10 exercises 는 Ch.4 의 모든 도구 (KM·NA·CI·Band·RMST·median·LT·CIF) 를 다양한 데이터에 적용하는 통합 연습.”

2 § 4.7 — Summary Curves for Competing Risks

2.1 Competing Risks 의 본질

정의: Competing Risks

한 개체에서 여러 종류의 사건 이 일어날 수 있고, 그 중 하나라도 일어나면 다른 사건의 관측이 차단 되는 상황.

임상 예 (BMT § 1.3):

  • 사건 1: 재발 (relapse).
  • 사건 2: 무재발 사망 (death in remission, TRM).
  • 두 사건 중 어느 하나가 발생하면 그 이후의 다른 사건은 관측 불가.

핵심 질문: 시점 \(t\) 까지 사건 K (예: 재발) 가 발생할 확률 \(P(\text{Relapse by } t)\) 는?

함정 — “발생률” 에 대한 3 가지 다른 답

같은 데이터의 같은 사건에 대해 3 가지 다른 추정이 가능:

추정 답하는 질문 가정 세계
1-KM (Complement of KM) 다른 위험이 없었다면 시점 \(t\) 까지 K 가 일어날 확률 경쟁 위험 제거된 가상 세계
CIF (Cumulative Incidence) 현실 세계에서 시점 \(t\) 까지 K 가 일어날 확률 모든 위험이 작동하는 실제 세계
CP (Conditional Probability) 다른 사건 안 일어난 사람 중에서, 시점 \(t\) 까지 K 가 일어날 확률 생존자 한정 조건부

세 추정량의 값이 모두 다르다. 분석 목적에 따라 적합한 곡선이 다르며, 잘못 선택하면 결과 해석이 정반대로 갈 수 있다.

2.2 100 명 BMT Hypothetical 예제 — 3 곡선의 의미 차이

Klein § 4.7 의 정전 비교 사례

100 명 BMT 환자, 1 년 시점에 censoring 없음:

  • 10 명 재발 (relapse).
  • 30 명 무재발 사망 (TRM).
  • 60 명 생존 (no event).

CIF for relapse = 10/100 = 0.10 (현실 세계 — 100 명 중 10 명 실제 재발).

CP for relapse = “재발할 수 있었던 사람 중 재발한 비율”.

분모 = 100 - 30 = 70 명 (“다른 사건 = TRM 안 한 사람”). 분자 = 10 명 (실제 재발). CP = 10/70 = 0.143.

1-KM for relapse (TRM 을 censoring 처리한 KM 의 1-Ŝ):

  • TRM 을 “censored” 로 보고 KM 계산.
  • 사건 발생 패턴에 따라 결과가 달라짐:
    • 모든 TRM 이 첫 relapse 이전에 발생 → 1-KM = 10/70 = 0.143 (CP 와 일치).
    • 모든 relapse 가 첫 TRM 이전에 발생 → 1-KM = 10/100 = 0.10 (CIF 와 일치).
    • 일반적으로 0.10~0.143 사이 random 값.

1-KM 은 사건 발생 순서에 의존하는 무의미한 양. 모집단에서의 의미가 명확하지 않음.

부등식: 보통 CIF ≤ 1-KM ≤ CP. 차이는 25~40% 에 달함 (이 예에서 CIF=0.10 vs CP=0.143 → 43% 큰 추정).

2.3 CIF (Cumulative Incidence Function)

정의: CIF (식 4.7.1, Kalbfleisch-Prentice 1980)

\(t_1 < t_2 < \cdots < t_K\) = 사건 (어느 종류든) 발생 시점.

  • \(r_i\) = \(t_i\) 에서 관심 사건 K 의 수.
  • \(d_i\) = \(t_i\) 에서 다른 사건의 수.
  • \(Y_i\) = \(t_i\) 직전 위험집합.

CIF:

\[ \text{CI}(t) = \sum_{t_i \leq t} \widehat{S}(t_i^-) \cdot \frac{r_i}{Y_i} \]

여기서 \(\widehat{S}\)모든 사건 을 사건으로 간주한 overall KM (어떤 사건이라도 일어난 사람을 사건 처리).

직관 — CIF 의 두 항 분해

\(t_i\) 에서의 관심 사건 K 의 발생 확률 = (그 시점까지 어떤 사건도 안 일어날 확률) × (그 시점에 K 가 발생할 조건부 확률).

  • \(\widehat{S}(t_i^-)\): “\(t_i\) 직전까지 어떤 사건도 안 함” — 모든 risk 가 작동하는 현실의 생존확률.
  • \(r_i / Y_i\): “\(t_i\) 직전 위험집합에서 사건 K 가 발생한 비율” — K 의 cause-specific hazard 추정.

곱하면 K 의 marginal 기여. 누적합 = \(t\) 까지의 K 발생률.

핵심 성질: 모든 risk 의 CIF 합이 overall complement 와 일치.

\[ \sum_{K} \text{CI}_K(t) = 1 - \widehat{S}(t) \]

→ CIF 들이 자연스럽게 “현실 세계의 100% 분해” 를 제공. 1-KM 의 합은 이 성질을 만족하지 않는다.

정의: CIF 의 분산 (식 4.7.2)

\[ \widehat{V}[\text{CI}(t)] = \sum_{t_i \leq t} \widehat{S}(t_i)^2 \left\{[\text{CI}(t) - \text{CI}(t_i)]^2 \frac{r_i + d_i}{Y_i^2} + [1 - 2(\text{CI}(t) - \text{CI}(t_i))] \frac{r_i}{Y_i^2}\right\} \]

95% pointwise CI:

\[ \text{CI}(t) \pm Z_{1-\alpha/2} \sqrt{\widehat{V}[\text{CI}(t)]} \]

2.4 Conditional Probability (CP)

정의: Conditional Probability (식 4.7.3)

특정 risk K 에 대해:

\[ \text{CP}_K(t) = \frac{\text{CI}_K(t)}{1 - \text{CI}_{K^c}(t)} \]

  • \(K^c\) = K 가 아닌 모든 다른 위험 묶음.
  • 분모: \(t\) 까지 다른 사건이 안 일어날 확률.
직관 — CP 는 “생존자만 본 발생률”

“다른 사망 원인 (예: TRM) 이 발생하지 않은 환자 중에서 \(t\) 까지 K (예: 재발) 가 일어날 확률”.

임상 예: BMT 환자 상담 시점에서

“당신이 다른 합병증 (감염·GVHD) 으로 안 죽으면, \(t\) 시점까지 재발할 확률은 X%”

이 문맥에서 CP 가 적합. CIF 는 “재발할 확률” 자체이고, CP 는 “다른 일이 일어나지 않는다는 조건 하의 재발 확률”.

100 명 BMT 예제 재해석:

  • CIF for relapse = 0.10 → “100 명 중 10 명 재발” (전체 모집단 관점).
  • CP for relapse = 0.143 → “TRM 하지 않은 70 명 중 10 명 재발” (생존자 관점).

분모가 다르기 때문에 답이 다름. 둘 다 의미 있는 양이며, 분석 목적에 따라 선택.

CP 의 분산 (식 4.7.4)

\[ \widehat{V}[\text{CP}_K(t)] = \frac{\widehat{S}(t-)^2}{[1 - \text{CI}_{K^c}(t)]^4} \sum_{t_i \leq t} \frac{[1 - \text{CI}_{K^c}(t_i)]^2 r_i + \text{CI}_K(t_i)^2 d_i}{Y_i^2} \]

2.5 BMT ALL 38 명 손풀이 (Klein Table 4.8)

ALL 환자의 두 competing risks: relapse + death in remission (TRM). Klein Table 4.8 에서 1-KM·CIF·CP 모두 비교:

\(t_i\) \(d_i\) (TRM) \(r_i\) (relapse) \(Y_i\) TRM 1-KM Relapse 1-KM TRM CIF Relapse CIF TRM CP Relapse CP
1 1 0 38 0.0263 0.0000 0.0263 0.0000 0.0263 0.0000
55 0 1 37 0.0263 0.0270 0.0263 0.0263 0.0270 0.0270
86 1 0 35 0.0541 0.0541 0.0526 0.0526 0.0556 0.0556
122 1 1 30 0.1134 0.1680 0.1053 0.1579 0.1250 0.1765
332 0 1 21 0.2549 0.2621 0.2128 0.2380 0.2793 0.3023
526 1 0 16 0.4117 0.2990 0.3227 0.2654 0.4393 0.3919
662 0 1 13 0.4117 0.3991 0.3227 0.3243 0.4775 0.4788
손풀이 — 1 년 (365 일) 시점 BMT ALL relapse 추정

Klein Table 4.8 의 332 일 행 (1 년 시점에 가까움):

  • \(\widehat{S}(t_i^-)\) (overall KM) = ?
  • CIF (relapse) at 332 = 0.2380.
  • 1-KM (relapse) at 332 = 0.2621.
  • CP (relapse) at 332 = 0.3023.

인접 시점 1 년 (365 일) — 332 일과 383 일 사이, 332 일 값 사용:

  • CIF: \(0.2380 \approx 0.238\) (현실 세계 1 년 재발률 23.8%).
  • CP: \(0.3023 \approx 0.302\) (TRM 안 한 사람 중 30.2% 재발).
  • 1-KM: \(0.2621 \approx 0.262\) (가상 세계 — 의미 모호).

95% CI:

  • CIF: \(0.238 \pm 1.96 \cdot 0.069 = (0.103, 0.373)\) (SE = 0.069).
  • CP: \(0.302 \pm 1.96 \cdot 0.087 = (0.131, 0.473)\) (SE = 0.087, 더 큼 — 분모가 작아졌기 때문).

→ CP 가 CIF 보다 항상 크고 (보통 25%+), CI 도 더 넓음.

2.6 Klein Figure 4.14 — 통합 그림 (Stacked CIF)

CIF 합 = 1 - Ŝ overall 의 시각화

가로축 = 시간, 세로축 = 확률 [0, 1].

  • 가장 아래 영역 (0 ~ relapse CIF): 재발 확률.
  • 중간 영역 (relapse CIF ~ relapse CIF + TRM CIF): TRM 확률.
  • 가장 위 영역 (CIF 합 ~ 1): disease-free survival (Ŝ overall).

400 일 시점 (Klein 본문):

  • Relapse CIF = 0.2654.
  • TRM CIF = 0.4982 - 0.2654 = 0.2328.
  • DFS (1 - 0.4982) = 0.5018.
  • 합 = 1.0 ✓.

→ 한 그림에서 “어떤 사건이 어느 시점에 얼마나 일어나는가” 를 동적으로 파악. 임상 보고의 표준 (특히 BMT 분야).

2.7 Theoretical Notes (3 개)

Theoretical Note 1 — 1-KM 의 의미

Cause-specific hazard:

\[ \lambda_X(t) = \lim_{\Delta t \to 0} \frac{P[t \leq X < t + \Delta t \mid \min(X, Y) > t]}{\Delta t} \]

다른 사건 (Y) 을 censoring 처리한 KM 은 \(\exp\{-\int_0^t \lambda_X(u) du\}\) 의 일관 추정.

→ 이 양은 “\(Y\) 가 작동하지 않는 가상 세계” 의 X 의 marginal survival 이 아니다 (가정 의존). \(Y\)\(X\) 의 dependence 가 식별 불가 (Tsiatis 1975 — Ch.2.7).

결론: 1-KM 은 cause-specific hazard 의 적분 \(\exp(-\int \lambda_X)\) 를 추정하는 양이지만, 확률 해석이 없음 — 임상 보고 부적합.

Theoretical Note 2 — Kalbfleisch-Prentice 1980 의 CIF 도출

CIF 는 non-homogeneous Markov process 의 transition 으로 도출된다 (Andersen et al. 1993).

  • 상태: “alive” → “relapse” 또는 “TRM” 으로의 전이.
  • 각 transition 의 cumulative intensity 가 cause-specific hazard 의 적분.
  • CIF = 누적 transition 확률.

→ 이 framework 에서 CIF 의 점근 정규성·신뢰구간 도출. counting process 이론의 자연스러운 일반화 (Ch.3.6).

Theoretical Note 3 — Pepe-Mori 1993 의 추가 논의

Pepe & Mori (1993), Pepe et al. (1993), Gooley et al. (1999):

  • CIF 의 다른 분산 추정량 (variance estimator) 비교.
  • 1-KM 사용의 함정에 대한 광범위한 논의.
  • CP 의 임상적 해석 가이드.

실무 권장: BMT, 종양학 등 competing risks 가 흔한 분야에서 CIF 와 CP 모두 보고, 1-KM 은 사용 금지.

2.8 Practical Note

통계 패키지
도구 CIF CP
R cmprsk cuminc(ftime, fstatus, group) timepoints 에서 직접
R survival survfit(... ~ 1, etype=event) 직접
R tidycmprsk tidy 인터페이스 tidy 인터페이스
Python lifelines AalenJohansenFitter 직접
Python scikit-survival cumulative_incidence
SAS PROC LIFETEST 의 cif option macro
library(cmprsk)
ci <- cuminc(ftime = bmt$time,
             fstatus = bmt$event,  # 0=cens, 1=relapse, 2=TRM
             group = bmt$group,
             cencode = 0)
plot(ci, curvlab = c("ALL relapse", "AML relapse",
                     "ALL TRM", "AML TRM"))

3 § 4.8 — Ch.4 Exercises 풀이 가이드

Ch.4 의 10 exercises 는 Ch.4 의 모든 도구 (KM·NA·Greenwood·Aalen·CI·Band·RMST·median·left-trunc·CIF·CP) 를 다양한 데이터에 통합 적용. 각 문제의 핵심 풀이 패턴을 정리.

3.1 Exercise 4.1 — Tongue Cancer (Aneuploid)

Klein § 1.11 의 80 명 tongue cancer 중 aneuploid tumor 환자.

(a)~(b) — 12·60 개월 시점의 \(\widehat{S}\) + Greenwood SE + \(\widehat{H}\) + Aalen SE.

  • 풀이 패턴: § 4.2 의 KM·NA 계산 (04-1 편 손풀이).
  • 비교: \(\widetilde{S}(60) = \exp(-\widehat{H}(60))\)\(\widehat{S}(60)\) 의 차이 (§ 4.2 Theoretical Note 7 의 Taylor 1 차).

(c)~(e)\(S(60)\) 의 95% CI 3 종 (linear · log · arcsine).

  • 풀이 패턴: § 4.3 의 식 4.3.1~4.3.3 (04-2 편 BMT ALL 1 년 손풀이와 동일).

(f)~(g) — 36~72 개월 95% confidence band (EP log + HW log).

  • 풀이 패턴: § 4.4 의 식 4.4.1, 식 4.4.3, 식 4.4.6 (04-2 편 손계산).
  • \(a_L, a_U\) 계산 → Klein Appendix C.3 에서 \(c_\alpha\) → Appendix C.4 에서 \(k_\alpha\).

(h)~(i) — RMST (400 개월 한정) + median + 95% CI.

  • 풀이 패턴: § 4.5 의 식 4.5.1·4.5.2·4.5.3 + Brookmeyer-Crowley 식 4.5.4 (04-3 편).
R 코드 (Ex 4.1)
library(KMsurv)
data(tongue)
aneuploid <- subset(tongue, type == 1)

fit <- survfit(Surv(time, delta) ~ 1, data = aneuploid,
               conf.type = "log-log")
summary(fit, times = c(12, 60))                # (a)~(c)

print(fit, rmean = 400)                        # (h)

3.2 Exercise 4.2 — BMT AML (Low/High)

Klein § 1.3 의 BMT 137 명 중 AML low risk + AML high risk. Example 4.2 의 ALL 처리를 그대로 두 군에 반복.

(a)~(c) — 두 군의 \(\widehat{S}\), \(\widehat{H}\), hazard rate 추정.

(d) — Mean DFS (정답: AML low 1549 days, AML high 792 days; § 4.5 본문).

(e) — Median DFS (정답: AML low 2204 days, lower CI 704/641; AML high 183 days, CI (115, 363)).

(f)~(h) — 300 일 시점 CI + 100~400 일 EP/HW band.

(i) — 3 군 비교 결론: AML low > ALL > AML high (모든 측면).

3.3 Exercise 4.3 — Lung Cancer Interim Analysis

25 명 lung cancer, interim (1980-03-31, 13 명 사망) vs complete (모든 사건 관측).

(a) — Interim 데이터로 KM (heavily censored).

(b) — BHK exponential tail (Practical Note 3 of § 4.2):

\[ \widehat{S}(t > t_{\max}) = \exp\{t \ln[\widehat{S}(t_{\max})]/t_{\max}\} \]

→ tail 처리 후 면적 계산 가능.

(c) — Complete follow-up 으로 KM (no censoring).

(d)~(f) — 평균 추정 3 가지 비교:

    1. 면적 (정 product-limit): \(\int_0^{683} \widehat{S}(t) dt\).
    1. 면적 (사건 시점에서 step function): same as (d).
    1. Sample mean: \(\bar{T} = \sum T_i / 25\) (no censoring 이라 자명).

세 추정이 모두 같은 값 (Practical Note 1 of § 4.5 — censoring 없으면 KM-based mean = sample mean).

직관 — interim 의 함정
  • Interim KM (a): 13 사건 + 12 censoring. 마지막 censoring 이 320 일이면 KM 정의 안 됨 너머. BHK 로 tail 보완 필요.
  • Complete KM (c): 25 사건 모두 관측. censoring 없는 KM = sample CDF의 1-F = empirical survival.

interim 분석은 항상 censoring 가정에 의존. 진짜 사건 시점이 모두 관측되면 비모수 추정과 모수적 mean 이 일치.

3.4 Exercise 4.4 — Kidney Dialysis (Surgical vs Percutaneous)

Klein § 1.4 의 119 명 dialysis 환자, 두 catheter 그룹 (surgical 43, percutaneous 76).

(a) — 두 군의 KM 비교 plot. 어느 쪽이 infection 까지 더 오래 가는가?

(b) — NA 의 기울기로 hazard rate 추정 (5 개월 시점).

(c) — 36 개월 한정 mean 의 95% CI (식 4.5.3).

임상적 해석 (Klein § 1.4 의 PH 위반)

Percutaneous 군의 hazard 가 첫 0.5 개월에 집중 → PH 가정 위반의 정전 예제.

  • 두 군의 cumulative hazard plot 이 평행이 아님 → log-rank 의 검정력 약함.
  • time-varying effect 모형 (Ch.9) 또는 RMST 차이 (§ 4.5) 가 적합.

3.5 Exercise 4.5 — Black Female Kidney Transplant

Klein § 1.7 의 OSU 863 명 중 black female 59 명.

(a) — KM + Greenwood SE.

(b)~(d) — 12 개월 시점 95% CI 3 종 (linear · log · arcsine).

  • 풀이 패턴: 04-2 편 BMT ALL 1 년 손풀이와 동일.
  • 비교: 세 CI 의 폭과 비대칭성.

3.6 Exercise 4.6 — Burn Study (Chlorhexidine vs Povidone)

Klein § 1.6 의 154 명 burn 환자, 두 disinfectant 그룹.

(a) — 두 군 KM + SE.

(b) — Cumulative hazard plot. 두 곡선이 평행이면 PH 성립.

(c) — Median + 95% CI 3 종 (Brookmeyer-Crowley 식 4.5.4~4.5.6).

(d) — 10 일 시점 CI 2 종 (log + arcsine).

(e)~(f) — 8~20 일 confidence band 4 종 (linear/log/arcsine × EP/HW).

(g) — Chlorhexidine 의 우월성 평가.

3.7 Exercise 4.7 — Hypothetical 30 Diabetics (Left Truncation)

좌절단의 직접 처리. 30 명 diabetic 의 entry age + exit age (death/censoring) 데이터.

(a) — 위험집합 \(Y\) 를 age 의 함수로 plot — § 4.6 의 산 모양.

(b)~(c) — 60·70 세에서의 conditional survival (식 4.6.1).

(d)잘못된 처리: 좌절단 무시하고 우측 censoring 만으로 KM. \(Y_i\) 가 잘못 계산되어 실제와 다른 결과.

직관 — Ex 4.7 의 핵심 학습
  • 좌절단 데이터를 무시하면 → entry 이전 사망자가 표본에 없는데 “있었다고” 가정 → KM 이 사망률 과소 추정.
  • 좌절단 처리하면 → conditional survival 의 정확한 추정.

이 차이가 의료기록 retrospective study 에서 흔한 함정.

3.8 Exercise 4.8 — Psychiatric (Left Truncation)

Klein § 1.7 의 26 명 psychiatric inpatient 데이터. Left truncated by entry age + right censored.

(a)\(Y_i\) vs age plot.

(b) — 30 세 conditional survival (식 4.6.1, \(a = 30\)).

→ 매우 어린 entry 부터의 추적 — 60 세 + 의 Channing 보다 더 광범위한 age 분포.

3.9 Exercise 4.9 — Hoel-Walburg Mice (3 Competing Risks)

102 명 mice (300 rad 방사선) 의 사망 원인 3 가지: thymic lymphoma · reticulum cell sarcoma · other.

(a) — 200, 300, …, 1000 일에서 3 risks 의 CIF (식 4.7.1).

(b) — CIF 합 = 1 - KM overall 검증 (CIF 의 핵심 성질).

(c) — 1-KM 으로 동일하게 추정 후 CIF 와 비교 — 차이 정량화.

(d) — Thymic lymphoma 의 CP at 500·800 일.

Ex 4.9 의 학습 포인트
  • 3 risks 모두 cause-specific hazard 분리 가능.
  • CIF 합 = 1 - Ŝ overall — 자동 보장 (정의의 결과).
  • 1-KM 합 ≠ 1 - Ŝ overall — 사건 패턴에 따라 임의 값.

CIF 의 우월성 시각적 증명.

3.10 Exercise 4.10 — BMT AML Competing Risks

Klein § 1.3 의 AML low + AML high 두 군. 두 risks: relapse + death in remission.

(a) — 1 년 CIF (Klein Example 4.2 의 BMT ALL 처리를 두 AML 군에 반복).

(b) — CIF SE.

(c) — CP for relapse + CP for TRM.

(d) — CP SE.

(e) — Klein Figure 4.14 형식의 stacked plot — DFS = 1 - (relapse CIF + TRM CIF).

두 AML 군 비교 (예상 결과)
  • AML low: relapse CIF 작음, TRM CIF 작음 → DFS 높음.
  • AML high: relapse CIF 큼, TRM CIF 큼 → DFS 낮음.

이 정량화로 임상 의사결정 (위험 분류) 의 근거를 제공.

4 Ch.4 통합 7 가지 교훈

Ch.4 시리즈의 핵심 교훈
  1. \(d_i/Y_i\) 가 모든 비모수 추정의 building block — KM (곱), NA (합), RMST (적분), median (역변환), 좌절단 (Y 재정의), CIF (cause-specific 분리). 도구 7 개가 한 가지 양의 변형.

  2. 5 가지 KM 유도가 모두 동일 — reduced-sample · redistribute-to-the-right · self-consistency · counting process · NPMLE. KM 의 robustness 의 깊이.

  3. Greenwood = delta method 두 번 — log 변환 + Binomial 분산 + delta. Aalen = Poisson 근사 한 번. 단순한 시작에서 깔끔한 결과.

  4. 변환된 CI 가 표준 — Linear 는 [0,1] 벗어나고 소표본 미달. Log-transformed (Kalbfleisch-Prentice 1980) + Arcsine (Nair 1984) 가 finite sample 에서 nominal coverage 보장.

  5. Pointwise CI ≠ Confidence Band — 한 점 95% vs 전 구간 동시 95%. 절대 혼동 말 것. EP/HW band 가 진짜 동시 보장. Brownian bridge weak convergence 가 토대.

  6. PH 위반 시대의 RMST + Brookmeyer-Crowley — Hazard ratio 가정 위반 시 RMST 의 절대 척도. Median CI 는 density 추정 우회 (Ŝ CI 가 0.5 포함하는 t).

  7. CIF ≠ 1-KM 함정 — Competing risks 에서 1-KM 은 “다른 위험 0 인 가상 세계” 라 의미 모호. CIF (현실 세계) 와 CP (생존자 한정) 둘 다 보고. 차이는 25~40% 가능.

5 Ch.5 예고 — Other Sampling Schemes

Ch.4 가 우측 censoring + 좌절단 의 비모수 추정을 다뤘다면, Ch.5 는 다른 sampling scheme:

  • Left censoring (사건이 entry 이전).
  • Double censoring (좌측 + 우측 모두).
  • Interval censoring (Turnbull 1976 의 NPMLE).
  • Right truncation (entry 이후 사건 발생자만 표본 포함).
  • Grouped data (cohort life table).

→ 각 scheme 별로 수정된 likelihood 와 추정량. Ch.4 의 framework 가 어떻게 일반화되는지.

6 관련 주제

선행 지식

후속 주제

  • Ch.5 — Other Sampling Schemes (interval cens · right trunc · life table)
  • Ch.7 — Log-rank · RMST 차이 검정
  • Ch.8 — Cox PH (cause-specific Cox)
  • Ch.10 — Aalen Additive · Lin-Ying (Fine-Gray subdistribution Cox)

관련 개념

Subscribe

Enjoy this blog? Get notified of new posts by email: