Klein § 12.2-12.3 — Weibull & Log-Logistic Regression Models

두 분포의 MLE · AFT/PH/비례오즈 표현 · 델타 방법 · 후두암 예제

Klein Ch.12 의 두 핵심 모수 회귀 모형을 정리한다. Weibull 분포는 AFT 와 PH 표현을 동시에 가지는 유일한 분포이며, 로그-로지스틱은 AFT 와 비례 오즈 표현을 동시에 가지는 유일한 분포이다. 두 모형의 MLE, 델타 방법으로 변환된 분산 공식, 그리고 AML 이식과 후두암 예제를 통한 해석을 다룬다.

Statistics
Survival Analysis
저자

Kwangmin Kim

공개

2026년 05월 04일

1 도입 — 두 분포를 같이 다루는 이유

§ 12.1 에서 본 것처럼 본 장의 모든 모형은 AFT 표현 (\(S(x \mid Z) = S_0[\exp(\theta^t Z) x]\)) 과 로그 선형 표현 (\(Y = \mu + \gamma^t Z + \sigma W\)) 을 동시에 가진다. 그러나 그 외에 추가로 가지는 표현은 분포마다 다르다.

분포 추가 표현 위험률 형상
Weibull 비례 위험 (PH) 단조 (증가/감소/상수)
로그-로지스틱 비례 오즈 (Proportional Odds) 단봉 (hump-shaped)

이 두 분포는 각자의 추가 표현을 가지는 유일한 분포라는 점에서 모수 회귀의 양대 축이다. 본 포스트는 두 분포의 MLE, 분산 공식, 그리고 두 가지 임상 예제 (AML 이식, 후두암) 에서의 해석을 다룬다.

2 § 12.2 Weibull 분포

2.1 분포 형식과 위험률 형상

\[ S_X(x) = \exp(-\lambda x^\alpha), \qquad h_X(x) = \lambda \alpha\, x^{\alpha-1} . \]

\(\alpha\) 위험률 형상 임상 해석
\(\alpha = 1\) 상수 (지수 분포) 사건이 무작위 시점에 동일 강도
\(\alpha > 1\) 증가 노화·악화·마모
\(\alpha < 1\) 감소 수술 직후 회복기, 신생아 사망
직관 — \(\alpha\) 가 위험률 형상을 결정하는 이유

\(h_X(x) = \lambda \alpha x^{\alpha-1}\) 에서 \(x\) 에 대한 의존성은 \(x^{\alpha-1}\) 항에만 있다. \(\alpha = 1\) 이면 \(x^0 = 1\) 이므로 위험률은 시간 무관 상수이고, \(\alpha > 1\) 이면 양의 거듭제곱이 되어 시간이 갈수록 위험이 커지며, \(\alpha < 1\) 이면 음의 거듭제곱이라 위험이 감소한다. \(\alpha\) 는 형상 (shape) 모수, \(\lambda\) 는 척도 (scale) 모수로 해석한다.

2.2 로그 선형 표현과 극단값 분포

\(X\) 가 Weibull 이면 \(Y = \ln X\) 는 다음 로그 선형 모형을 따른다:

\[ Y = \mu + \sigma W, \qquad W \sim \text{표준 극단값 분포}. \]

오차 분포 \(W\) 의 밀도와 생존함수:

\[ f_W(w) = \exp(w - e^w), \qquad S_W(w) = \exp(-e^w) . \]

모수 변환:

\[ \lambda = \exp(-\mu/\sigma), \qquad \alpha = 1/\sigma . \]

직관 — 왜 극단값 분포인가

극단값 분포는 표본 최대/최소의 극한 분포로 잘 알려져 있다. Weibull 변수 \(X\) 의 로그 \(Y = \ln X\) 가 극단값 분포의 위치-척도 변환을 따른다는 사실은, 로그 시간 척도에서 보면 사건의 발생 시점이 마치 어떤 극값처럼 행동한다는 의미이다. 이 표현 덕분에 표준화된 잔차 \(W = (Y - \mu)/\sigma\) 가 분포에 무관한 형태가 되고, 일반적인 회귀 도구로 처리할 수 있다.

2.3 우도와 MLE

우중도절단 데이터의 우도:

\[ L = \prod_{j=1}^n \left[ \frac{1}{\sigma} f_W\!\left(\frac{y_j - \mu}{\sigma}\right) \right]^{\delta_j} \left[ S_W\!\left(\frac{y_j - \mu}{\sigma}\right) \right]^{1-\delta_j} . \]

  • \(\delta_j = 1\): 사건 관찰 → 밀도 항 기여.
  • \(\delta_j = 0\): 절단 → 생존함수 항 기여 (정보가 “그 시점까지 살아있었다” 뿐).

수치 최적화로 \(\widehat{\mu}, \widehat{\sigma}\) 를 얻는다. 관찰 정보 행렬 (observed information matrix) 의 역행렬이 \(\mathrm{Var}(\widehat{\mu}, \widehat{\sigma})\) 를 준다.

2.4 델타 방법 — 원래 모수의 분산

MLE 의 불변성 원리로 \(\widehat{\lambda} = \exp(-\widehat{\mu}/\widehat{\sigma})\), \(\widehat{\alpha} = 1/\widehat{\sigma}\) 이지만, 분산은 직접 얻어지지 않는다. 델타 방법으로 1차 Taylor 전개를 하여 변환:

\[ \mathrm{Var}(\widehat{\lambda}) = \exp(-2\widehat{\mu}/\widehat{\sigma})\!\left[ \frac{\mathrm{Var}(\widehat{\mu})}{\widehat{\sigma}^2} + \frac{\widehat{\mu}^2 \mathrm{Var}(\widehat{\sigma})}{\widehat{\sigma}^4} - \frac{2 \widehat{\mu} \mathrm{Cov}(\widehat{\mu}, \widehat{\sigma})}{\widehat{\sigma}^3} \right] \]

(식 12.2.7)

\[ \mathrm{Var}(\widehat{\alpha}) = \frac{\mathrm{Var}(\widehat{\sigma})}{\widehat{\sigma}^4}, \qquad \mathrm{Cov}(\widehat{\lambda}, \widehat{\alpha}) = \exp(-\widehat{\mu}/\widehat{\sigma})\!\left[\frac{\mathrm{Cov}(\widehat{\mu}, \widehat{\sigma})}{\widehat{\sigma}^3} - \frac{\widehat{\mu} \mathrm{Var}(\widehat{\sigma})}{\widehat{\sigma}^4}\right] \]

(식 12.2.8-9)

직관 — 델타 방법의 핵심

함수 \(g(\widehat{\theta})\) 의 분산은 1차 Taylor 전개 \(g(\widehat{\theta}) \approx g(\theta) + \nabla g^t (\widehat{\theta} - \theta)\) 로부터:

\[ \mathrm{Var}\bigl(g(\widehat{\theta})\bigr) \approx \nabla g^t\, \mathrm{Var}(\widehat{\theta})\, \nabla g . \]

\(\widehat{\lambda} = \exp(-\widehat{\mu}/\widehat{\sigma})\) 에서 편미분을 계산해 위 공식에 대입하면 식 12.2.7 이 그대로 나온다. 공식이 복잡해 보이지만 본질은 단순한 함수의 선형근사이다.

2.5 예제 12.1 — AML 이식 단변량 적합

자가 (auto) vs 동종 (allo) 골수 이식을 받은 급성 골수성 백혈병 환자 101 명의 무백혈병 생존시간:

\(\widehat{\mu}\) \(\widehat{\sigma}\) \(\widehat{\lambda}\) \(\widehat{\alpha}\)
auto 3.45 1.11 0.045 0.900
allo 4.25 1.94 0.112 0.514

2.5.1 지수 분포 적합 검정 (\(H_0: \sigma = 1 \Leftrightarrow \alpha = 1\))

우도비 검정:

  • allo: \(\ln L_{\text{Wei}} = -72.879\), \(\ln L_{\text{Exp}} = -81.203\)\(\chi^2 = 2(81.203 - 72.879) = 16.648\), \(p \ll 0.001\). 지수 모형 기각 (위험률이 시간에 따라 변함).
  • auto: \(\ln L_{\text{Wei}} = -68.420\), \(\ln L_{\text{Exp}} = -68.653\)\(\chi^2 = 0.467\), 유의하지 않음. 지수 모형 채택 가능.
주의 — 동일 데이터에서 결론이 다른 이유

auto 군은 \(\widehat{\alpha} = 0.900\) 으로 1 에 매우 가깝지만, allo 군은 \(\widehat{\alpha} = 0.514\) 로 1 과 크게 다르다. 지수 모형은 위험률이 일정해야 하므로, allo 군처럼 위험률이 시간에 따라 강하게 감소하는 (수술 후 초기 사망률이 높고 안정기로 가면 낮아지는) 경우에는 부적합하다.

2.6 Weibull 회귀 — AFT 와 PH 의 동시 표현

2.6.1 AFT 표현

\[ Y = \mu + \gamma^t Z + \sigma W . \]

  • \(\gamma_j < 0\): \(Z_j\) 증가 → 로그 시간 감소 → 사건 빨라짐 (위험 증가).
  • 가속 인자: \(\exp(\theta^t Z) = \exp(-\gamma^t Z)\).

2.6.2 PH 표현

\[ h(x \mid Z) = \alpha \lambda x^{\alpha-1} \exp(\beta^t Z) . \]

  • \(\beta_j > 0\): \(Z_j\) 증가 → 위험률 증가.
  • 두 표현은 다음 변환으로 연결: \(\beta_j = -\gamma_j/\sigma\), \(\alpha = 1/\sigma\), \(\lambda = \exp(-\mu/\sigma)\).
직관 — \(\beta_j = -\gamma_j/\sigma\) 의 의미

\(\sigma\) 가 척도 모수이므로 \(\gamma_j\) 의 절댓값이 같아도 \(\sigma\) 가 작으면 PH 효과 \(\beta_j\) 가 커진다. AFT 효과를 시간 단위에서 측정한 후 척도로 나누어 위험률 단위로 환산하는 것이 직관이다. 또 부호가 뒤집히는 이유는 AFT 가 시간을 늦추면 PH 는 위험을 줄이는 (반대 방향) 관계이기 때문이다.

2.6.3 Weibull 의 유일성

\[ \boxed{\text{Weibull 은 AFT 와 PH 를 모두 만족시키는 유일한 연속 분포이다.}} \]

증명 스케치: AFT 는 \(h(x \mid Z) = \exp(\theta^t Z) h_0[\exp(\theta^t Z) x]\) 이고, PH 는 \(h(x \mid Z) = \exp(\beta^t Z) h_0(x)\) 이다. 두 식이 일치하려면 \(h_0[\exp(\theta^t Z) x] = \exp(\beta^t Z - \theta^t Z) h_0(x)\) 이 모든 \(x, Z\) 에 대해 성립해야 하고, 이로부터 \(h_0(x) = \lambda \alpha x^{\alpha-1}\) 형태 (Weibull) 만이 가능하다.

2.7 회귀 분산의 델타 방법 변환

회귀 계수 \(\widehat{\beta}_j = -\widehat{\gamma}_j / \widehat{\sigma}\) 의 분산:

\[ \mathrm{Cov}(\widehat{\beta}_j, \widehat{\beta}_k) = \frac{\mathrm{Cov}(\widehat{\gamma}_j, \widehat{\gamma}_k)}{\widehat{\sigma}^2} - \frac{\widehat{\gamma}_j \mathrm{Cov}(\widehat{\gamma}_j, \widehat{\sigma})}{\widehat{\sigma}^3} - \frac{\widehat{\gamma}_k \mathrm{Cov}(\widehat{\gamma}_k, \widehat{\sigma})}{\widehat{\sigma}^3} + \frac{\widehat{\gamma}_j \widehat{\gamma}_k \mathrm{Var}(\widehat{\sigma})}{\widehat{\sigma}^4} \]

(식 12.2.13)

이 공식들 (식 12.2.13-18) 은 패키지가 출력하는 \((\widehat{\mu}, \widehat{\sigma}, \widehat{\gamma})\) 의 공분산을 PH 모수 \((\widehat{\lambda}, \widehat{\alpha}, \widehat{\beta})\) 로 변환할 때 사용된다.

2.8 예제 12.2 — 후두암 회귀 (Weibull AFT)

90 명 후두암 환자에서 Stage (I-IV) 와 나이의 효과:

\[ Y = \ln X = \mu + \gamma_1 Z_1 + \gamma_2 Z_2 + \gamma_3 Z_3 + \gamma_4 Z_4 + \sigma W \]

여기서 \(Z_1, Z_2, Z_3\) 는 Stage II/III/IV 더미, \(Z_4\) 는 나이.

AFT 결과 (Table 12.1):

변수 \(\widehat{\gamma}\) SE Wald \(\chi^2\) \(p\)
Intercept \(\widehat{\mu}\) 3.53 0.90
Scale \(\widehat{\sigma}\) 0.88 0.11
Stage II (\(\widehat{\gamma}_1\)) \(-0.15\) 0.41 0.13 0.717
Stage III (\(\widehat{\gamma}_2\)) \(-0.59\) 0.32 3.36 0.067
Stage IV (\(\widehat{\gamma}_3\)) \(-1.54\) 0.36 18.07 \(< 0.0001\)
Age (\(\widehat{\gamma}_4\)) \(-0.02\) 0.01 1.87 0.172

PH 변환 결과 (Table 12.2):

변수 \(\widehat{\beta} = -\widehat{\gamma}/\widehat{\sigma}\) SE
Stage II (\(\widehat{\beta}_1\)) 0.17 0.46
Stage III (\(\widehat{\beta}_2\)) 0.66 0.36
Stage IV (\(\widehat{\beta}_3\)) 1.75 0.42
\(\widehat{\alpha}\) 1.13 0.14

2.8.1 해석

  • 상대 위험 (Stage IV vs I): \(\exp(1.745) = 5.73\). Stage IV 환자는 Stage I 대비 5.73 배 위험.
  • 가속 인자 (Stage IV vs I): \(\exp(1.54) = 4.68\). Stage I 의 중앙 생존시간이 Stage IV 의 4.68 배.
  • 나이: 통계적으로 유의하지 않음 (\(p = 0.172\)).
직관 — AFT 의 부호 vs Cox 의 부호

Cox PH 모형에서는 \(\beta > 0\) 이 위험 증가 (나쁜 예후) 이지만, AFT 에서는 \(\gamma < 0\) 이 위험 증가이다. 로그 시간이 줄어든다는 것이 사건이 빨리 일어난다는 뜻이기 때문이다. 부호 해석을 헷갈리지 않으려면 항상 “AFT 는 시간을, PH 는 위험을” 모형화한다는 점을 기억한다.

가속 인자와 상대 위험의 관계

Weibull 에서 \(\beta = -\gamma/\sigma\) 이므로 가속 인자 \(e^\theta = e^{-\gamma}\) 와 상대 위험 \(e^\beta = e^{-\gamma/\sigma}\) 는 다른 양이다. Stage IV 예에서:

  • \(e^{-\gamma_3} = e^{1.54} = 4.68\) (가속 인자)
  • \(e^{\beta_3} = e^{1.75} = 5.73\) (상대 위험)

비율 \(5.73/4.68 = e^{1.75-1.54} = e^{0.21}\)\(\widehat{\alpha} = 1/\widehat{\sigma} = 1.13\) 의 효과를 반영한다. \(\sigma < 1\) 일 때 PH 효과가 AFT 효과보다 크다.

3 § 12.3 로그-로지스틱 분포

3.1 분포 형식과 단봉 위험률

\[ S_X(x) = \frac{1}{1 + \lambda x^\alpha}, \qquad H_X(x) = \ln(1 + \lambda x^\alpha) . \]

(식 12.3.1, 12.3.2)

위험률은 \(\alpha > 1\) 일 때 단봉형 (초기에 증가하다가 정점 후 감소). \(\alpha \le 1\) 이면 단조 감소.

직관 — 단봉 위험률이 적합한 사례
  • 수술 후 합병증: 수술 직후 위험이 빠르게 증가했다가, 회복 기간이 지나면 점차 감소.
  • 신약 부작용: 약물 농도 상승기에 위험 증가, 안정기 진입 후 감소.
  • 혼인 해소율: 결혼 후 수년간 증가하다가 장기간 안정한 부부의 해소율은 낮아짐.

이 같은 사건에 Cox PH 를 그대로 적용하면 베이스라인이 비모수라 도식적 해석이 어렵다. 로그-로지스틱은 명시적인 단봉 함수로 형상을 잡아낸다.

3.2 로지스틱 오차 분포와 폐쇄형의 이점

\(Y = \ln X = \mu + \sigma W\) 에서 \(W\) 는 표준 로지스틱:

\[ f_W(w) = \frac{e^w}{(1+e^w)^2}, \qquad S_W(w) = \frac{1}{1+e^w} . \]

(식 12.3.5, 12.3.6)

따라서 \(Y\) 의 생존함수는

\[ S_Y(y) = \frac{1}{1 + \exp[(y - \mu)/\sigma]} . \]

(식 12.3.8)

폐쇄형의 이점: 로그정규는 \(\Phi(\cdot)\) (수치 적분 필요) 로 표현되는 반면, 로그-로지스틱은 초등 함수만으로 표현된다. 분위수, 중앙값, 적률 모두 명시적 공식이 있다.

3.3 모수 변환

Weibull 과 동일:

\[ \alpha = 1/\sigma, \qquad \lambda = \exp(-\mu/\sigma) . \]

(식 12.3.9)

3.4 예제 12.1 (계속) — AML 단변량 (로그-로지스틱)

\(\widehat{\mu}\) \(\widehat{\sigma}\) \(\widehat{\lambda}\) \(\widehat{\alpha}\)
auto 2.944 0.854 0.032 1.171
allo 3.443 1.584 0.114 0.631

auto 군은 \(\widehat{\alpha} = 1.171 > 1\) 이라 단봉형 위험률을 시사하고, allo 군은 \(\widehat{\alpha} = 0.631 < 1\) 이라 단조 감소 위험률을 시사한다.

3.5 비례 오즈 (Proportional Odds, PO) 표현

\(\lambda\)\(\lambda \exp(\beta^t Z)\) 로 대체하면:

\[ S_X(x \mid Z) = \frac{1}{1 + \lambda \exp(\beta^t Z) x^\alpha} . \]

(식 12.3.11)

이 표현의 핵심은 생존 오즈 \(S/(1-S)\) 의 비율이 시간에 무관하다는 점:

\[ \frac{S(x \mid Z)}{1 - S(x \mid Z)} = \frac{1}{\lambda \exp(\beta^t Z) x^\alpha} = \exp(-\beta^t Z) \cdot \frac{S_0(x)}{1 - S_0(x)} . \]

(식 12.1.4)

직관 — PH vs PO 의 차이
  • PH (비례 위험): 두 군의 위험비 \(h_1/h_2 = \exp(\beta)\) 가 모든 시점에서 일정.
  • PO (비례 오즈): 두 군의 생존 오즈비 \(\text{odds}_1/\text{odds}_2 = \exp(-\beta)\) 가 모든 시점에서 일정.

PH 가 깨지는 (위험비가 시간에 따라 변하는) 사건이라도 PO 가 성립할 수 있다. 단봉 위험률을 가지는 두 군은 정점 시점이 비슷하면 PO 를 만족하기 쉽다.

3.5.1 비례 오즈의 시간 변동 위험비

PO 모형은 위험비가 시간에 따라 변하는 것을 허용하지만, 그 변화가 수렴하는 패턴이다. 구체적으로:

\[ \frac{h_1(t)}{h_2(t)} \to 1 \quad (t \to \infty) . \]

즉 충분히 시간이 흐르면 두 군의 위험률이 같아진다. 임상적으로는 “초기에는 차이가 크지만 장기 생존자들 사이에서는 위험이 비슷해진다”는 직관이다.

3.6 로그-로지스틱의 유일성

\[ \boxed{\text{로그-로지스틱은 AFT 와 비례 오즈를 모두 만족시키는 유일한 분포이다.}} \]

이는 Weibull 이 AFT+PH 를 모두 가지는 것과 짝을 이루는 결과이다. 두 분포는 모수 회귀의 두 큰 가족 (PH 와 PO) 의 대표 멤버이다.

3.7 예제 12.2 (계속) — 후두암 회귀 (로그-로지스틱)

AFT 결과 (Table 12.3):

변수 \(\widehat{\gamma}\) SE Wald \(\chi^2\) \(p\)
Intercept \(\widehat{\mu}\) 3.10 0.95
Scale \(\widehat{\sigma}\) 0.72 0.09
Stage II (\(\widehat{\gamma}_1\)) \(-0.13\) 0.42 0.09 0.762
Stage III (\(\widehat{\gamma}_2\)) \(-0.81\) 0.35 5.18 0.023
Stage IV (\(\widehat{\gamma}_3\)) \(-1.77\) 0.43 17.22 \(< 0.0001\)
Age (\(\widehat{\gamma}_4\)) \(-0.015\) 0.014 1.20 0.273

PO 변환 결과 (Table 12.4):

변수 \(\widehat{\beta} = -\widehat{\gamma}/\widehat{\sigma}\) SE
Stage II (\(\widehat{\beta}_1\)) 0.176 0.581
Stage III (\(\widehat{\beta}_2\)) 1.127 0.498
Stage IV (\(\widehat{\beta}_3\)) 2.469 0.632
\(\widehat{\alpha}\) 1.398 0.168

3.7.1 해석

  • 생존 오즈비 (Stage III vs I): \(\exp(-1.127) = 0.32\). Stage III 환자는 Stage I 대비 생존 오즈가 0.32 배 (역으로 사망 오즈는 \(1/0.32 = 3.13\) 배).
  • 생존 오즈비 (Stage IV vs I): \(\exp(-2.469) = 0.085\). 사망 오즈는 \(1/0.085 = 11.81\).
  • 가속 인자 (Stage IV vs I): \(\exp(1.77) = 5.87\). Stage I 의 중앙 생존시간이 Stage IV 의 5.87 배.
  • 나이: 유의하지 않음 (\(p = 0.273\)).
두 모형 비교 — 후두암 데이터
Weibull 로그-로지스틱
Stage IV \(\widehat{\gamma}_3\) \(-1.54\) \(-1.77\)
Stage IV 가속 인자 4.68 5.87
Stage IV 효과 측정 HR = 5.73 OR = 11.81
\(\widehat{\sigma}\) 0.88 0.72

두 모형 모두 Stage IV 가 강력한 위험 인자임을 잡아내지만, 효과 측정의 단위가 다르다 (HR vs OR). \(\sigma\) 가 다르므로 가속 인자도 약간 다르게 나온다. 어느 모형이 더 적합한지는 § 12.5 의 잔차 진단으로 판단한다.

4 두 모형의 통합적 비교

측면 Weibull 로그-로지스틱
오차 분포 \(W\) 표준 극단값 표준 로지스틱
위험률 형상 단조 (증가/감소/상수) 단봉 (\(\alpha > 1\)) 또는 단조 감소 (\(\alpha \le 1\))
회귀 동치 표현 AFT + PH AFT + 비례 오즈
효과 측정 HR = \(\exp(\beta)\) OR = \(\exp(-\beta)\)
위험비의 시간 의존 일정 수렴 (\(t \to \infty\) 에 1)
폐쇄형 생존함수
내포 검정 \(\alpha = 1\) → 지수 (지수 등 비내포)
분포 선택 가이드
  1. 위험률 형상이 단조 (예: 노화, 기계 마모) → Weibull.
  2. 위험률 형상이 단봉 (예: 수술 후 회복, 약물 부작용) → 로그-로지스틱 또는 로그정규.
  3. 위험비가 시간에 따라 수렴 (장기 생존자 사이에서는 위험이 비슷) → 로그-로지스틱 (PO).
  4. 위험비가 일정 (모든 시점에서 비례) → Weibull (PH) 또는 Cox.
  5. 불확실하면 → § 12.4 의 일반화 감마로 \(\theta = 1\) (Weibull) 또는 \(\theta = 0\) (로그정규) 가설을 검정.

5 코드 — Python lifelines

from lifelines import WeibullAFTFitter, LogLogisticAFTFitter

# 후두암 데이터: T=시간, E=사건, Z = stage 더미, age
wei = WeibullAFTFitter().fit(df, duration_col="T", event_col="E")
print(wei.summary)            # mu, sigma, gamma_j 모수화
print(wei.print_summary())    # AFT 가속 인자도 함께 표시

# 로그-로지스틱
ll = LogLogisticAFTFitter().fit(df, duration_col="T", event_col="E")
print(ll.summary)

# AIC 비교 (모형 선택 지표)
print("Weibull AIC:", wei.AIC_)
print("LogLogis AIC:", ll.AIC_)

# 가속 인자 (AFT)
import numpy as np
print("Stage IV 가속 인자 (Weibull):", np.exp(-wei.params_.loc["lambda_", "stageIV"]))

6 코드 — R survival/flexsurv

library(survival)
library(flexsurv)

# Weibull AFT
m_wei <- survreg(Surv(T, E) ~ stageII + stageIII + stageIV + age,
                 dist = "weibull", data = larynx)
summary(m_wei)
# γ_j (AFT) = m_wei$coef[-1]
# β_j (PH)  = -m_wei$coef[-1] / m_wei$scale

# 로그-로지스틱 AFT
m_ll <- survreg(Surv(T, E) ~ stageII + stageIII + stageIV + age,
                dist = "loglogistic", data = larynx)
summary(m_ll)
# β_j (PO) = -m_ll$coef[-1] / m_ll$scale

# AIC 비교
AIC(m_wei); AIC(m_ll)

# 지수 모형 적합 LRT (σ = 1)
m_exp <- survreg(Surv(T, E) ~ stageII + stageIII + stageIV + age,
                 dist = "exponential", data = larynx)
anova(m_exp, m_wei)  # 우도비 검정

7 핵심 요약

  • Weibull: \(S = \exp(-\lambda x^\alpha)\), 단조 위험률, AFT+PH 동시 표현. \(\beta = -\gamma/\sigma\).
  • 로그-로지스틱: \(S = 1/(1+\lambda x^\alpha)\), 단봉 위험률, AFT+비례 오즈 동시 표현.
  • 모수 변환: 두 분포 모두 \(\lambda = \exp(-\mu/\sigma)\), \(\alpha = 1/\sigma\).
  • 델타 방법: 패키지 출력 \((\widehat{\mu}, \widehat{\sigma}, \widehat{\gamma})\) 의 공분산을 PH/PO 모수 \((\widehat{\beta})\) 로 변환할 때 식 12.2.13-18.
  • AML 예제: auto 는 지수 적합 가능 (\(p = 0.467\)), allo 는 Weibull 필요 (\(p \ll 0.001\)).
  • 후두암 예제: Weibull 에서 Stage IV HR = 5.73, 가속 4.68; 로그-로지스틱에서 OR (사망) = 11.81, 가속 5.87. 두 모형 모두 Stage IV 효과를 잡아내지만 단위가 다르다.
  • 부호 주의: AFT 의 \(\gamma < 0\) = PH 의 \(\beta > 0\) = 위험 증가.

8 참고 문헌

  • Klein, J. P., & Moeschberger, M. L. (2003). Survival Analysis: Techniques for Censored and Truncated Data (2nd ed.). Springer. § 12.2-12.3.
  • Bennett, S. (1983). Analysis of survival data by the proportional odds model. Statistics in Medicine, 2(2), 273-277. (PO 모형의 원전)
  • Kalbfleisch, J. D., & Prentice, R. L. (2002). The Statistical Analysis of Failure Time Data (2nd ed.). Wiley. (Weibull 의 PH/AFT 이중성 정리)

Subscribe

Enjoy this blog? Get notified of new posts by email: