Kwangmin Kim - 이항 반응 모형 — 링크 함수·모수 해석·후향 샘플링

1 왜 링크 함수가 필요한가

이항 반응 모형의 출발점은 단순한 불일치다.

\[ \pi \in (0, 1) \quad\text{vs}\quad \eta = \sum_j x_j\beta_j \in (-\infty, \infty) \]

선형 예측자는 실수 전체를 누비지만 확률은 \([0, 1]\) 에 갇혀 있다. \(\pi = \mathbf{x}^\top\boldsymbol\beta\) 같은 “identity link” 를 직접 쓰면 공변량이 조금만 커도 \(\pi > 1\) 또는 \(\pi < 0\) 이 되어 확률의 법칙에 위배.

해결: 단조 증가 변환 \(g: (0, 1) \to (-\infty, \infty)\) 를 도입.

\[ g(\pi_i) \;=\; \eta_i \;=\; \mathbf{x}_i^\top\boldsymbol\beta \]

이 \(g\) 가 링크 함수. 4 가지 표준이 있으며 선택이 해석·수치·통계적 성질을 모두 결정한다.

직관: 링크 함수는 “확률의 제약된 세계” 와 “선형 예측자의 자유로운 세계” 를 연결하는 번역기다. 어느 번역기를 쓰느냐가 같은 데이터에 다른 해석을 부여하며, 특히 후향 샘플링에서는 결정적 차이가 생긴다.

2 네 가지 링크 함수 (§4.3.1)

2.1 정의

링크	\(g(\pi)\)	역함수 \(g^{-1}(\eta) = \pi\)	유래
Logit (정준)	\(\log\{\pi/(1-\pi)\}\)	\(e^\eta/(1+e^\eta)\)	지수족 정준 모수, 로지스틱 CDF 의 역
Probit	\(\Phi^{-1}(\pi)\)	\(\Phi(\eta)\)	표준정규 CDF 의 역
Complementary log-log (cloglog)	\(\log\{-\log(1-\pi)\}\)	\(1 - \exp(-e^\eta)\)	Gumbel (min) 분포의 CDF 역
Log-log (loglog)	\(-\log\{-\log\pi\}\)	\(\exp(-e^{-\eta})\)	Gumbel (max) 분포의 CDF 역

네 함수 모두 \((0, 1) \to (-\infty, \infty)\) 단조 증가.

2.2 CDF 로서의 해석

각 링크의 역함수는 어떤 분포의 CDF:

Logit: \(F(\eta) = e^\eta/(1+e^\eta)\) — 로지스틱 분포 (평균 0, 분산 \(\pi^2/3\)).
Probit: \(F(\eta) = \Phi(\eta)\) — 표준정규 분포.
Cloglog: \(F(\eta) = 1 - \exp(-e^\eta)\) — Gumbel (minimum extreme).
Loglog: \(F(\eta) = \exp(-e^{-\eta})\) — Gumbel (maximum extreme).

이 CDF 해석은 잠재 변수 모형 의 기초. 잠재 \(Z = \mathbf{x}^\top\boldsymbol\beta + \varepsilon\) 에서 \(\varepsilon\) 의 분포에 따라 링크 함수가 결정.

2.3 대칭 vs 비대칭

Logit, Probit 은 대칭: \(g(\pi) = -g(1-\pi)\). \(\pi = 0.5\) 에서 \(\eta = 0\), 양 끝의 행동이 대칭.
Cloglog, Loglog 은 비대칭: \(g_3(\pi) = -g_4(1-\pi)\) 로 서로 반전 관계. \(\pi = 0.5\) 에서 cloglog \(= \log(\log 2) \approx -0.367\) — 0 이 아님.

2.4 기하적 비교 — Fig 4.1

\(\pi\) 를 \(g_1\) (logit) 값에 대해 그리면 네 링크가 겹친다.

Logit (기준) vs Probit: \(\pi \in [0.1, 0.9]\) 에서 거의 선형 관계. 계수가 약 \(1.7\) 배 차이. 적합도로 두 링크 구분은 사실상 불가능 (Chambers & Cox 1967).
Logit vs Cloglog: \(\pi \to 0\) 에서 둘 다 \(\log\pi\) 로 근사. 작은 확률 영역에서 거의 동일.
Cloglog vs Loglog: \(\pi\) 의 반전. Cloglog 은 \(\pi \to 1\) 로 느리게, Loglog 은 \(\pi \to 0\) 으로 느리게 접근.
Loglog 의 실무 외면: 대부분의 응용에서 \(\pi < 0.5\) 관심 영역. Loglog 은 이 영역에서 “왜곡된 기울기” 를 주어 거의 쓰이지 않는다.

2.5 언제 어느 링크를 쓰나

상황	권장 링크	이유
일반적 이항 회귀	Logit	정준, 오즈비 해석, case-control 호환
경제학 · 심리학 효용 모형	Probit	정규 잠재 효용 가정
생존 분석 이산 근사	Cloglog	위험률 비례 모형과 직접 연결
적합도 미세 차이 검정	Cloglog vs Logit	꼬리 모양의 비대칭성
\(\pi\) 양 끝단이 중요한 경우	맥락 따라	링크 선택이 외삽에 큰 영향

직관: 네 링크는 같은 모형식에 다른 역사·다른 해석을 준다. 로짓은 수학적 편의 (지수족 정준), 프로빗은 잠재 효용, 클로그로그는 시간-사건 이산화. 적합도 차이는 대개 미미하지만 해석 가능성과 과학적 정합성에서 차이가 생긴다.

3 모수 해석의 세 척도 (§4.3.2)

같은 모형을 세 가지 척도에서 표현할 수 있다. 로짓 모형 \(\log\{\pi/(1-\pi)\} = \beta_0 + \beta_1 x_1 + \beta_2 x_2\) 에서

3.1 척도 1 — 로짓 (log-odds)

\[ \log\frac{\pi}{1-\pi} = \beta_0 + \beta_1 x_1 + \beta_2 x_2 \]

\(\beta_j\) 해석: \(x_j\) 1 단위 증가 → 로그 오즈 \(\beta_j\) 증가.
장점: 가법적, \(x_j, x_k\) 값에 무관하게 상수 효과. 해석 안정적.
단점: “로그 오즈” 가 직관적이지 않음.

3.2 척도 2 — 오즈 (odds)

\[ \frac{\pi}{1-\pi} = \exp(\beta_0 + \beta_1 x_1 + \beta_2 x_2) \]

\(\exp(\beta_j)\) 해석: \(x_j\) 1 단위 증가 → 오즈가 \(e^{\beta_j}\) 배.
장점: 곱셈적 효과가 명확. \(e^{\beta_j} = 2\) 는 “오즈 2 배”.
단점: “오즈” 자체가 일반인에게 낯섦. 커뮤니케이션 장벽.

3.3 척도 3 — 확률 (probability)

\[ \pi = \frac{\exp(\beta_0 + \beta_1 x_1 + \beta_2 x_2)}{1 + \exp(\beta_0 + \beta_1 x_1 + \beta_2 x_2)} \]

\(\partial\pi/\partial x_j = \pi(1-\pi)\beta_j\) — 평균 위치 의존 효과.
장점: 가장 직관적 (확률 자체).
단점: 효과 크기가 \(\pi\) 값에 따라 달라짐. \(\pi = 0.5\) 근처에서 최대, 끝단에서는 미미.

3.4 세 척도의 긴장

문제: 가법성 (interpretation ease) 과 해석성 (reporting ease) 이 서로 다른 척도를 선호.

모형 추정·회귀 분석은 로짓 척도에서 가장 단순 (선형).
결과 보고는 오즈비 (\(e^{\beta_j}\)) 또는 확률 차이가 직관.

McCullagh 의 실용적 제안: \(\pi(\eta) = e^\eta/(1+e^\eta)\) 의 그래프를 제시하고 공변량 변화가 \(\eta\) 에 미치는 영향을 설명. 독자가 그래프에서 확률 변화를 읽게 함.

3.5 작은 \(\pi\) 에서의 근사

희귀 사건 (\(\pi\) 작음)에서

\[ \frac{\pi}{1-\pi} \approx \pi \]

따라서 오즈비 \(\approx\) 위험비 (relative risk). 이 근사 덕분에 역학에서 “오즈비” 가 “상대위험” 의 실용적 대체로 통용.

단, \(\pi\) 가 크면 이 근사는 깨진다. \(\pi = 0.5\) 이면 오즈 \(= 1\), \(\pi = 0.9\) 이면 오즈 \(= 9\), 위험비와 오즈비가 크게 다름.

직관: 로짓 계수는 “로그 오즈” 의 가법 효과, \(e^{\beta_j}\) 는 “오즈비”, \(\pi(\eta)\) 그래프는 “확률 변화” 를 보여 준다. 세 척도는 같은 정보의 다른 표현이며, 사용자에 따라 가장 유용한 척도가 다르다.

4 다른 링크 함수의 해석

링크 \(g_2, g_3, g_4\) 의 계수 해석.

링크	\(\beta_j\) 의미
Probit	\(x_j\) 1 단위 증가 → 정규 \(z\)-점수가 \(\beta_j\) 증가
Cloglog	\(x_j\) 1 단위 증가 → \(\log\)-위험률이 \(\beta_j\) 증가 → 위험비 \(e^{\beta_j}\)
Loglog	\(x_j\) 1 단위 증가 → \(-\log\)-비실패률이 \(\beta_j\) 증가 (드물게 해석)

4.1 Cloglog 의 생존 해석

이산 시간 생존 모형에서 \(\pi\) = “이 기간에 사건 발생 확률”.

\[ 1 - \pi \;=\; \exp(-\lambda),\quad \lambda = \text{순간 위험률}\cdot\Delta t \]

로그 양변:

\[ \log(1-\pi) \;=\; -\lambda \;\Rightarrow\; \log\{-\log(1-\pi)\} \;=\; \log\lambda \]

즉 cloglog \(= \log\lambda\). 선형 예측자에 \(\log\) 위험률을 연결. 이것이 Cox 비례위험모형의 이산 버전.

실무 예: 월 단위 암 재발 확률. Cloglog 이 연속 시간 비례위험과 자연스럽게 연결.

4.2 Probit 의 효용 해석

경제학의 확률효용 모형 (random utility).

\[ Y = 1 \iff U_1 > U_0 \]

\(U_k = \mathbf{x}^\top\boldsymbol\beta_k + \varepsilon_k\), \(\varepsilon_0 - \varepsilon_1 \sim \mathcal N\) 이면

\[ P(Y = 1) \;=\; \Phi(\mathbf{x}^\top\boldsymbol\beta) \]

즉 Probit = 정규 잠재효용. McFadden 의 확률선택 이론 (Nobel 2000) 의 기초.

직관: 각 링크는 고유한 미시경제학·생존·심리학적 배경을 갖는다. “기계적으로 logit 만” 사용하면 도메인 이론과 분리될 수 있다.

5 후향 샘플링 — Logit 의 독특한 성질 (§4.3.3)

5.1 전향 vs 후향의 차이

전향 (prospective): 공변량 \(x\) 기준 모집단을 표본 추출, 시간 따라 질병 발병 \(D\) 관찰. - 행 총계 (노출군·비노출군 수) 고정, 열 총계 (질병·건강 수) 무작위. - 모집단 질병 빈도를 반영.

후향 (retrospective, case-control): 질병군 \(D\) 와 대조군 \(\bar D\) 를 선별, 과거 노출 여부 조사. - 열 총계 (환자·대조 수) 고정, 행 총계 (노출·비노출 수) 무작위. - 표본 추출 비율이 \(D\) 상태에 의존.

5.2 왜 후향을 쓰는가

희귀 질환 연구에서 전향은 비효율적.

예 (표 4.2):

	\(\bar D\)	\(D\)	총계
\(\bar X\)	0.70	0.02	0.72
\(X\)	0.25	0.03	0.28

질병 빈도 \(P(D) = 0.05\) (5%).
전향 연구로 100 명 질병 관찰하려면 2000 명 이상 추적 필요.
후향 연구는 병원 기록에서 이미 발생한 환자 를 확보 — 훨씬 적은 노력.

5.3 핵심 정리 — Logit 불변성 (Prentice-Pyke 1979)

정리: 후향 샘플링의 Logit 불변성

전향 모형 \(P(D|\mathbf{x}) = \exp(\alpha + \boldsymbol\beta^\top\mathbf{x}) / \{1 + \exp(\alpha + \boldsymbol\beta^\top\mathbf{x})\}\) 아래, 후향 샘플링으로 얻은 자료에 logistic 회귀를 적합하면:

\(\boldsymbol\beta\) 계수는 동일 (전향과 같은 추정).
\(\alpha\) 절편은 \(\alpha^* = \alpha + \log(\pi_0/\pi_1)\) 로 샘플링 비율 \(\pi_0, \pi_1\) 만큼 편향.

결론: 오즈비는 전향·후향에서 똑같이 추정되지만 기준 확률은 후향에서 왜곡.

5.4 Bayes 정리 유도

\(Z = 1\) 을 “샘플에 포함” 지시. 샘플링 비율

\[ \pi_0 = P(Z=1|D),\qquad \pi_1 = P(Z=1|\bar D) \]

(이 비율은 공변량 \(\mathbf{x}\) 에 의존하지 않아야 함 — 핵심 가정.)

Bayes 정리:

\[ P(D|Z=1, \mathbf{x}) \;=\; \frac{P(Z=1|D,\mathbf{x})\,P(D|\mathbf{x})}{P(Z=1|D,\mathbf{x})\,P(D|\mathbf{x}) + P(Z=1|\bar D,\mathbf{x})\,P(\bar D|\mathbf{x})} \]

\[ = \frac{\pi_0 \exp(\alpha + \boldsymbol\beta^\top\mathbf{x})}{\pi_1 + \pi_0\exp(\alpha + \boldsymbol\beta^\top\mathbf{x})} \]

\(\pi_1\) 으로 분모·분자 나누면

\[ = \frac{\exp(\alpha^* + \boldsymbol\beta^\top\mathbf{x})}{1 + \exp(\alpha^* + \boldsymbol\beta^\top\mathbf{x})},\qquad \alpha^* = \alpha + \log(\pi_0/\pi_1) \]

\(\boldsymbol\beta\) 계수는 그대로, \(\alpha\) 만 이동.

5.5 왜 다른 링크는 안 되는가

이 우아한 결과는 로짓 함수의 구조적 특성 때문.

로짓 표현 \(\pi/(1-\pi) = e^{\alpha + \boldsymbol\beta^\top\mathbf{x}}\) 에서 상수 factor (\(\pi_0/\pi_1\)) 는 \(\alpha\) 로 흡수.
프로빗 \(\Phi^{-1}(\pi) = \alpha + \boldsymbol\beta^\top\mathbf{x}\) 는 선형 변환이 “\(\alpha + \text{const}\)” 형태로 상수 factor 를 흡수할 수 없음.
유사하게 cloglog 도 상수 factor 의 편리한 흡수가 안 됨.

따라서 후향 샘플링에서 불변 추정이 가능한 링크는 logit 뿐. 역학·유전학·희귀 질환 연구가 logit 에 의존하는 가장 근본적 이유.

5.6 절편 \(\alpha\) 의 운명

\(\alpha^* - \alpha = \log(\pi_0/\pi_1)\) 만큼 편향. 이를 교정하려면 \(\pi_0, \pi_1\) 을 알아야 하지만, 모집단 질병 빈도를 알아야 가능. 일반적으로 \(\alpha\) 는 nuisance parameter 로 취급하고 오즈비만 보고.

일부 상황 (모집단 유병률을 외부 자료에서 아는 경우) 에서는 \(\alpha\) 교정으로 절대 위험 추정 가능.

5.7 가정의 한계

핵심 가정: 샘플링 비율이 공변량과 독립. 즉 \(P(Z=1|D, \mathbf{x}) = P(Z=1|D)\).

위반 예시: - 특정 지역에서만 환자 모집 → 지역-질병 교호작용. - 고령 환자 선별 편향 → 연령 효과 왜곡. - 입원 환자만 대상 → 경증 질환 누락 (Berkson’s bias).

이런 selection bias 가 있으면 Logit 불변성도 깨진다. 실무에서는 샘플링 메커니즘의 이해가 중요.

직관: Logit 불변성은 “샘플링 비율 ≠ 공변량 함수” 라는 조건 하의 결과. 이 조건을 만족하는 설계 — matched case-control — 가 역학 연구 설계의 금본위가 된 이유.

6 코드 예시

6.1 Step 1: 네 링크 함수의 적합 비교

import numpy as np
import pandas as pd
import statsmodels.api as sm

rng = np.random.default_rng(0)
n = 500
x = rng.uniform(-3, 3, size=n)

# 참 모형: logit 가정
true_eta = -0.3 + 0.8 * x
true_pi = 1 / (1 + np.exp(-true_eta))
y = rng.binomial(1, true_pi)

df = pd.DataFrame({"x": x, "y": y})
X = sm.add_constant(df[["x"]])

links = {
    "logit":   sm.families.links.Logit(),
    "probit":  sm.families.links.Probit(),
    "cloglog": sm.families.links.CLogLog(),
}
results = {}
for name, link in links.items():
    m = sm.GLM(df["y"], X, family=sm.families.Binomial(link)).fit()
    results[name] = m
    print(f"{name:8s}: beta = {m.params['x']:+.3f}, "
          f"deviance = {m.deviance:.2f}, AIC = {m.aic:.2f}")

# 로짓-프로빗 비율
ratio = results["logit"].params["x"] / results["probit"].params["x"]
print(f"\nlogit / probit ≈ {ratio:.2f} (이론 ≈ 1.7)")

참 모형이 logit 이므로 logit 적합이 최소 deviance. 하지만 차이가 매우 작아 적합도만으로는 링크 구분 불가. logit/probit 계수 비율 \(\approx 1.7\) 검증.

6.2 Step 2: 세 척도에서의 모수 효과

m = results["logit"]
beta0, beta1 = m.params["const"], m.params["x"]

# 세 척도에서의 효과
x_values = np.array([-2, -1, 0, 1, 2])
eta = beta0 + beta1 * x_values
odds = np.exp(eta)
pi = 1 / (1 + np.exp(-eta))

print(f"{'x':>5} | {'η (로짓)':>8} | {'odds':>8} | {'π':>6}")
for xv, et, od, p in zip(x_values, eta, odds, pi):
    print(f"{xv:5.1f} | {et:+8.3f} | {od:8.3f} | {p:.3f}")

# x → x+1 로 변할 때의 효과
print(f"\n[x=-1 → x=0]")
print(f"  로짓 증가량: {beta1:.3f}")
print(f"  오즈비:      {np.exp(beta1):.3f}")
print(f"  π 변화:      {pi[2] - pi[1]:.4f}")

print(f"\n[x=0 → x=1] (π 가 0.5 근처)")
print(f"  로짓 증가량: {beta1:.3f}")
print(f"  오즈비:      {np.exp(beta1):.3f}  (같음)")
print(f"  π 변화:      {pi[3] - pi[2]:.4f}  (최대)")

로짓·오즈비는 상수 효과, \(\pi\) 변화는 \(\pi\) 위치에 따라 달라짐 (\(\pi = 0.5\) 에서 최대).

6.3 Step 3: 후향 샘플링에서의 logit 불변성

rng = np.random.default_rng(42)
N = 100000
x_pop = rng.normal(size=N)
# 참 모형: α = -3 (희귀 질환), β = 1.2
alpha, beta = -3, 1.2
eta = alpha + beta * x_pop
pi = 1 / (1 + np.exp(-eta))
D = rng.binomial(1, pi)
print(f"모집단 질병 빈도: {D.mean():.4f}")

# 전향 샘플링 (단순 무작위 1000 명)
idx_pros = rng.choice(N, size=1000, replace=False)
df_pros = pd.DataFrame({"x": x_pop[idx_pros], "D": D[idx_pros]})

# 후향 샘플링 (모든 D=1 환자 + 무작위 대조군 3배)
cases = np.where(D == 1)[0]
controls = rng.choice(np.where(D == 0)[0], size=len(cases)*3, replace=False)
idx_retro = np.concatenate([cases, controls])
df_retro = pd.DataFrame({"x": x_pop[idx_retro], "D": D[idx_retro]})

# 두 설계에서 로지스틱 회귀
import statsmodels.formula.api as smf
m_pros = smf.logit("D ~ x", data=df_pros).fit(disp=0)
m_retro = smf.logit("D ~ x", data=df_retro).fit(disp=0)

print(f"\n참 계수:             α={alpha:+.3f}, β={beta:+.3f}")
print(f"전향 샘플 (N=1000):  α_hat={m_pros.params['Intercept']:+.3f}, "
      f"β_hat={m_pros.params['x']:+.3f}")
print(f"후향 샘플:            α_hat={m_retro.params['Intercept']:+.3f}, "
      f"β_hat={m_retro.params['x']:+.3f}")
print(f"\nβ 추정치 거의 일치 — Prentice-Pyke 정리")
print(f"α 는 log(π_0/π_1) 만큼 편향")

전향/후향 두 설계에서 \(\beta\) 추정치가 거의 일치. \(\alpha\) 는 샘플링 비율 때문에 편향. Prentice-Pyke 정리의 수치 검증.

6.4 Step 4: 링크 함수와 외삽 차이

import matplotlib.pyplot as plt

# 같은 η 값에서 세 링크의 π 비교
eta_grid = np.linspace(-5, 5, 100)

pi_logit = 1 / (1 + np.exp(-eta_grid))
pi_probit = sm.families.links.Probit().inverse(eta_grid)
pi_cloglog = sm.families.links.CLogLog().inverse(eta_grid)

print(f"{'η':>5} | {'logit':>7} | {'probit':>7} | {'cloglog':>7}")
for e in [-4, -2, 0, 2, 4]:
    idx = np.argmin(np.abs(eta_grid - e))
    print(f"{e:5.1f} | {pi_logit[idx]:.4f} | {pi_probit[idx]:.4f} | "
          f"{pi_cloglog[idx]:.4f}")

# 중간 영역은 거의 동일, 끝단에서 크게 다름

\(\eta \in [-2, 2]\) 에서 세 링크가 매우 유사, 끝단에서 발산. 외삽 시 링크 선택이 중요한 이유.

7 흔한 실수

실수	처방
링크 함수 선택 없이 logit 자동 사용	도메인 맥락 점검 — 생존 데이터면 cloglog 고려
logit 과 probit 계수 숫자 직접 비교	1.7 배 스케일 차이. \(\pi\) 척도에서 비교
오즈비를 상대 위험으로 해석 (\(\pi\) 큰 경우)	\(\pi < 0.1\) 에서만 근사 유효
후향 자료에서 \(\alpha\) 절편을 참값처럼 해석	\(\alpha^* = \alpha + \log(\pi_0/\pi_1)\) — 외부 정보 없이 교정 불가
선택 편향 없는 후향 자료 가정	입원 환자·지역 선별 등 구체 검토
확률 척도에서 계수 크기 직관적 비교	\(\partial\pi/\partial x = \pi(1-\pi)\beta\) — 위치 의존
Probit 의 latent variable 해석을 logit 에 확장	Logit 의 잠재 분포는 로지스틱, 정규 아님

8 요약

링크의 필요성: \(\pi \in (0,1)\) 과 \(\eta \in \mathbb{R}\) 의 불일치 해결.
네 링크:
- Logit: 정준, 오즈비 해석, case-control 호환.
- Probit: 정규 잠재효용, 경제학.
- Cloglog: 위험률 비례, 생존 분석.
- Loglog: 잘 안 쓰임.
Logit 과 Probit 은 \(\pi \in [0.1, 0.9]\) 에서 거의 선형 관계. 적합도로 구분 어려움. 계수 비율 \(\approx 1.7\).
세 척도의 해석: 로짓 (가법, 안정), 오즈비 (\(e^{\beta}\) 배), 확률 (직관적이나 위치 의존).
후향 샘플링: Logit 계수 \(\boldsymbol\beta\) 불변 (Prentice-Pyke), \(\alpha\) 만 \(\log(\pi_0/\pi_1)\) 편향.
Bayes 정리 유도: 샘플링 비율이 공변량 독립이라는 가정 하에 로짓 형태 유지. 다른 링크는 이 성질 없음.
실무 결과: 역학의 case-control 설계가 logit 을 표준으로 삼은 수학적 근거.

한 줄 요약: §4.3 은 “확률 모델링의 유연성” 을 네 링크로 풀어 주고, logit 의 독특한 후향 불변성으로 마무리한다. 링크는 과학적 맥락에 맞게, 해석은 청중에 맞게, 설계는 수학적 제약을 인지하며 선택해야 한다.

9 관련 주제

선행 지식

관련 개념

Logistic Regression: The Model — logit 링크의 완전한 전개
Logistic Regression: Estimation — IRLS 구현

후속 주제

Likelihood functions (McCullagh §4.4) — 로그우도·편향·희소성
Over-dispersion (McCullagh §4.5) — 과산포 처리
Conditional logistic (Ch.7) — matched case-control 확장
Cox 비례위험 — cloglog 의 연속 시간 버전