1 들어가며
§ 5.3 직교 다항식 sub-post 에서는 다공선성 해소를 위한 Cholesky 절차와 모형 변환 (§5.3 ~ §5.3.3) 을 다뤘다. 이 sub-post 는 그 다음 두 절을 통합해서 다룬다.
- §5.3.4 Higher-Order Polynomials: \(n\) 시점에서 가능한 다항식 차수의 이론적 한계
- §5.3.5 Cubic Trend Example: Reisby 데이터에 3 차 모형 적합 (Table 5.3, Figure 5.5-5.9)
핵심 질문 두 가지를 다룬다.
- “왜 \(n\) 시점이면 다항식 차수가 \(n - 1\) 까지로 제한되는가” — 모수 절약 한계
- “cubic 항이 통계적으로 유의해도 실질적 기여가 작다면 어떻게 보고하는가” — 유의성 vs 효과 크기
2 고차 다항식의 이론적 한계
2.1 \(n\) 시점 → 최대 \(n - 1\) 차
\(n\) 개 시점에서 고정 효과로 \(\beta_0, \beta_1, \ldots, \beta_{n-1}\) 까지의 다항식 항을 추정할 수 있다.
균형 데이터 (모든 사람이 \(n\) 시점 모두 관측) 의 경우: - 절편 + \(n - 1\) 개 다항식 항 = \(n\) 개 모수 - 시점별 평균 = \(n\) 개 값
→ \(n\) 차 다항식은 시점별 평균을 정확히 적합한다 (saturated fit).
예: Reisby 6 시점 → 최대 5 차 다항식 (절편 + 1 차 + 2 차 + 3 차 + 4 차 + 5 차) 가능. 이는 6 개 시점 평균을 그대로 통과하는 곡선.
\(n\) 점을 정확히 통과하는 다항식의 차수는 \(n - 1\) 이다 (Lagrange 보간).
종단 데이터에서 시점별 평균을 데이터 점으로 보면 같은 원리: - 6 시점 → 5 차 다항식이면 평균 곡선이 모든 시점 평균을 통과 - 7 차 이상은 모수 부족 (over-parametrized) → 추정 불가
2.2 랜덤 효과 차수의 한도
랜덤 효과의 분산-공분산 행렬 \(\Sigma_\upsilon\) 의 차원도 제한된다.
\(y\) 의 마진 분산-공분산 행렬은 \(n \times n\) 이고, 대칭이라 고유 모수 수가 \(n(n+1)/2\) 개. 이 중 오차 분산 \(\sigma^2\) 1 개를 빼면, 랜덤 효과 분산-공분산 모수의 상한은 \(n(n+1)/2 - 1\).
\(r\) 개 랜덤 효과 (\(r \leq n - 1\)) 가 있으면 \(\Sigma_\upsilon\) 의 모수 수는 \(r(r+1)/2\). \(r = n - 1\) 일 때: - \(\Sigma_\upsilon\) 모수 수: \((n-1)n/2\) - 오차 분산 \(\sigma^2\): 1 개 - 합: \((n-1)n/2 + 1\) — 마진 분산-공분산 모수 수와 같음 → saturated
이 경우 \(\sigma^2\) 와 \(\Sigma_\upsilon\) 가 분리되지 않는다 — 모형이 식별 불가능. 실용 한도는 \(r \leq n - 2\).
Reisby 6 시점 데이터의 한도: - 고정 효과: 최대 6 차 (절편 + 5 차) → 마진 평균과 정확 일치 (saturated mean) - 랜덤 효과: 최대 4 차 (절편 + 1 차 + 2 차 + 3 차 + 4 차) → 분산-공분산도 거의 saturated
2.3 실용 권고 — quadratic 또는 cubic 까지
이론적 한계와 별개로, 실무에서는 다음 이유로 cubic 정도에서 멈춘다.
- 해석 가능성: 4 차 이상의 곡선 패턴은 임상적으로 해석이 어려움
- quadratic: 가속/감속 (한 번 부호 변경)
- cubic: S 자 (두 번 부호 변경) — 학습·약물 흡수 등
- quartic 이상: 변곡점이 너무 많아 의미 부여 곤란
- 사전 가설 부재: 4 차 이상의 곡선을 가정할 임상적 메커니즘이 드물다
- 수치 안정성: 차수가 높을수록 수렴 어려움 — 특히 원본 척도. 직교 다항식 §5.3 으로 일부 완화
- 외삽 위험 증폭: cubic 도 외삽에서 발산 (식 후술), quartic 은 더 빠르게
Hedeker (2006) 의 권고: “linear, quadratic, possibly cubic” 이 균형 잡힌 선택.
3 Cubic 추세 MRM 정의
Level-1 (피험자 내):
\[ y_{ij} = b_{0i} + b_{1i} t_{ij} + b_{2i} t_{ij}^2 + b_{3i} t_{ij}^3 + \varepsilon_{ij} \tag{5.25} \]
Level-2 (피험자 간):
\[ b_{0i} = \beta_0 + \upsilon_{0i}, \quad b_{1i} = \beta_1 + \upsilon_{1i}, \quad b_{2i} = \beta_2 + \upsilon_{2i}, \quad b_{3i} = \beta_3 + \upsilon_{3i} \tag{5.26} \]
랜덤 효과 \(\upsilon_i = (\upsilon_{0i}, \upsilon_{1i}, \upsilon_{2i}, \upsilon_{3i})^\top \sim \mathcal{N}_4(0, \Sigma_\upsilon)\), \(\Sigma_\upsilon\) 는 \(4 \times 4\) 분산-공분산 행렬 (10 개 고유 모수).
quadratic 모형 (\(t^2\) 까지) 에서 cubic (\(t^3\) 추가) 으로 확장하는 비용:
| quadratic | cubic | 추가 | |
|---|---|---|---|
| 고정 효과 | \(\beta_0, \beta_1, \beta_2\) (3) | \(+ \beta_3\) (4) | 1 |
| 랜덤 효과 분산-공분산 | \(\Sigma_\upsilon\): \(3 \times 3\) (6) | \(4 \times 4\) (10) | 4 |
| 합 | 9 | 14 | 5 모수 |
3.1 시간 효과 미분 — 가속도의 변화
cubic 모형에서 순간 시간 효과는 시간의 2 차 함수가 된다.
\[ \frac{\partial y}{\partial t} = \beta_1 + 2\beta_2 t + 3\beta_3 t^2 \]
| 모형 | 시간 효과 | 운동학 |
|---|---|---|
| 선형 | 상수 | 등속 |
| 이차 | 1 차 함수 (선형) | 등가속 |
| 3 차 | 2 차 함수 | 가속도가 변하는 운동 (jerk) |
\(\beta_3\) 의 부호 = 가속도의 변화 방향.
\(\beta_3 > 0\): 가속도가 시간이 갈수록 증가 → 후반에 더 빨라짐 \(\beta_3 < 0\): 가속도가 시간이 갈수록 감소 → 후반에 평탄해짐
이로 인해 cubic 곡선은 두 번 부호를 뒤집을 수 있다 — S 자 형태가 가능.
4 Cubic 곡선 4 가지 패턴 (Figure 5.5)
cubic 곡선은 부호 조합으로 다음 4 가지 일반적 모양을 만든다.
| 패턴 | 모양 | 임상 예시 |
|---|---|---|
| 평탄 → 상승 → 평탄 (S 자) | \(\beta_3 < 0, \beta_2 > 0, \beta_1 \approx 0\) | 학습 곡선 (logistic 근사) |
| 빠른 상승 → 평탄 → 다시 상승 | 다양 | 약물 흡수 후 재상승 |
| 단조 상승이지만 가속 패턴 변화 | \(\beta_3 > 0\) | 발달 가속 |
| 상승 → 하강 → 다시 상승 (역 S) | 부호 복잡 | 통증 척도 변동 |
cubic 모형의 가장 유용한 용례 중 하나는 S 자 (sigmoid) 패턴 근사 다.
진정한 S 자는 logistic 함수 \(f(t) = L / (1 + e^{-k(t - t_0)})\) 로 표현되지만, 이는 비선형 모형 (회귀 계수에 대해 비선형) 이라 추정이 까다롭다.
cubic 다항식은 logistic 의 로컬 근사로 작동: - 초기 평탄 → 중기 급변 → 후기 평탄
근사 한계 — 진정한 S 자는 양쪽에 점근선이 있지만 cubic 은 외부에서 발산.
5 외삽 위험 — Figure 5.6 의 경고
cubic 곡선이 적합 구간 내에서 자연스러워 보여도, 양 끝 외부로 외삽하면 발산한다.
Reisby 6 주 추적 (week 0 ~ 5) 에서 cubic 적합 후: - Week 0~5: 자연스러운 호전 곡선 - Week -2 또는 Week 7: 점수가 60 점, 100 점 같은 비현실적 값으로 발산
수학적 이유: \(t \to \pm\infty\) 일 때 cubic 의 dominant term 이 \(\beta_3 t^3\) 이라 \(\pm\infty\) 로 발산.
실무 점검:
- 적합 곡선을 연구 기간 내 에서만 그린다
- 양 끝에 한 시점 정도만 더해 그려본다 (Hedeker Figure 5.6 형태)
- 발산 속도가 빠르면 cubic 은 외삽 용도로 부적합
외삽이 분석 목표라면: - 점근선이 있는 비선형 모형: logistic, Gompertz, Bock-du Toit - 비선형 MRM: Davidian & Giltinan (1995), Vonesh & Chinchilli (1997)
6 Reisby Cubic 적합 — Hedeker Table 5.3
직교 다항식 척도로 cubic 모형 (식 5.25-5.26) 을 Reisby 데이터에 적합한 결과:
| 모수 | 추정값 | SE | \(Z\) | \(p <\) |
|---|---|---|---|---|
| \(\gamma_0\) (절편) | 43.24 | 1.35 | 31.95 | .0001 |
| \(\gamma_1\) (선형) | -9.88 | 0.84 | -11.70 | .0001 |
| \(\gamma_2\) (이차) | 0.33 | 0.55 | 0.60 | .55 |
| \(\gamma_3\) (3 차) | 0.62 | 0.48 | 1.29 | .20 |
| \(\sigma_{\theta_0}^2\) | 110.91 | 21.08 | ||
| \(\sigma_{\theta_0\theta_1}\) | 34.92 | 10.25 | ||
| \(\sigma_{\theta_1}^2\) | 36.25 | 8.25 | ||
| \(\sigma_{\theta_0\theta_2}\) | -11.14 | 6.12 | ||
| \(\sigma_{\theta_1\theta_2}\) | 0.26 | 3.69 | ||
| \(\sigma_{\theta_2}^2\) | 9.24 | 3.58 | ||
| \(\sigma_{\theta_0\theta_3}\) | 7.25 | 5.31 | ||
| \(\sigma_{\theta_1\theta_3}\) | 4.33 | 3.27 | ||
| \(\sigma_{\theta_2\theta_3}\) | 4.03 | 2.16 | ||
| \(\sigma_{\theta_3}^2\) | 5.04 | 2.85 | ||
| \(\sigma^2\) | 8.92 | 1.14 |
Note: \(-2 \log L = 2196.44\). (Hedeker, 2006, p.97)
6.1 quadratic 결과와의 비교
quadratic 모형 (Table 5.2) 과 비교하면 절편·선형·이차 항의 추정값이 거의 변하지 않는다.
| Quadratic (\(-2\log L = 2207.64\)) | Cubic (\(-2\log L = 2196.44\)) | |
|---|---|---|
| \(\gamma_0\) | 43.24 | 43.24 |
| \(\gamma_1\) | -9.94 | -9.88 |
| \(\gamma_2\) | 0.31 | 0.33 |
이 안정성은 직교 다항식의 핵심 이득 중 하나다. 직교 다항식 항이 서로 독립이라, 새 차수 (\(\gamma_3\)) 를 추가해도 기존 추정값이 거의 영향받지 않는다.
원본 척도였다면 \(t\) 와 \(t^3\) 의 강한 상관 (Reisby 6 시점에서 약 0.91) 때문에 추가 시 기존 추정값이 크게 흔들렸을 것.
균형 데이터에서 직교 다항식의 추정값은 차수 추가에도 정확히 불변. 불균형 (Reisby 처럼 결측 일부) 이라 약간의 변동만 발생.
7 LR 검정 — Cubic vs Quadratic
cubic 모형이 quadratic 모형보다 적합도가 좋은지 확인.
\[ H_0: \gamma_3 = \sigma_{\theta_3}^2 = \sigma_{\theta_0\theta_3} = \sigma_{\theta_1\theta_3} = \sigma_{\theta_2\theta_3} = 0 \]
5 개 모수 (3 차 고정 효과 1 + 3 차 분산 1 + 다른 차수와의 공분산 3) 가 모두 0.
LR 통계량: \[ \chi^2 = (-2 \log L)_{\text{quadratic}} - (-2 \log L)_{\text{cubic}} = 2207.64 - 2196.44 = 11.2 \]
자유도: df = 5
p-value: 표준 \(\chi^2_5\) 에서 \(p \approx 0.048\) (분산 모수 보정 적용 시 \(p \approx 0.024\)).
→ cubic 항이 통계적으로 유의 (\(p < 0.05\)).
\(\gamma_3 = 0.62\) 의 Wald 검정만 보면 \(Z = 1.29\) (\(p = 0.20\)) — 비유의. LR 검정이 유의한 이유는 랜덤 효과 분산 (\(\sigma_{\theta_3}^2 = 5.04\)) 의 기여가 크기 때문.
즉: - 모집단 평균에서 cubic 효과는 비유의 - 개인 수준에서 cubic 항의 분산은 유의
quadratic 에서와 같은 패턴 — “평균은 직선이지만 개인은 곡선” 의 확장판 — “평균은 quadratic 이지만 개인은 cubic”.
8 분산 기여 비율 — 통계 vs 실질
cubic 모형의 4 개 랜덤 효과 분산 추정값:
| 차수 | \(\widehat\sigma_{\theta_k}^2\) | 비율 |
|---|---|---|
| 절편 (\(\theta_0\)) | 110.91 | 68.7% |
| 선형 (\(\theta_1\)) | 36.25 | 22.5% |
| 이차 (\(\theta_2\)) | 9.24 | 5.7% |
| 3 차 (\(\theta_3\)) | 5.04 | 3.1% |
| 합 | 161.44 | 100% |
해석: 개인 이질성의 91.2% (절편 + 선형) 가 단순 추세에 있고, cubic 추가는 3.1% 만 더 설명.
이런 결과를 보고할 때:
“cubic 항이 LR 검정에서 통계적으로 유의했다 (\(\chi^2_5 = 11.2\), \(p = 0.024\)). 다만 cubic 항이 추가로 설명하는 개인 이질성은 약 3% 로, 주된 변동은 절편과 선형 추세 (합 91%) 에 있다. 임상적 해석을 위한 주 모형은 quadratic 또는 linear 로 충분하나, cubic 은 세부 분산 구조의 적합도 향상에 기여한다.”
이는 유의성 검정과 효과 크기 보고를 분리 하는 좋은 사례다. \(p < 0.05\) 만 보고하면 임상적 의미를 과대평가할 위험이 있다.
9 분산-공분산 적합도 — Table 5.4
cubic 모형이 분산 구조 적합에 미치는 효과는 시점별 표준편차로 가장 명확하다.
| 시점 | 관측 | RI 만 | 랜덤 선형 | 랜덤 quadratic | 랜덤 cubic |
|---|---|---|---|---|---|
| Week 0 | 4.53 | 5.93 | 4.98 | 4.58 | 4.50 |
| Week 1 | 4.70 | 5.93 | 4.91 | 4.88 | 4.73 |
| Week 2 | 5.49 | 5.93 | 5.24 | 5.57 | 5.31 |
| Week 3 | 6.41 | 5.93 | 5.92 | 6.19 | 6.37 |
| Week 4 | 6.97 | 5.93 | 6.84 | 6.78 | 7.06 |
| Week 5 | 7.22 | 5.93 | 7.91 | 7.69 | 7.32 |
(RI = 랜덤 절편만. Hedeker, 2006, p.99)
- 랜덤 절편만: 모든 시점 SD = 5.93. 시점별 변화 전혀 못 잡음
- 랜덤 선형: 시점 후반 (Week 4-5) 에서 거의 정확. 초반 (Week 0-1) 에서 과대 추정
- 랜덤 quadratic: 초반·중반에서 더 정확. 후반에서 약간 과대 추정
- 랜덤 cubic: 거의 모든 시점에서 관측에 가장 가까움 (Week 0: 4.50 vs 관측 4.53)
이것이 LR 검정이 cubic 을 선호하는 진짜 이유 — 평균 곡선 적합도보다 분산-공분산 구조 적합도 향상이 핵심.
10 개인별 cubic 패턴 — Backwards S 자
Hedeker Figure 5.7-5.8 은 cubic 모형에서 추정된 개인별 곡선을 보여준다.
- 평균 곡선은 거의 직선 (왼쪽 위에서 오른쪽 아래로 단조 감소)
- 개인 곡선들은 평균 주변에 분산되어 있고 일부는 분명한 비선형 패턴
- 시점 후반으로 갈수록 개인 간 분산이 증가 (Table 5.4 의 SD 증가와 일치)
10.1 Figure 5.8 (cubic 추정값 절대값 큰 10 명) 해석
\(|\hat\gamma_3 + \hat\theta_{i3}|\) 가 큰 10 명을 추리면 backwards S-shape 패턴이 드러난다: - 초기: 거의 변화 없음 (정체) - 중간: 빠른 호전 - 후기: 다시 평탄화 또는 약간 상승
이는 일부 환자의 약물 반응 패턴 — “초반 적응 → 중반 효과 발현 → 후반 안정” — 과 일치한다. 한 환자는 후기 점수가 다시 올라가는 elongated S 자도 보여줌 — 약물 효과 한계 또는 재발 가능성.
11 코드 예시
11.1 Step 1: cubic 분산-공분산 행렬 직접 계산
import numpy as np
# 6 시점, cubic 까지
t = np.arange(6).astype(float)
Z = np.column_stack([np.ones_like(t), t, t**2, t**3]) # 6 x 4
# Hedeker Table 5.3 — 직교 척도 모수
Sigma_theta = np.array([
[110.91, 34.92, -11.14, 7.25],
[ 34.92, 36.25, 0.26, 4.33],
[-11.14, 0.26, 9.24, 4.03],
[ 7.25, 4.33, 4.03, 5.04],
])
sigma2 = 8.92
# 직교 다항식 행렬 (§ 5.3 sub-post 의 Cholesky 절차)
T = np.column_stack([np.ones_like(t), t, t**2, t**3])
S = np.linalg.cholesky(T.T @ T)
Sp_inv = np.linalg.inv(S.T)
T_ortho = T @ Sp_inv # 6 x 4
# 마진 분산-공분산 V(y) = T_ortho Sigma_theta T_ortho' + sigma^2 I
V_hat = T_ortho @ Sigma_theta @ T_ortho.T + sigma2 * np.eye(6)
print("적합된 V(y) 대각 (시점별 분산):")
print(np.round(np.diag(V_hat), 2))
print("\n시점별 표준편차:")
print(np.round(np.sqrt(np.diag(V_hat)), 2))
# 출력: [4.50, 4.73, 5.31, 6.37, 7.06, 7.32] — Hedeker Table 5.4 cubic 행과 일치11.2 Step 2: statsmodels — quadratic vs cubic LR 검정
import pandas as pd
import statsmodels.formula.api as smf
# § 5.2·5.3 sub-post 의 합성 데이터 재사용
np.random.seed(2026)
n_subj, n_time = 50, 6
t = np.arange(n_time)
# 곡선 + cubic 약간 (개인 수준)
beta_true = np.array([24.0, -2.6, 0.05, 0.01])
Sigma_v_true = np.array([
[10.4, -0.9, -0.1, 0.05],
[-0.9, 6.6, -0.9, 0.10],
[-0.1, -0.9, 0.2, 0.05],
[0.05, 0.10, 0.05, 0.15],
])
sigma2_true = 8.5
v = np.random.multivariate_normal(np.zeros(4), Sigma_v_true, size=n_subj)
y = np.zeros((n_subj, n_time))
for i in range(n_subj):
indiv = ((beta_true[0] + v[i, 0])
+ (beta_true[1] + v[i, 1]) * t
+ (beta_true[2] + v[i, 2]) * t**2
+ (beta_true[3] + v[i, 3]) * t**3)
y[i] = indiv + np.random.normal(0, np.sqrt(sigma2_true), n_time)
df = pd.DataFrame({
"subject": np.repeat(np.arange(n_subj), n_time),
"week": np.tile(t, n_subj),
"y": y.flatten(),
})
df["week2"] = df["week"] ** 2
df["week3"] = df["week"] ** 3
# Quadratic MRM
m_quad = smf.mixedlm(
"y ~ week + week2",
df,
groups=df["subject"],
re_formula="~week + week2",
).fit(reml=False)
# Cubic MRM
m_cub = smf.mixedlm(
"y ~ week + week2 + week3",
df,
groups=df["subject"],
re_formula="~week + week2 + week3",
).fit(reml=False)
# LR 검정
chi2 = -2 * (m_quad.llf - m_cub.llf)
df_lrt = m_cub.df_modelwc - m_quad.df_modelwc
from scipy.stats import chi2 as chi2_dist
p_naive = 1 - chi2_dist.cdf(chi2, df_lrt)
p_corrected = p_naive / 2 # 분산 모수 보정
print(f"chi^2 = {chi2:.2f}, df = {df_lrt}")
print(f"p (naive) = {p_naive:.4f}")
print(f"p (corrected) = {p_corrected:.4f}")11.3 Step 3: 분산 기여 비율 계산
# Cubic 모형에서 랜덤 효과 분산 추출
re_cov = m_cub.cov_re # 4 x 4 cov matrix
re_var = np.diag(re_cov)
print("랜덤 효과 분산 (대각):")
labels = ["intercept", "week", "week2", "week3"]
for label, var in zip(labels, re_var):
print(f" {label}: {var:.2f}")
prop = re_var / re_var.sum() * 100
print("\n분산 기여 비율:")
for label, p in zip(labels, prop):
print(f" {label}: {p:.1f}%")11.4 Step 4: 외삽 시각화
import matplotlib.pyplot as plt
# 적합 cubic 계수
b = m_cub.fe_params
b0 = b["Intercept"]
b1 = b["week"]
b2 = b["week2"]
b3 = b["week3"]
# 연구 기간 (0-5) 과 외삽 (-2 ~ 7)
t_inside = np.linspace(0, 5, 100)
t_outside = np.linspace(-2, 7, 200)
y_inside = b0 + b1 * t_inside + b2 * t_inside**2 + b3 * t_inside**3
y_outside = b0 + b1 * t_outside + b2 * t_outside**2 + b3 * t_outside**3
fig, ax = plt.subplots(figsize=(7, 5))
ax.plot(t_outside, y_outside, "r--", alpha=0.5, label="Extrapolated")
ax.plot(t_inside, y_inside, "b-", linewidth=2, label="Within study (0-5)")
ax.axvspan(0, 5, alpha=0.1, color="green", label="Study period")
ax.set_xlabel("Week")
ax.set_ylabel("Score")
ax.set_title("Cubic curve: extrapolation explosion")
ax.legend()
ax.grid(alpha=0.3)
plt.tight_layout()생성된 그래프에서 적합 구간 (초록색) 내에서는 자연스러운 호전 곡선이지만, 외삽 영역 (빨간 점선) 에서 곡선이 빠르게 발산한다. 이것이 “cubic 외삽은 위험” 메시지의 시각적 증거.
12 Ch.5 §5.4 Summary 통합
다항식 추세 모형은 비선형 시간 추세를 모형화하는 단순하지만 강력한 도구다. 중요한 점:
- 여전히 선형 모형: \(\beta\) 에 대해 선형. \(t^2, t^3\) 은 변형된 회귀자
- 진정한 비선형 모형이 필요한 경우:
- 인간 신장 (Bock & du Toit 2004) — 점근선 있는 성장
- 약동학 (logistic, Gompertz) — 명확한 한계
- 학습 곡선 (Mitscherlich) — 천장 효과
- 참고 문헌: Davidian & Giltinan (1995), Vonesh & Chinchilli (1997)
- 직교 다항식의 가치: 다공선성·척도 차이 동시 해결. 수치 안정성으로 cubic 이상 적합 가능
- GEE·범주형 반응 확장: 직교 다항식은 다항식 추세가 필요한 모든 종단 모형에 적용 가능 — Ch.8 (GEE), Ch.9 (binary GLMM), Ch.10 (ordinal) 에서도 활용
13 핵심 정리
- 차수 한계: \(n\) 시점 → 고정 효과 최대 \(n - 1\) 차 (saturated mean), 랜덤 효과 실용 한도 \(n - 2\) 차
- 실용 권고: linear · quadratic · cubic 까지가 균형. 4 차 이상은 해석 어려움 + 외삽 위험 증폭
- Cubic 모형: \(t^3\) 추가 → 가속도 변화 (jerk) 모형화. S 자 곡선 (logistic 근사) 가능
- 외삽 위험: cubic 도 적합 구간 외부에서 발산. 외삽 목적이면 비선형 모형 필요
- Reisby cubic 결과:
- LR 검정 (\(\chi^2_5 = 11.2\), df = 5) 유의 → cubic 채택
- 그러나 분산 기여는 3.1% 만 → “통계적 유의 ≠ 실질적 중요”
- quadratic·linear 추정값은 거의 불변 (직교 다항식의 안정성)
- 분산-공분산 적합: cubic 이 시점별 SD 와 가장 잘 일치 (Table 5.4) — LR 검정의 진짜 동력
- 개인 패턴: backwards S 자 (정체 → 급변 → 평탄) 가 일부 환자에게 명확
- 보고 방식: 유의성 + 효과 크기 (분산 비율) 함께. p-value 만 보고 X
14 다음 단계
| 주제 | 다룰 내용 | 위치 |
|---|---|---|
| Ch.6 — Covariance Pattern Models | CPM 마진 모형 | Ch.6 Overview |
| Ch.7 — MRM with AC Errors | 다항식 추세 + 자기상관 오차 결합 | Ch.7 Overview |
| 비선형 MRM | logistic, Gompertz, Bock-du Toit | 미작성 (Ch.5 의 한계 보완) |
15 관련 주제
선행 지식
- Ch.5 Overview — 다항식 추세 MRM — 통합 관점
- § 5.2 — 곡선형 추세 MRM — quadratic 모형
- § 5.3 — 직교 다항식 — Cholesky 절차, 모수 변환
- § 4.5 — MRM 추정론 — ML/REML 의 LR 검정 원리
관련
- § 4.4 — 행렬 공식화 — \(V(y) = Z\Sigma_\upsilon Z' + \sigma^2 I\)
- § 3.2 — MANOVA 일표본 (직교 다항식 P 행렬) — 직교 다항식의 다른 맥락
후속 주제
- Ch.6 Overview — CPM — 분산 구조 직접 모형화
- Ch.7 Overview — AC 오차 — MRM + 자기상관
교재
- Hedeker, D. & Gibbons, R. D. (2006). Longitudinal Data Analysis, Wiley, Ch.5 §5.3.4-5.4 (pp. 94-99)
- Bock, R. D. & du Toit, S. H. C. (2004). “Parameter estimation in the context of non-linear longitudinal growth models” — 인간 성장 비선형 모형
- Davidian, M. & Giltinan, D. M. (1995). Nonlinear Models for Repeated Measurement Data, Chapman & Hall — 비선형 MRM 표준
- Vonesh, E. F. & Chinchilli, V. M. (1997). Linear and Nonlinear Models for the Analysis of Repeated Measurements, Marcel Dekker
- Jones, R. H. (1996). “Indeterminacies in Lyapunov-stable random-coefficient growth-curve models” — 점근선이 있는 다항식 모형