Ch.5 Overview — 다항식 추세 MRM (Mixed-Effects Polynomial Regression Models)

비선형 시간 추세를 선형 모형으로 적합한다 — 곡선형 추세, 직교 다항식, 고차 모형

Hedeker & Gibbons (2006) Ch.5 종합 개요. Ch.4 의 선형 추세 MRM 을 확장하여 시간 효과의 비선형 패턴 (\(\beta_2 t^2\), \(\beta_3 t^3\) 등)을 모형화한다. 곡선형 추세 모형의 구조, 직교 다항식의 동기와 Cholesky 변환, 고차 다항식의 한계와 외삽 위험을 직관·수식·실데이터 흐름으로 전달한다.

Statistics
저자

Kwangmin Kim

공개

2026년 04월 29일

1 들어가며

Ch.4 — 혼합효과 회귀모형 개요 에서는 시간 추세를 선형 으로 가정했다. 즉, 시점 \(t_{ij}\) 에 대해 평균 반응이 \(\beta_0 + \beta_1 t_{ij}\) 의 형태로 변한다고 보았다.

그러나 실제 종단 데이터에서 시간 효과는 거의 항상 비선형이다.

  • 약물 임상시험: 처치 직후 빠르게 호전된 뒤 점차 안정화 (감속하는 음의 추세)
  • 인지·기능 회복: 초기 정체 → 중기 급상승 → 후기 평탄화 (S 자 곡선)
  • 평정 척도 (rating scale): 0 또는 만점 근처에서 천장효과 (ceiling effect), 바닥효과 (floor effect) 로 변화 속도가 둔해짐

이 장에서는 선형 모형 안에 \(t^2, t^3, \ldots\) 같은 다항식 항을 추가하여 위와 같은 곡선형 추세를 적합하는 방법을 다룬다. 중요한 점은 모형이 여전히 선형 모형 이라는 사실이다 — 회귀 계수 \(\beta\) 에 대해 선형이기 때문이다. \(t^2\) 은 단지 “변형된 회귀자 (transformed regressor)” 일 뿐, 모형 형태는 일반 선형 회귀의 틀을 벗어나지 않는다.

2 학습 목표

이 장을 통해 다음을 다룬다.

  • 곡선형 (이차) 추세 모형의 정의와 모수 해석
  • 시간 효과의 미분과 flattening point (\(\partial y/\partial t = 0\)) 계산
  • 직교 다항식 (orthogonal polynomial) 사용 동기와 Cholesky 인수분해 절차
  • 원본 모형 ↔︎ 직교 모형의 모수 변환 공식
  • 고차 다항식 (3차 이상) 의 적용과 외삽 위험
  • Reisby 정신과 임상 데이터 (Hedeker, 2006, Ch.5) 적용 예시 흐름

3 Ch.5 구성

Hedeker & Gibbons (2006, Ch.5) 의 흐름을 그대로 따른다.

주제 핵심 내용
§5.1 Introduction 비선형 추세의 동기, 천장·바닥 효과
§5.2 Curvilinear Trend Model 이차 추세 MRM, 시간 효과 미분, flattening point
§5.2.1 Curvilinear Trend Example Reisby 데이터 적합, “평균은 직선·개인은 곡선” 패턴
§5.3 Orthogonal Polynomials 다공선성 문제, Cholesky 변환, Pearson-Hartley 표
§5.3.1 Model Representations 행렬 표현 비교 (\(T\) vs \(T(S')^{-1}\))
§5.3.2 Orthogonal Polynomial Example Reisby 직교 적합, intercept 의 해석 변화
§5.3.3 Translating Parameters \(\beta = (S')^{-1}\gamma\), 표준오차 변환
§5.3.4 Higher-Order Polynomials 3차 이상, 모수 절약
§5.3.5 Cubic Trend Example Reisby 3차 적합, LRT 비교
§5.4 Summary 다항식 모형의 위치 — 진정한 비선형 모형은 별도

본 overview 는 위 절의 핵심을 통합 서술한다. 세부 수치 예시 (Reisby 분산 비율 표, \(\widehat{V}(y)\) 행렬 계산 등) 는 §5.2·§5.3 sub-post 로 분기 예정이다.

4 곡선형 (이차) 추세 모형

4.1 정의

정의: 이차 추세 MRM (Curvilinear Trend Mixed-Effects Model)

Level-1 (피험자 내 시점):

\[ y_{ij} = b_{0i} + b_{1i} t_{ij} + b_{2i} t_{ij}^2 + \varepsilon_{ij} \]

Level-2 (피험자 간):

\[ b_{0i} = \beta_0 + \upsilon_{0i}, \quad b_{1i} = \beta_1 + \upsilon_{1i}, \quad b_{2i} = \beta_2 + \upsilon_{2i} \]

이때 \(\beta_0, \beta_1, \beta_2\) 는 각각 평균 절편, 평균 선형 추세, 평균 이차 추세 모수, \(\upsilon_{0i}, \upsilon_{1i}, \upsilon_{2i}\) 는 개인 \(i\) 의 이탈 (랜덤 효과) 이다.

이 모형은 다음과 같이 다시 쓸 수 있다.

\[ y_{ij} = b_{0i} + (b_{1i} + b_{2i} t_{ij}) t_{ij} + \varepsilon_{ij} \]

괄호 안의 \(b_{1i} + b_{2i} t_{ij}\) 가 시간이 지남에 따라 변하는 순간 시간 효과 (instantaneous time effect) 이다. 즉, 시간 효과 자체가 시간의 함수로 변한다 — 이것이 곡선형 추세의 본질이다.

4.2 직관: 왜 \(t^2\) 한 항을 추가하면 곡선이 그려지는가

선형 추세 모형 \(y = \beta_0 + \beta_1 t\) 에서 시간 효과는 상수 이다 — 매주 같은 양 \(\beta_1\) 만큼 변한다. \(t^2\) 항을 추가하면 시간 효과가 시간의 1차 함수로 변한다.

모형 시간 효과 \(\partial y / \partial t\) 의미
선형 (\(\beta_1 t\)) \(\beta_1\) (상수) 매 시점 같은 변화량
이차 (\(\beta_1 t + \beta_2 t^2\)) \(\beta_1 + 2\beta_2 t\) (선형) 시간이 지나며 가속/감속
3차 (\(+ \beta_3 t^3\)) \(\beta_1 + 2\beta_2 t + 3\beta_3 t^2\) (이차) 가속도 자체가 변함 (S 자)

직관적으로: “속도 → 가속도 → 가속도의 변화” 로 해석할 수 있다 (운동학과 같은 구조). \(t^2\) 은 추세에 “가속/감속” 을 부여하고, \(t^3\) 은 가속도 패턴을 한 번 뒤집을 자유도를 부여한다.

4.3 Flattening Point — 추세가 평탄해지는 시점

이차 모형에서 시간 효과를 0 으로 만드는 시점은 미분으로 직접 구한다.

\[ \frac{\partial y}{\partial t} = \beta_1 + 2\beta_2 t = 0 \quad \Longrightarrow \quad t^* = -\frac{\beta_1}{2\beta_2} \]

\(t^*\) 가 연구 기간 내부 에 있으면 추세가 한 번 뒤집히는 J 자/U 자 곡선, 외부 에 있으면 단조롭게 가속/감속하는 곡선이 된다.

왜 flattening point 가 중요한가

임상시험에서 “약물 효과가 언제부터 평탄해지는가” 는 임상적 의미 와 직결된다.

  • \(t^* = 4\) 주: 4 주 후부터 추가 호전이 미미 → 6 주 처치는 비효율
  • \(t^*\) 가 추적 기간(예: 5 주)을 벗어남: 효과가 계속 누적 중 → 추적 연장 필요

수식 \(-\beta_1/(2\beta_2)\) 한 줄이 의사결정에 직접 들어가는 통계량이다.

4.4 4 가지 곡선형 패턴

이차 모형 하나로 표현 가능한 추세는 부호 조합으로 4 가지가 된다.

패턴 \(\beta_1\) \(\beta_2\) 형태
Decelerating positive \(+\) \(-\) 상승 후 평탄화
Accelerating positive \(+\) \(+\) 상승이 가속
Decelerating negative \(-\) \(+\) 하락 후 평탄화
Accelerating negative \(-\) \(-\) 하락이 가속

여기에 \(|\beta_2|\) 가 충분히 크면 \(t^*\) 가 추적 기간 내부에 들어가 J 자 또는 U 자가 된다. 즉, \(\beta_0, \beta_1, \beta_2\) 세 모수만으로 단조 증가, 단조 감소, U 자, J 자, 역 U 자, 역 J 자를 모두 표현할 수 있다.

5 평균은 직선이지만 개인은 곡선일 수 있다

Hedeker (2006) 가 Reisby 데이터에 이차 모형을 적합한 결과는 직관적으로 흥미롭다.

  • 고정효과 \(\beta_2\) 의 Wald 검정: 비유의 (\(p \approx 0.56\)) — 모집단 평균은 직선
  • \(\sigma_{\upsilon_2}^2 = 0\) 으로 제약한 모형과의 LR 검정: 유의 (\(\Delta\text{deviance} = 11.4\), df = 4) — 개인 수준에서는 곡선

이 둘이 모순처럼 보이지만 그렇지 않다.

평균이 직선이라도 개인은 곡선일 수 있는 이유

상승 후 평탄화 (subject 1) + 가속 상승 (subject 2) 같은 두 곡선의 평균이 거의 직선이 되는 상황이 가능하다. 즉 개인 수준의 곡선성이 부호가 다른 방향으로 분산되어 있어서 평균에서 cancel out 된다.

이것이 Hedeker Figure 5.3 의 의미이다 — “average linear trend, individual quadratic trends”.

실무 함의: 모집단 평균만 보고 “선형으로 충분” 이라고 결론지으면 임상적으로 매우 중요한 개인별 반응 패턴 다양성 을 놓친다. 랜덤 효과 분산 (\(\sigma_{\upsilon_2}^2\)) 의 유의성을 별도로 검정해야 한다.

6 직교 다항식 (Orthogonal Polynomials)

6.1 왜 필요한가 — 다공선성 문제

원본 시간 변수 \(t\) 와 그 제곱 \(t^2\) 은 거의 완벽히 상관된다.

3 시점 (\(t = 0, 1, 2\)) 의 경우 \(t^2 = (0, 1, 4)\) 이고 두 변수의 표본 상관은 약 0.98 이다. 일반 회귀에서 다공선성은 표준오차를 부풀리고 계수 해석을 왜곡한다.

이 문제를 단계적으로 완화하는 두 도구가 있다.

도구 효과 한계
시간 중심화 (\(t - \bar{t}\)) 등간격·균형 데이터에서 선형-이차 상관 정확히 0 척도 차이 (분산 크기) 는 그대로
직교 다항식 (orthogonal polynomial) 상관 제거 + 단위 척도 (unit scale) 표준화 계산이 한 단계 더 필요
직교 다항식의 두 가지 이득
  1. 상관 0: 절편·선형·이차 항이 서로 독립 → 계수 추정이 안정
  2. 같은 척도: 표준화된 베타 처럼 계수 크기 직접 비교 가능 → “선형 추세의 상대 중요도” 같은 해석이 즉시 가능

원본 척도에서는 고차 항으로 갈수록 계수와 SE 가 작아져 추정이 어려워지는데, 직교 변환 후에는 모든 차수가 같은 단위 분산이라 수치적으로 안정된다.

6.2 Pearson-Hartley 표 — 등간격 6 시점 예시

\(n = 6\), 등간격일 때 절편·선형·이차 직교 다항식은 다음과 같다.

\[ \begin{bmatrix} 1 & 1 & 1 & 1 & 1 & 1 \\ -5 & -3 & -1 & 1 & 3 & 5 \\ 5 & -1 & -4 & -4 & -1 & 5 \end{bmatrix} \Big/ \begin{bmatrix}\sqrt{6} \\ \sqrt{70} \\ \sqrt{84}\end{bmatrix} \]

각 행을 자신의 제곱합 제곱근으로 나누어 단위 분산을 만든다.

직교성은 행 간 내적이 0 임으로 확인된다 (예: \((-5)(5) + (-3)(-1) + (-1)(-4) + (1)(-4) + (3)(-1) + (5)(5) = 0\)).

6.3 Cholesky 인수분해 — 일반 절차

위 표는 등간격일 때만 직접 사용 가능하다. 불등간격 또는 결측 시점 이 있을 때는 Bock (1975) 의 Cholesky 변환을 사용한다.

직교 다항식 행렬 계산 절차
  1. 시간 행렬 \(T\) 구성. 6 시점·이차까지: \(T = [\mathbf{1}, t, t^2]\), 즉 \[ T' = \begin{bmatrix} 1 & 1 & 1 & 1 & 1 & 1 \\ 0 & 1 & 2 & 3 & 4 & 5 \\ 0 & 1 & 4 & 9 & 16 & 25 \end{bmatrix} \]
  2. \(T'T\) 계산 (대칭 행렬)
  3. Cholesky 인수분해: \(T'T = SS'\), \(S\) 는 하삼각, \(S'\) 는 그 전치
  4. 역행렬 \((S')^{-1}\) 계산
  5. 직교 다항식 행렬: \(T_{\text{ortho}} = T(S')^{-1}\)

이 5 단계를 따르면 임의의 시간 구조 (불등간격, 결측 포함) 에서 직교 다항식이 자동으로 구성된다. SAS PROC IML 에서는 한 줄이다 — time*INV(ROOT(T(time)*time)).

6.4 직관: Cholesky 인수분해가 왜 직교화를 만들어내는가

\(T'T\) 는 다항식 항들의 “유사 공분산 행렬” 이다. 이를 \(SS'\) 로 분해하면 \(S^{-1}\) 이 그 분산 구조를 1 로 표준화하는 행렬 역할을 한다 — 마치 분산이 1 인 표준 정규로 변환하는 것과 같은 원리다.

\(T(S')^{-1}\) 의 각 열은 서로 직교하고 단위 분산을 가지게 되며, 이것이 정확히 직교 다항식의 정의와 일치한다. 즉, Cholesky 분해는 “내적 구조 평탄화 (whitening)” 의 일종이다.

7 모형 표현 비교 — 두 좌표계

원본 시간 척도 모형과 직교 다항식 모형은 같은 모형의 두 좌표 표현 이다.

원본 척도 직교 척도
디자인 행렬 \(X_i, Z_i\) (원본 시간) \(X_i (S')^{-1}, Z_i (S')^{-1}\)
고정효과 \(\beta\) \(\gamma\)
랜덤효과 \(\upsilon_i\) \(\theta_i\)
모형 \(y_i = X_i \beta + Z_i \upsilon_i + \varepsilon_i\) \(y_i = X_i (S')^{-1} \gamma + Z_i (S')^{-1} \theta_i + \varepsilon_i\)

7.1 모수 변환 공식

두 좌표계의 모수는 일대일 대응한다.

\[ \beta = (S')^{-1} \gamma, \qquad \gamma = S' \beta \]

\[ \Sigma_\upsilon = (S')^{-1} \Sigma_\theta S^{-1}, \qquad \Sigma_\theta = S' \Sigma_\upsilon S \]

표준오차 (분산 행렬) 도 같은 변환으로 매핑된다.

\[ V(\hat\beta) = (S')^{-1} V(\hat\gamma) S^{-1} \]

핵심: 두 모형은 수치적으로 동일 하다. 로그 우도 \(-2\log L\) 가 정확히 같다 (Hedeker Table 5.1 vs 5.2 — 둘 다 2207.64). 선택은 해석 편의의 문제일 뿐이다.

7.2 절편 해석의 차이 — 같은 모형, 다른 의미

직교 변환에서 가장 헷갈리는 지점

원본 척도의 \(\beta_0\) = 첫 시점 (\(t = 0\)) 의 평균 반응 직교 척도의 \(\gamma_0\) = 모든 시점에 걸친 평균 반응 (전체 평균)

같은 데이터에서 두 절편의 절대값이 크게 다른 것은 정상이다 (Reisby: \(\hat\beta_0 = 23.76\) vs \(\hat\gamma_0 = 43.24\)). \(\gamma_0 = S'_{(1,\cdot)} \beta\) 로 정확히 변환된다.

이 차이는 랜덤 효과 상관 부호 까지 뒤집을 수 있다.

Reisby 예시:

  • 원본: corr(\(\upsilon_0, \upsilon_1\)) = \(-0.11\) → “초기 우울이 높을수록 호전 기울기가 더 큼” 처럼 약하게 음의 관계
  • 직교: corr(\(\theta_0, \theta_1\)) = \(+0.59\) → “평균 우울이 높을수록 호전 기울기도 같이 큼” 처럼 강한 양의 관계

두 결과가 모순이 아니다 — 좌표가 다르기 때문이다. 원본 절편은 “초기 (baseline) 수준” 과 연관, 직교 절편은 “평균 수준” 과 연관 이라는 해석 차이가 부호를 결정한다.

8 고차 다항식 — 3차 이상

8.1 모형 확장

cubic (3차) 추세 모형은 \(t^3\) 항을 추가한다.

\[ y_{ij} = b_{0i} + b_{1i} t_{ij} + b_{2i} t_{ij}^2 + b_{3i} t_{ij}^3 + \varepsilon_{ij} \]

3차 곡선은 S 자 형태를 표현할 수 있다 — 초기 정체, 중기 급변, 후기 평탄화. 인지 회복, 학습 곡선, 약물 흡수·대사 같은 패턴에 적합하다.

8.2 모수 절약 한계

\(n\) 시점의 최대 다항식 차수
  • 고정효과: 최대 \(n - 1\) 차 다항식 가능 (균형 데이터에서 정확 적합 — 시점 평균과 일치)
  • 랜덤효과: 최대 \(n - 1\) 차이지만 그러면 오차 분산 \(\sigma^2\) 분리 불가능
    • 분산-공분산 행렬이 \(n \times n\) 이라 추정 가능한 모수가 \(n(n-1)/2\) 개로 제한

따라서 6 시점 데이터의 실용 한계는 보통 quadratic·cubic 까지이다. 4차 이상은 해석이 어렵고 과적합 위험이 크다.

8.3 차수 선택 — LRT 와 분산 비율

3 차의 추가 가치는 다음 두 방식으로 평가한다.

  1. LR 검정: \(H_0: \gamma_3 = \sigma_{\theta_3}^2 = \sigma_{\theta_0\theta_3} = \sigma_{\theta_1\theta_3} = \sigma_{\theta_2\theta_3} = 0\) Reisby cubic vs quadratic: \(\chi^2 = 11.2\), df = 5, \(p < 0.05\) → 3차 유의

  2. 분산 기여 비율: 절편·선형·이차·3차 랜덤효과 분산의 상대 비율 Reisby cubic 모형: 68.7% / 22.5% / 5.7% / 3.1% → 절편 + 선형이 90% 이상, 고차 추가 이득은 작음

“유의하지만 작은 효과” 의 보고 방식

LRT 가 유의하다고 해서 임상적·실무적으로 중요하다는 의미는 아니다. “통계적으로는 cubic 항이 분산 설명에 기여하지만, 그 비율은 약 3% 로 작다. 주요 변동은 여전히 절편·선형 추세에 있다” 같이 유의성과 실질적 크기를 함께 보고한다.

9 외삽 위험 — 다항식의 본질적 약점

다항식은 적합 구간 밖에서 폭발한다.

3차 곡선은 시간의 양 끝에서 \(\pm\infty\) 로 발산한다. 적합 구간 (예: 0~5 주) 내에서는 자연스러워 보여도, 그 밖 (예: 7 주, 10 주) 으로 외삽하면 해석 불가능한 값이 나온다.

다항식 외삽 점검

추정 후 반드시:

  1. 적합 곡선을 연구 기간 내 에서 그린다
  2. 양 끝에 한 시점 정도를 더해 그려본다 (Hedeker Figure 5.6)
  3. 곡선이 임상적으로 말이 되는 범위 안에 머무는지 확인

만약 외삽이 분석 목표라면 점근선이 있는 비선형 모형 을 고려해야 한다 (e.g., logistic, Gompertz). Hedeker 는 Davidian & Giltinan (1995), Vonesh & Chinchilli (1997) 를 비선형 MRM 의 표준 참고 문헌으로 든다.

10 응용 분야

분야 활용 적합 다항식 차수
정신과 임상시험 항우울제 효과의 곡선형 호전 quadratic
학습·인지 회복 S 자 학습 곡선 cubic
평정 척도 (HDRS, HAM-A) 천장·바닥 효과로 인한 비선형 quadratic / cubic
약동학 (PK) 흡수-분포-제거 곡선 cubic 이상 또는 비선형
발달 (성장) 곡선 키·체중의 성장 패턴 cubic / 비선형 (e.g., Bock-du Toit)

11 코드 예시

11.1 Step 1: 순수 Python 으로 직교 다항식 행렬 직접 구성

Cholesky 인수분해 절차를 따라 직접 구현한다.

import numpy as np

# 6 시점 (week 0~5), 이차까지
t = np.arange(6)
T = np.column_stack([np.ones_like(t), t, t**2])  # n x p, p=3

# Step 1: T'T
TtT = T.T @ T

# Step 2: Cholesky 분해 — T'T = S S' (S 하삼각)
S = np.linalg.cholesky(TtT)
Sp = S.T  # 상삼각

# Step 3: 직교 다항식 행렬
T_ortho = T @ np.linalg.inv(Sp)

# 직교성 확인 — 열 간 내적이 0, 자기 내적이 1
print("T'_ortho T_ortho =")
print(T_ortho.T @ T_ortho)  # 단위 행렬에 가까운지 확인

# 절편 계수 = 1/sqrt(6), 선형 계수 = 등간격 표준화 등 확인 가능
print("\nT_ortho =")
print(T_ortho)

검증 포인트: 출력된 T_ortho.T @ T_ortho 가 단위 행렬 (\(I_3\)) 에 가깝다. 또한 첫 열은 모두 \(1/\sqrt{6} \approx 0.408\) 로 일정하다 (절편 표준화).

11.2 Step 2: statsmodels 로 다항식 MRM 적합

Reisby 식 데이터를 모방한 합성 데이터로 quadratic vs cubic 을 비교한다.

import numpy as np
import pandas as pd
import statsmodels.formula.api as smf

# 합성 종단 데이터: 50 명, 6 시점, 곡선형 추세 + 개인별 이질성
np.random.seed(2026)
n_subj, n_time = 50, 6
subjects = np.repeat(np.arange(n_subj), n_time)
weeks = np.tile(np.arange(n_time), n_subj)

# 모집단: 평균 24, 선형 -2.5, 이차 0.05 (거의 직선)
# 개인: 절편·선형·이차에 정규 랜덤 효과
beta = np.array([24.0, -2.5, 0.05])
Sigma_v = np.diag([10.0, 6.5, 0.2])
v = np.random.multivariate_normal(np.zeros(3), Sigma_v, size=n_subj)
sigma_e = np.sqrt(10.5)

y = (
    (beta[0] + v[subjects, 0])
    + (beta[1] + v[subjects, 1]) * weeks
    + (beta[2] + v[subjects, 2]) * weeks**2
    + np.random.normal(0, sigma_e, size=n_subj * n_time)
)

df = pd.DataFrame({"subject": subjects, "week": weeks, "y": y})
df["week2"] = df["week"] ** 2
df["week3"] = df["week"] ** 3

# Quadratic MRM (랜덤 절편 + 랜덤 선형)
m_quad = smf.mixedlm(
    "y ~ week + week2",
    df,
    groups=df["subject"],
    re_formula="~week",
).fit(reml=False)

# Cubic MRM
m_cub = smf.mixedlm(
    "y ~ week + week2 + week3",
    df,
    groups=df["subject"],
    re_formula="~week",
).fit(reml=False)

# LR 검정 (간이) — deviance 차이
dev_diff = -2 * (m_cub.llf - m_quad.llf)
df_diff = m_cub.df_modelwc - m_quad.df_modelwc
print(f"deviance diff = {dev_diff:.2f}, df diff = {df_diff}")
print("\nQuadratic summary:")
print(m_quad.summary())
print("\nCubic summary:")
print(m_cub.summary())

해석 포인트:

  • dev_diff 가 카이제곱(\(\chi^2_{df}\)) 의 임계값보다 크면 cubic 항이 통계적으로 유의
  • 평균 (고정효과) 수준에서 \(\beta_2\) 가 비유의여도 랜덤 효과 분산 (\(\sigma_{\upsilon_2}^2\)) 은 따로 검정
  • re_formula 에 더 높은 차수의 랜덤 효과를 추가하면 수렴 어려움이 빈발 — 시간 중심화·직교 다항식으로 안정화
R 사용자라면

lme4::lmer(y ~ poly(week, 2) + (poly(week, 2) | subject), data = df) 형태를 사용한다. R 의 poly() 함수는 기본으로 직교 다항식 을 반환하므로 별도 Cholesky 단계 없이 직교 표현을 얻을 수 있다.

12 핵심 정리

한 페이지 요약
  1. 모형 형태: 선형 모형의 회귀자에 \(t^2, t^3, \ldots\) 추가. 회귀 계수에 대해 여전히 선형
  2. 시간 효과 미분: \(\beta_1 + 2\beta_2 t\) → flattening point \(t^* = -\beta_1/(2\beta_2)\) — 임상적 의사결정에 직결
  3. 평균 vs 개인: 고정효과 \(\beta_2\) 비유의여도 랜덤 효과 분산이 유의할 수 있음 — 개인별 곡선성이 부호로 cancel out
  4. 직교 다항식: 다공선성 + 척도 차이 동시 해결. Cholesky 인수분해로 임의 시점 구조에 적용
  5. 두 좌표계: 원본 모형과 직교 모형은 수치적으로 동일 (\(-2\log L\) 동일). \(S'\) 행렬로 모수 변환
  6. 절편 의미 변화: 원본 = 첫 시점, 직교 = 전체 평균 — 랜덤 효과 상관 부호도 달라질 수 있음
  7. 고차 한계: \(n\) 시점 → 최대 \(n-1\) 차. 실용적으로 quadratic·cubic 까지
  8. 외삽 위험: 다항식은 구간 밖에서 폭발 — 적합 곡선을 반드시 시각화. 외삽이 목표면 비선형 모형 사용

13 다음 단계

주제 다룰 내용 위치
§5.2 sub-post Reisby quadratic 적합의 분산-공분산 행렬 \(\widehat{V}(y)\) 수치 계산, Figure 5.3 직관 상세 추후 작성 (05-1-curvilinear-trend.qmd)
§5.3 sub-post Cholesky 인수분해 단계별 행렬 출력, 직교 변환의 SE 변환 공식 (\(G^+\), vec/vech) 추후 작성 (05-2-orthogonal-polynomials.qmd)
§5.3.5 sub-post Reisby cubic 적합 비교, 분산 기여 비율 표 (68.7/22.5/5.7/3.1) 추후 작성 (05-3-cubic-trend.qmd)
Ch.6 CPM MRM 의 대안 — 공분산 패턴 직접 모형화 미작성
비선형 MRM 점근선이 있는 진정한 비선형 모형 (logistic, Gompertz) 별도 시리즈 검토

14 관련 주제

선행 지식

관련 (다른 맥락의 직교 다항식)

후속 주제

  • Ch.5 §5.2 sub-post (05-1-curvilinear-trend.qmd, 추후 작성) — Reisby quadratic 분산-공분산 상세
  • Ch.5 §5.3 sub-post (05-2-orthogonal-polynomials.qmd, 추후 작성) — Cholesky·SE 변환 상세
  • Ch.6 — Covariance Pattern Models (CPM, 미작성) — 랜덤 효과 없이 시간 공분산 직접 모형화
  • Ch.7 Overview — MRM with Autocorrelated Errors — 다항식 추세 + 자기상관 오차

교재

  • Hedeker, D. & Gibbons, R. D. (2006). Longitudinal Data Analysis, Wiley, Ch.5 (pp. 81-99)
  • Bock, R. D. (1975). Multivariate Statistical Methods in Behavioral Research, McGraw-Hill — 직교 다항식 Cholesky 절차 원전
  • Davidian, M. & Giltinan, D. M. (1995). Nonlinear Models for Repeated Measurement Data, Chapman & Hall — 진정한 비선형 MRM
  • Vonesh, E. F. & Chinchilli, V. M. (1997). Linear and Nonlinear Models for the Analysis of Repeated Measurements, Marcel Dekker

Subscribe

Enjoy this blog? Get notified of new posts by email: