1 들어가며
Ch.4 — 혼합효과 회귀모형 개요 에서는 시간 추세를 선형 으로 가정했다. 즉, 시점 \(t_{ij}\) 에 대해 평균 반응이 \(\beta_0 + \beta_1 t_{ij}\) 의 형태로 변한다고 보았다.
그러나 실제 종단 데이터에서 시간 효과는 거의 항상 비선형이다.
- 약물 임상시험: 처치 직후 빠르게 호전된 뒤 점차 안정화 (감속하는 음의 추세)
- 인지·기능 회복: 초기 정체 → 중기 급상승 → 후기 평탄화 (S 자 곡선)
- 평정 척도 (rating scale): 0 또는 만점 근처에서 천장효과 (ceiling effect), 바닥효과 (floor effect) 로 변화 속도가 둔해짐
이 장에서는 선형 모형 안에 \(t^2, t^3, \ldots\) 같은 다항식 항을 추가하여 위와 같은 곡선형 추세를 적합하는 방법을 다룬다. 중요한 점은 모형이 여전히 선형 모형 이라는 사실이다 — 회귀 계수 \(\beta\) 에 대해 선형이기 때문이다. \(t^2\) 은 단지 “변형된 회귀자 (transformed regressor)” 일 뿐, 모형 형태는 일반 선형 회귀의 틀을 벗어나지 않는다.
2 학습 목표
이 장을 통해 다음을 다룬다.
- 곡선형 (이차) 추세 모형의 정의와 모수 해석
- 시간 효과의 미분과 flattening point (\(\partial y/\partial t = 0\)) 계산
- 직교 다항식 (orthogonal polynomial) 사용 동기와 Cholesky 인수분해 절차
- 원본 모형 ↔︎ 직교 모형의 모수 변환 공식
- 고차 다항식 (3차 이상) 의 적용과 외삽 위험
- Reisby 정신과 임상 데이터 (Hedeker, 2006, Ch.5) 적용 예시 흐름
3 Ch.5 구성
Hedeker & Gibbons (2006, Ch.5) 의 흐름을 그대로 따른다.
| 절 | 주제 | 핵심 내용 |
|---|---|---|
| §5.1 | Introduction | 비선형 추세의 동기, 천장·바닥 효과 |
| §5.2 | Curvilinear Trend Model | 이차 추세 MRM, 시간 효과 미분, flattening point |
| §5.2.1 | Curvilinear Trend Example | Reisby 데이터 적합, “평균은 직선·개인은 곡선” 패턴 |
| §5.3 | Orthogonal Polynomials | 다공선성 문제, Cholesky 변환, Pearson-Hartley 표 |
| §5.3.1 | Model Representations | 행렬 표현 비교 (\(T\) vs \(T(S')^{-1}\)) |
| §5.3.2 | Orthogonal Polynomial Example | Reisby 직교 적합, intercept 의 해석 변화 |
| §5.3.3 | Translating Parameters | \(\beta = (S')^{-1}\gamma\), 표준오차 변환 |
| §5.3.4 | Higher-Order Polynomials | 3차 이상, 모수 절약 |
| §5.3.5 | Cubic Trend Example | Reisby 3차 적합, LRT 비교 |
| §5.4 | Summary | 다항식 모형의 위치 — 진정한 비선형 모형은 별도 |
본 overview 는 위 절의 핵심을 통합 서술한다. 세부 수치 예시 (Reisby 분산 비율 표, \(\widehat{V}(y)\) 행렬 계산 등) 는 §5.2·§5.3 sub-post 로 분기 예정이다.
4 곡선형 (이차) 추세 모형
4.1 정의
Level-1 (피험자 내 시점):
\[ y_{ij} = b_{0i} + b_{1i} t_{ij} + b_{2i} t_{ij}^2 + \varepsilon_{ij} \]
Level-2 (피험자 간):
\[ b_{0i} = \beta_0 + \upsilon_{0i}, \quad b_{1i} = \beta_1 + \upsilon_{1i}, \quad b_{2i} = \beta_2 + \upsilon_{2i} \]
이때 \(\beta_0, \beta_1, \beta_2\) 는 각각 평균 절편, 평균 선형 추세, 평균 이차 추세 모수, \(\upsilon_{0i}, \upsilon_{1i}, \upsilon_{2i}\) 는 개인 \(i\) 의 이탈 (랜덤 효과) 이다.
이 모형은 다음과 같이 다시 쓸 수 있다.
\[ y_{ij} = b_{0i} + (b_{1i} + b_{2i} t_{ij}) t_{ij} + \varepsilon_{ij} \]
괄호 안의 \(b_{1i} + b_{2i} t_{ij}\) 가 시간이 지남에 따라 변하는 순간 시간 효과 (instantaneous time effect) 이다. 즉, 시간 효과 자체가 시간의 함수로 변한다 — 이것이 곡선형 추세의 본질이다.
4.2 직관: 왜 \(t^2\) 한 항을 추가하면 곡선이 그려지는가
선형 추세 모형 \(y = \beta_0 + \beta_1 t\) 에서 시간 효과는 상수 이다 — 매주 같은 양 \(\beta_1\) 만큼 변한다. \(t^2\) 항을 추가하면 시간 효과가 시간의 1차 함수로 변한다.
| 모형 | 시간 효과 \(\partial y / \partial t\) | 의미 |
|---|---|---|
| 선형 (\(\beta_1 t\)) | \(\beta_1\) (상수) | 매 시점 같은 변화량 |
| 이차 (\(\beta_1 t + \beta_2 t^2\)) | \(\beta_1 + 2\beta_2 t\) (선형) | 시간이 지나며 가속/감속 |
| 3차 (\(+ \beta_3 t^3\)) | \(\beta_1 + 2\beta_2 t + 3\beta_3 t^2\) (이차) | 가속도 자체가 변함 (S 자) |
직관적으로: “속도 → 가속도 → 가속도의 변화” 로 해석할 수 있다 (운동학과 같은 구조). \(t^2\) 은 추세에 “가속/감속” 을 부여하고, \(t^3\) 은 가속도 패턴을 한 번 뒤집을 자유도를 부여한다.
4.3 Flattening Point — 추세가 평탄해지는 시점
이차 모형에서 시간 효과를 0 으로 만드는 시점은 미분으로 직접 구한다.
\[ \frac{\partial y}{\partial t} = \beta_1 + 2\beta_2 t = 0 \quad \Longrightarrow \quad t^* = -\frac{\beta_1}{2\beta_2} \]
\(t^*\) 가 연구 기간 내부 에 있으면 추세가 한 번 뒤집히는 J 자/U 자 곡선, 외부 에 있으면 단조롭게 가속/감속하는 곡선이 된다.
임상시험에서 “약물 효과가 언제부터 평탄해지는가” 는 임상적 의미 와 직결된다.
- \(t^* = 4\) 주: 4 주 후부터 추가 호전이 미미 → 6 주 처치는 비효율
- \(t^*\) 가 추적 기간(예: 5 주)을 벗어남: 효과가 계속 누적 중 → 추적 연장 필요
수식 \(-\beta_1/(2\beta_2)\) 한 줄이 의사결정에 직접 들어가는 통계량이다.
4.4 4 가지 곡선형 패턴
이차 모형 하나로 표현 가능한 추세는 부호 조합으로 4 가지가 된다.
| 패턴 | \(\beta_1\) | \(\beta_2\) | 형태 |
|---|---|---|---|
| Decelerating positive | \(+\) | \(-\) | 상승 후 평탄화 |
| Accelerating positive | \(+\) | \(+\) | 상승이 가속 |
| Decelerating negative | \(-\) | \(+\) | 하락 후 평탄화 |
| Accelerating negative | \(-\) | \(-\) | 하락이 가속 |
여기에 \(|\beta_2|\) 가 충분히 크면 \(t^*\) 가 추적 기간 내부에 들어가 J 자 또는 U 자가 된다. 즉, \(\beta_0, \beta_1, \beta_2\) 세 모수만으로 단조 증가, 단조 감소, U 자, J 자, 역 U 자, 역 J 자를 모두 표현할 수 있다.
5 평균은 직선이지만 개인은 곡선일 수 있다
Hedeker (2006) 가 Reisby 데이터에 이차 모형을 적합한 결과는 직관적으로 흥미롭다.
- 고정효과 \(\beta_2\) 의 Wald 검정: 비유의 (\(p \approx 0.56\)) — 모집단 평균은 직선
- \(\sigma_{\upsilon_2}^2 = 0\) 으로 제약한 모형과의 LR 검정: 유의 (\(\Delta\text{deviance} = 11.4\), df = 4) — 개인 수준에서는 곡선
이 둘이 모순처럼 보이지만 그렇지 않다.
상승 후 평탄화 (subject 1) + 가속 상승 (subject 2) 같은 두 곡선의 평균이 거의 직선이 되는 상황이 가능하다. 즉 개인 수준의 곡선성이 부호가 다른 방향으로 분산되어 있어서 평균에서 cancel out 된다.
이것이 Hedeker Figure 5.3 의 의미이다 — “average linear trend, individual quadratic trends”.
실무 함의: 모집단 평균만 보고 “선형으로 충분” 이라고 결론지으면 임상적으로 매우 중요한 개인별 반응 패턴 다양성 을 놓친다. 랜덤 효과 분산 (\(\sigma_{\upsilon_2}^2\)) 의 유의성을 별도로 검정해야 한다.
6 직교 다항식 (Orthogonal Polynomials)
6.1 왜 필요한가 — 다공선성 문제
원본 시간 변수 \(t\) 와 그 제곱 \(t^2\) 은 거의 완벽히 상관된다.
3 시점 (\(t = 0, 1, 2\)) 의 경우 \(t^2 = (0, 1, 4)\) 이고 두 변수의 표본 상관은 약 0.98 이다. 일반 회귀에서 다공선성은 표준오차를 부풀리고 계수 해석을 왜곡한다.
이 문제를 단계적으로 완화하는 두 도구가 있다.
| 도구 | 효과 | 한계 |
|---|---|---|
| 시간 중심화 (\(t - \bar{t}\)) | 등간격·균형 데이터에서 선형-이차 상관 정확히 0 | 척도 차이 (분산 크기) 는 그대로 |
| 직교 다항식 (orthogonal polynomial) | 상관 제거 + 단위 척도 (unit scale) 표준화 | 계산이 한 단계 더 필요 |
- 상관 0: 절편·선형·이차 항이 서로 독립 → 계수 추정이 안정
- 같은 척도: 표준화된 베타 처럼 계수 크기 직접 비교 가능 → “선형 추세의 상대 중요도” 같은 해석이 즉시 가능
원본 척도에서는 고차 항으로 갈수록 계수와 SE 가 작아져 추정이 어려워지는데, 직교 변환 후에는 모든 차수가 같은 단위 분산이라 수치적으로 안정된다.
6.2 Pearson-Hartley 표 — 등간격 6 시점 예시
\(n = 6\), 등간격일 때 절편·선형·이차 직교 다항식은 다음과 같다.
\[ \begin{bmatrix} 1 & 1 & 1 & 1 & 1 & 1 \\ -5 & -3 & -1 & 1 & 3 & 5 \\ 5 & -1 & -4 & -4 & -1 & 5 \end{bmatrix} \Big/ \begin{bmatrix}\sqrt{6} \\ \sqrt{70} \\ \sqrt{84}\end{bmatrix} \]
각 행을 자신의 제곱합 제곱근으로 나누어 단위 분산을 만든다.
직교성은 행 간 내적이 0 임으로 확인된다 (예: \((-5)(5) + (-3)(-1) + (-1)(-4) + (1)(-4) + (3)(-1) + (5)(5) = 0\)).
6.3 Cholesky 인수분해 — 일반 절차
위 표는 등간격일 때만 직접 사용 가능하다. 불등간격 또는 결측 시점 이 있을 때는 Bock (1975) 의 Cholesky 변환을 사용한다.
- 시간 행렬 \(T\) 구성. 6 시점·이차까지: \(T = [\mathbf{1}, t, t^2]\), 즉 \[ T' = \begin{bmatrix} 1 & 1 & 1 & 1 & 1 & 1 \\ 0 & 1 & 2 & 3 & 4 & 5 \\ 0 & 1 & 4 & 9 & 16 & 25 \end{bmatrix} \]
- \(T'T\) 계산 (대칭 행렬)
- Cholesky 인수분해: \(T'T = SS'\), \(S\) 는 하삼각, \(S'\) 는 그 전치
- 역행렬 \((S')^{-1}\) 계산
- 직교 다항식 행렬: \(T_{\text{ortho}} = T(S')^{-1}\)
이 5 단계를 따르면 임의의 시간 구조 (불등간격, 결측 포함) 에서 직교 다항식이 자동으로 구성된다. SAS PROC IML 에서는 한 줄이다 — time*INV(ROOT(T(time)*time)).
6.4 직관: Cholesky 인수분해가 왜 직교화를 만들어내는가
\(T'T\) 는 다항식 항들의 “유사 공분산 행렬” 이다. 이를 \(SS'\) 로 분해하면 \(S^{-1}\) 이 그 분산 구조를 1 로 표준화하는 행렬 역할을 한다 — 마치 분산이 1 인 표준 정규로 변환하는 것과 같은 원리다.
\(T(S')^{-1}\) 의 각 열은 서로 직교하고 단위 분산을 가지게 되며, 이것이 정확히 직교 다항식의 정의와 일치한다. 즉, Cholesky 분해는 “내적 구조 평탄화 (whitening)” 의 일종이다.
7 모형 표현 비교 — 두 좌표계
원본 시간 척도 모형과 직교 다항식 모형은 같은 모형의 두 좌표 표현 이다.
| 원본 척도 | 직교 척도 | |
|---|---|---|
| 디자인 행렬 | \(X_i, Z_i\) (원본 시간) | \(X_i (S')^{-1}, Z_i (S')^{-1}\) |
| 고정효과 | \(\beta\) | \(\gamma\) |
| 랜덤효과 | \(\upsilon_i\) | \(\theta_i\) |
| 모형 | \(y_i = X_i \beta + Z_i \upsilon_i + \varepsilon_i\) | \(y_i = X_i (S')^{-1} \gamma + Z_i (S')^{-1} \theta_i + \varepsilon_i\) |
7.1 모수 변환 공식
두 좌표계의 모수는 일대일 대응한다.
\[ \beta = (S')^{-1} \gamma, \qquad \gamma = S' \beta \]
\[ \Sigma_\upsilon = (S')^{-1} \Sigma_\theta S^{-1}, \qquad \Sigma_\theta = S' \Sigma_\upsilon S \]
표준오차 (분산 행렬) 도 같은 변환으로 매핑된다.
\[ V(\hat\beta) = (S')^{-1} V(\hat\gamma) S^{-1} \]
핵심: 두 모형은 수치적으로 동일 하다. 로그 우도 \(-2\log L\) 가 정확히 같다 (Hedeker Table 5.1 vs 5.2 — 둘 다 2207.64). 선택은 해석 편의의 문제일 뿐이다.
7.2 절편 해석의 차이 — 같은 모형, 다른 의미
원본 척도의 \(\beta_0\) = 첫 시점 (\(t = 0\)) 의 평균 반응 직교 척도의 \(\gamma_0\) = 모든 시점에 걸친 평균 반응 (전체 평균)
같은 데이터에서 두 절편의 절대값이 크게 다른 것은 정상이다 (Reisby: \(\hat\beta_0 = 23.76\) vs \(\hat\gamma_0 = 43.24\)). \(\gamma_0 = S'_{(1,\cdot)} \beta\) 로 정확히 변환된다.
이 차이는 랜덤 효과 상관 부호 까지 뒤집을 수 있다.
Reisby 예시:
- 원본: corr(\(\upsilon_0, \upsilon_1\)) = \(-0.11\) → “초기 우울이 높을수록 호전 기울기가 더 큼” 처럼 약하게 음의 관계
- 직교: corr(\(\theta_0, \theta_1\)) = \(+0.59\) → “평균 우울이 높을수록 호전 기울기도 같이 큼” 처럼 강한 양의 관계
두 결과가 모순이 아니다 — 좌표가 다르기 때문이다. 원본 절편은 “초기 (baseline) 수준” 과 연관, 직교 절편은 “평균 수준” 과 연관 이라는 해석 차이가 부호를 결정한다.
8 고차 다항식 — 3차 이상
8.1 모형 확장
cubic (3차) 추세 모형은 \(t^3\) 항을 추가한다.
\[ y_{ij} = b_{0i} + b_{1i} t_{ij} + b_{2i} t_{ij}^2 + b_{3i} t_{ij}^3 + \varepsilon_{ij} \]
3차 곡선은 S 자 형태를 표현할 수 있다 — 초기 정체, 중기 급변, 후기 평탄화. 인지 회복, 학습 곡선, 약물 흡수·대사 같은 패턴에 적합하다.
8.2 모수 절약 한계
- 고정효과: 최대 \(n - 1\) 차 다항식 가능 (균형 데이터에서 정확 적합 — 시점 평균과 일치)
- 랜덤효과: 최대 \(n - 1\) 차이지만 그러면 오차 분산 \(\sigma^2\) 분리 불가능
- 분산-공분산 행렬이 \(n \times n\) 이라 추정 가능한 모수가 \(n(n-1)/2\) 개로 제한
따라서 6 시점 데이터의 실용 한계는 보통 quadratic·cubic 까지이다. 4차 이상은 해석이 어렵고 과적합 위험이 크다.
8.3 차수 선택 — LRT 와 분산 비율
3 차의 추가 가치는 다음 두 방식으로 평가한다.
LR 검정: \(H_0: \gamma_3 = \sigma_{\theta_3}^2 = \sigma_{\theta_0\theta_3} = \sigma_{\theta_1\theta_3} = \sigma_{\theta_2\theta_3} = 0\) Reisby cubic vs quadratic: \(\chi^2 = 11.2\), df = 5, \(p < 0.05\) → 3차 유의
분산 기여 비율: 절편·선형·이차·3차 랜덤효과 분산의 상대 비율 Reisby cubic 모형: 68.7% / 22.5% / 5.7% / 3.1% → 절편 + 선형이 90% 이상, 고차 추가 이득은 작음
LRT 가 유의하다고 해서 임상적·실무적으로 중요하다는 의미는 아니다. “통계적으로는 cubic 항이 분산 설명에 기여하지만, 그 비율은 약 3% 로 작다. 주요 변동은 여전히 절편·선형 추세에 있다” 같이 유의성과 실질적 크기를 함께 보고한다.
9 외삽 위험 — 다항식의 본질적 약점
다항식은 적합 구간 밖에서 폭발한다.
3차 곡선은 시간의 양 끝에서 \(\pm\infty\) 로 발산한다. 적합 구간 (예: 0~5 주) 내에서는 자연스러워 보여도, 그 밖 (예: 7 주, 10 주) 으로 외삽하면 해석 불가능한 값이 나온다.
추정 후 반드시:
- 적합 곡선을 연구 기간 내 에서 그린다
- 양 끝에 한 시점 정도를 더해 그려본다 (Hedeker Figure 5.6)
- 곡선이 임상적으로 말이 되는 범위 안에 머무는지 확인
만약 외삽이 분석 목표라면 점근선이 있는 비선형 모형 을 고려해야 한다 (e.g., logistic, Gompertz). Hedeker 는 Davidian & Giltinan (1995), Vonesh & Chinchilli (1997) 를 비선형 MRM 의 표준 참고 문헌으로 든다.
10 응용 분야
| 분야 | 활용 | 적합 다항식 차수 |
|---|---|---|
| 정신과 임상시험 | 항우울제 효과의 곡선형 호전 | quadratic |
| 학습·인지 회복 | S 자 학습 곡선 | cubic |
| 평정 척도 (HDRS, HAM-A) | 천장·바닥 효과로 인한 비선형 | quadratic / cubic |
| 약동학 (PK) | 흡수-분포-제거 곡선 | cubic 이상 또는 비선형 |
| 발달 (성장) 곡선 | 키·체중의 성장 패턴 | cubic / 비선형 (e.g., Bock-du Toit) |
11 코드 예시
11.1 Step 1: 순수 Python 으로 직교 다항식 행렬 직접 구성
Cholesky 인수분해 절차를 따라 직접 구현한다.
import numpy as np
# 6 시점 (week 0~5), 이차까지
t = np.arange(6)
T = np.column_stack([np.ones_like(t), t, t**2]) # n x p, p=3
# Step 1: T'T
TtT = T.T @ T
# Step 2: Cholesky 분해 — T'T = S S' (S 하삼각)
S = np.linalg.cholesky(TtT)
Sp = S.T # 상삼각
# Step 3: 직교 다항식 행렬
T_ortho = T @ np.linalg.inv(Sp)
# 직교성 확인 — 열 간 내적이 0, 자기 내적이 1
print("T'_ortho T_ortho =")
print(T_ortho.T @ T_ortho) # 단위 행렬에 가까운지 확인
# 절편 계수 = 1/sqrt(6), 선형 계수 = 등간격 표준화 등 확인 가능
print("\nT_ortho =")
print(T_ortho)검증 포인트: 출력된 T_ortho.T @ T_ortho 가 단위 행렬 (\(I_3\)) 에 가깝다. 또한 첫 열은 모두 \(1/\sqrt{6} \approx 0.408\) 로 일정하다 (절편 표준화).
11.2 Step 2: statsmodels 로 다항식 MRM 적합
Reisby 식 데이터를 모방한 합성 데이터로 quadratic vs cubic 을 비교한다.
import numpy as np
import pandas as pd
import statsmodels.formula.api as smf
# 합성 종단 데이터: 50 명, 6 시점, 곡선형 추세 + 개인별 이질성
np.random.seed(2026)
n_subj, n_time = 50, 6
subjects = np.repeat(np.arange(n_subj), n_time)
weeks = np.tile(np.arange(n_time), n_subj)
# 모집단: 평균 24, 선형 -2.5, 이차 0.05 (거의 직선)
# 개인: 절편·선형·이차에 정규 랜덤 효과
beta = np.array([24.0, -2.5, 0.05])
Sigma_v = np.diag([10.0, 6.5, 0.2])
v = np.random.multivariate_normal(np.zeros(3), Sigma_v, size=n_subj)
sigma_e = np.sqrt(10.5)
y = (
(beta[0] + v[subjects, 0])
+ (beta[1] + v[subjects, 1]) * weeks
+ (beta[2] + v[subjects, 2]) * weeks**2
+ np.random.normal(0, sigma_e, size=n_subj * n_time)
)
df = pd.DataFrame({"subject": subjects, "week": weeks, "y": y})
df["week2"] = df["week"] ** 2
df["week3"] = df["week"] ** 3
# Quadratic MRM (랜덤 절편 + 랜덤 선형)
m_quad = smf.mixedlm(
"y ~ week + week2",
df,
groups=df["subject"],
re_formula="~week",
).fit(reml=False)
# Cubic MRM
m_cub = smf.mixedlm(
"y ~ week + week2 + week3",
df,
groups=df["subject"],
re_formula="~week",
).fit(reml=False)
# LR 검정 (간이) — deviance 차이
dev_diff = -2 * (m_cub.llf - m_quad.llf)
df_diff = m_cub.df_modelwc - m_quad.df_modelwc
print(f"deviance diff = {dev_diff:.2f}, df diff = {df_diff}")
print("\nQuadratic summary:")
print(m_quad.summary())
print("\nCubic summary:")
print(m_cub.summary())해석 포인트:
dev_diff가 카이제곱(\(\chi^2_{df}\)) 의 임계값보다 크면 cubic 항이 통계적으로 유의- 평균 (고정효과) 수준에서 \(\beta_2\) 가 비유의여도 랜덤 효과 분산 (\(\sigma_{\upsilon_2}^2\)) 은 따로 검정
re_formula에 더 높은 차수의 랜덤 효과를 추가하면 수렴 어려움이 빈발 — 시간 중심화·직교 다항식으로 안정화
lme4::lmer(y ~ poly(week, 2) + (poly(week, 2) | subject), data = df) 형태를 사용한다. R 의 poly() 함수는 기본으로 직교 다항식 을 반환하므로 별도 Cholesky 단계 없이 직교 표현을 얻을 수 있다.
12 핵심 정리
- 모형 형태: 선형 모형의 회귀자에 \(t^2, t^3, \ldots\) 추가. 회귀 계수에 대해 여전히 선형
- 시간 효과 미분: \(\beta_1 + 2\beta_2 t\) → flattening point \(t^* = -\beta_1/(2\beta_2)\) — 임상적 의사결정에 직결
- 평균 vs 개인: 고정효과 \(\beta_2\) 비유의여도 랜덤 효과 분산이 유의할 수 있음 — 개인별 곡선성이 부호로 cancel out
- 직교 다항식: 다공선성 + 척도 차이 동시 해결. Cholesky 인수분해로 임의 시점 구조에 적용
- 두 좌표계: 원본 모형과 직교 모형은 수치적으로 동일 (\(-2\log L\) 동일). \(S'\) 행렬로 모수 변환
- 절편 의미 변화: 원본 = 첫 시점, 직교 = 전체 평균 — 랜덤 효과 상관 부호도 달라질 수 있음
- 고차 한계: \(n\) 시점 → 최대 \(n-1\) 차. 실용적으로 quadratic·cubic 까지
- 외삽 위험: 다항식은 구간 밖에서 폭발 — 적합 곡선을 반드시 시각화. 외삽이 목표면 비선형 모형 사용
13 다음 단계
| 주제 | 다룰 내용 | 위치 |
|---|---|---|
| §5.2 sub-post | Reisby quadratic 적합의 분산-공분산 행렬 \(\widehat{V}(y)\) 수치 계산, Figure 5.3 직관 상세 | 추후 작성 (05-1-curvilinear-trend.qmd) |
| §5.3 sub-post | Cholesky 인수분해 단계별 행렬 출력, 직교 변환의 SE 변환 공식 (\(G^+\), vec/vech) | 추후 작성 (05-2-orthogonal-polynomials.qmd) |
| §5.3.5 sub-post | Reisby cubic 적합 비교, 분산 기여 비율 표 (68.7/22.5/5.7/3.1) | 추후 작성 (05-3-cubic-trend.qmd) |
| Ch.6 CPM | MRM 의 대안 — 공분산 패턴 직접 모형화 | 미작성 |
| 비선형 MRM | 점근선이 있는 진정한 비선형 모형 (logistic, Gompertz) | 별도 시리즈 검토 |
14 관련 주제
선행 지식
- Ch.4 Overview — 혼합효과 회귀모형 개요 — 선형 추세 MRM 의 기본 구조
- § 4.3 — 랜덤 절편·추세 MRM — 시간 코딩과 랜덤 기울기
- § 4.4 — 행렬 공식화 — \(X, Z, \Sigma_\upsilon\) 의 행렬 표현
- § 4.5 — MRM 추정론 (ML/REML/EM/Fisher Scoring) — 본 장에서 재사용
관련 (다른 맥락의 직교 다항식)
- § 3.2 — MANOVA 일표본 (직교 다항식 P 행렬) — MANOVA 에서 직교 다항식의 역할
- § 3.4 — Bock 수치 계산 — 직교 다항식 수치 예시
후속 주제
- Ch.5 §5.2 sub-post (
05-1-curvilinear-trend.qmd, 추후 작성) — Reisby quadratic 분산-공분산 상세 - Ch.5 §5.3 sub-post (
05-2-orthogonal-polynomials.qmd, 추후 작성) — Cholesky·SE 변환 상세 - Ch.6 — Covariance Pattern Models (CPM, 미작성) — 랜덤 효과 없이 시간 공분산 직접 모형화
- Ch.7 Overview — MRM with Autocorrelated Errors — 다항식 추세 + 자기상관 오차
교재
- Hedeker, D. & Gibbons, R. D. (2006). Longitudinal Data Analysis, Wiley, Ch.5 (pp. 81-99)
- Bock, R. D. (1975). Multivariate Statistical Methods in Behavioral Research, McGraw-Hill — 직교 다항식 Cholesky 절차 원전
- Davidian, M. & Giltinan, D. M. (1995). Nonlinear Models for Repeated Measurement Data, Chapman & Hall — 진정한 비선형 MRM
- Vonesh, E. F. & Chinchilli, V. M. (1997). Linear and Nonlinear Models for the Analysis of Repeated Measurements, Marcel Dekker