1 개요
종단 데이터의 고전적 분석법은 크게 두 가지다: 반복측정 ANOVA(univariate mixed-model, split-plot ANOVA)와 MANOVA. 두 방법 모두 구간 척도와 정규 오차를 가정하며, 집단 평균 비교에 초점을 맞춘다. 개인별 성장 곡선에 대한 정보는 제공하지 않는다.
| 특성 | 반복측정 ANOVA | MANOVA |
|---|---|---|
| 공분산 가정 | 복합대칭(compound symmetry) | 비구조적(unstructured) |
| 결측치 처리 | 불균형 설계 부분 허용 | 완전 데이터만 가능 |
| 시점 조건 | 피험자 간 동일 시점 | 피험자 간 동일 시점 |
| 시변 공변량 | 불가 | 불가 |
| 개인별 곡선 | 정보 없음 | 정보 없음 |
반복측정 ANOVA와 MANOVA는 현재 일상적 사용이 권장되지 않는다. 그러나 이 방법들은 혼합효과 모형(LMM)과 GEE가 어떤 문제를 해결하기 위해 등장했는지를 이해하는 개념적 발판이다 (Hedeker & Gibbons, 2006, Ch.2).
2 단일 표본 반복측정 ANOVA
2.1 모형 정의
피험자가 하나의 집단에 속하고 \(n\) 시점에 반복 측정되는 경우, 임의블록 ANOVA(randomized blocks ANOVA)를 사용한다.
\(N\) 명의 피험자( \(i = 1, \ldots, N\) )와 \(n\) 시점( \(j = 1, \ldots, n\) )에 대해 모형은
\[ y_{ij} = \mu + \pi_i + \tau_j + e_{ij} \tag{2.1} \]
- \(\mu\): 전체 평균
- \(\pi_i\): 피험자 \(i\)의 개인차 성분 (시간에 걸쳐 일정하다고 가정)
- \(\tau_j\): 시점 \(j\)의 효과 (모든 피험자에게 동일하다고 가정)
- \(e_{ij}\): 오차
확률 성분의 분포 가정은
\[ \pi_i \sim N(0, \sigma_\pi^2), \quad e_{ij} \sim N(0, \sigma_e^2). \]
\(\sigma_\pi^2\)는 피험자 간(between-subjects) 분산, \(\sigma_e^2\)는 피험자 내(within-subjects) 분산이다. 이 모형은 피험자( \(\pi_i\) )는 랜덤 효과, 시간( \(\tau_j\) )은 고정 효과를 갖는 혼합 모형이다.
직관: 같은 사람이 4학년과 5학년에 모두 시험을 보면, 그 점수는 독립이 아니다. 영리한 학생은 두 시점 모두 높은 점수를 받는다. 이 체계적 개인차를 \(\pi_i\) 가 포착한다.
2.2 모형 가정과 공분산 구조
모형 가정을 정리하면
\[ \sum_{j=1}^n \tau_j = 0, \quad E(y_{ij}) = \mu + \tau_j, \]
\[ V(y_{ij}) = \sigma_\pi^2 + \sigma_e^2, \quad C(y_{ij}, y_{i'j}) = 0 \; (i \neq i'), \]
\[ C(y_{ij}, y_{ij'}) = \sigma_\pi^2 \; (j \neq j'). \]
같은 피험자의 두 시점 간 상관(급내상관계수, ICC)은
\[ \text{Corr}(y_{ij}, y_{ij'}) = \frac{\sigma_\pi^2}{\sigma_\pi^2 + \sigma_e^2}. \tag{2.2} \]
이 상관은 모든 시점 쌍에서 동일하다. 이로부터 반복측정 벡터의 분산-공분산 행렬은 복합대칭(compound symmetry, CS) 구조를 갖는다:
\[ V(\mathbf{y}_i) = \begin{bmatrix} \sigma_\pi^2 + \sigma_e^2 & \sigma_\pi^2 & \cdots & \sigma_\pi^2 \\ \sigma_\pi^2 & \sigma_\pi^2 + \sigma_e^2 & \cdots & \sigma_\pi^2 \\ \vdots & & \ddots & \vdots \\ \sigma_\pi^2 & \sigma_\pi^2 & \cdots & \sigma_\pi^2 + \sigma_e^2 \end{bmatrix}. \tag{2.3} \]
복합대칭은 두 가지 비현실적 함의를 갖는다.
- 분산이 시간에 따라 일정: 실제로는 처치 반응 여부에 따라 연구 후반부에 분산이 커진다.
- 공분산이 시점 간격과 무관: 실제로는 가까운 시점 간 상관이 먼 시점 간 상관보다 크다.
CS가 성립하지 않으면 F-검정이 과자유로적(too liberal)이 되어 1종 오류가 증가한다.
2.3 설계 구조
피험자와 시점의 완전 교차(crossed) 설계:
| 피험자 | 시점 1 | 시점 2 | \(\cdots\) | 시점 \(n\) |
|---|---|---|---|---|
| 1 | \(y_{11}\) | \(y_{12}\) | \(\cdots\) | \(y_{1n}\) |
| 2 | \(y_{21}\) | \(y_{22}\) | \(\cdots\) | \(y_{2n}\) |
| \(\vdots\) | ||||
| \(N\) | \(y_{N1}\) | \(y_{N2}\) | \(\cdots\) | \(y_{Nn}\) |
셀당 관측치가 1개이다. \(n = 2\)인 경우 이 설계와 분석은 대응 \(t\)-검정과 동일하다.
2.4 ANOVA 표
균형 설계( \(N\) 명, \(n\) 시점, 결측 없음)에서 ANOVA 표는 다음과 같다.
| 변동 원인 | \(df\) | \(SS\) | \(MS\) | \(E(MS)\) |
|---|---|---|---|---|
| 피험자 | \(N-1\) | \(SS_S = n\sum_{i}(\bar{y}_{i.} - \bar{y}_{..})^2\) | \(MS_S\) | \(\sigma_e^2 + n\sigma_\pi^2\) |
| 시간 | \(n-1\) | \(SS_T = N\sum_{j}(\bar{y}_{.j} - \bar{y}_{..})^2\) | \(MS_T\) | \(\sigma_e^2 + \frac{N\sum(\tau_j - \bar\tau)^2}{n-1}\) |
| 잔차 | \((N-1)(n-1)\) | \(SS_R = \sum_{ij}(y_{ij} - \bar{y}_{i.} - \bar{y}_{.j} + \bar{y}_{..})^2\) | \(MS_R\) | \(\sigma_e^2\) |
| 합계 | \(Nn-1\) | \(SS_y = \sum_{ij}(y_{ij} - \bar{y}_{..})^2\) |
- \(\bar{y}_{..}\): 전체 평균, \(\bar{y}_{i.}\): 피험자 \(i\)의 평균, \(\bar{y}_{.j}\): 시점 \(j\)의 평균
2.5 가설 검정과 ICC 추정
시간 효과와 피험자 효과에 대한 F-검정은
\[ H_T: \tau_1 = \cdots = \tau_n = 0, \quad F_T = \frac{MS_T}{MS_R} \sim F_{n-1,\,(N-1)(n-1)}. \tag{2.4} \]
\[ H_S: \sigma_\pi^2 = 0, \quad F_S = \frac{MS_S}{MS_R} \sim F_{N-1,\,(N-1)(n-1)}. \]
분석의 주요 관심은 시간 효과( \(H_T\) ) 이다. 피험자 효과는 거의 항상 유의하다고 가정한다.
급내상관계수(ICC)는
\[ \widehat{ICC} = \frac{\widehat{\sigma}_\pi^2}{\widehat{\sigma}_\pi^2 + \widehat{\sigma}_e^2}, \tag{2.5} \]
분산 성분 추정치는
\[ \widehat{\sigma}_\pi^2 = \frac{MS_S - MS_R}{n}, \quad \widehat{\sigma}_e^2 = MS_R. \tag{2.6, 2.7} \]
\(MS_S \le MS_R\) 이면 \(\widehat\sigma_\pi^2 = 0\) 으로 처리한다.
직관: ICC는 \(R^2\)처럼 피험자가 설명하는 분산 비율을 나타낸다. 시간 효과를 제거한 뒤 남은 변동 중 피험자 간 개인차가 차지하는 몫이다. ICC가 높을수록 반복측정 간 상관이 강하고, 독립 관측 가정은 더 심각하게 위반된다.
3 시간 효과 분해: 대비 분석
3.1 대비의 일반 정의
시간의 전체 검정 \(H_T: \tau_1 = \cdots = \tau_n = 0\)은 매우 포괄적이다. 구체적인 시점 비교를 위해 \(n-1\)개의 대비(contrast) \(L_{j'}\) 를 구성한다.
\[ L_{j'} = \sum_{j=1}^n c_{j'j}\,\bar{y}_{.j}, \quad j' = 1, \ldots, n-1, \tag{2.10} \]
대비 계수의 합 조건: \(\sum_j c_{j'j} = 0\).
각 대비의 평균제곱과 검정통계량은
\[ MS_{j'} = \frac{N L_{j'}^2}{\sum_j c_{j'j}^2}, \tag{2.12} \]
\[ F_{j'} = \frac{MS_{j'}}{MS_R} \sim F_{1,\,(N-1)(n-1)}, \quad t_{j'} = \frac{L_{j'}}{\sqrt{MS_R \cdot \sum_j c_{j'j}^2 / N}} \sim t_{(N-1)(n-1)}. \]
직교 대비 집합을 사용하면 \(SS_T = \sum_{j'} SS_{j'}\) 로 시간 변동이 독립적으로 분해된다.
3.2 대비 유형 1: 직교 다항식 대비 (Trend Analysis)
\(n = 4\) 시점의 경우 직교 다항식 대비 행렬( \(\div\sqrt{4/20}\) 정규화 후):
\[ C = \begin{bmatrix} -3 & -1 & 1 & 3 \\ 1 & -1 & -1 & 1 \\ -1 & 3 & -3 & 1 \end{bmatrix} \div \sqrt{\tfrac{4}{20}} \tag{2.14} \]
각 행은 선형(linear), 이차(quadratic), 삼차(cubic) 추세를 추출한다.
언제 사용하는가: 시간에 따른 변화 형태(선형인가, 감속하는가, S자인가)를 파악할 때. 직교 다항식은 서로 독립이므로 \(SS_T\)의 독립 분해를 제공한다.
직관: 어휘력이 8학년 → 11학년 증가할 때, 증가 속도가 느려지는지(이차 음의 추세)를 선형 추세와 분리해서 검정할 수 있다.
3.3 대비 유형 2: 기준셀 대비 (Reference Cell / Simple Contrasts)
첫 번째 시점(기저선, baseline)을 기준으로 각 시점과의 차이를 검정한다.
\[ C = \begin{bmatrix} -1 & 1 & 0 & 0 \\ -1 & 0 & 1 & 0 \\ -1 & 0 & 0 & 1 \end{bmatrix} \tag{2.15} \]
→ T2-T1, T3-T1, T4-T1 비교. 직교하지 않는다.
언제 사용하는가: “처치 전과 비교해서 각 시점에 변화가 있었는가?”를 확인할 때. 임상시험에서 기저선 대비 각 추적 시점의 개선 여부를 보는 전형적 상황이다.
3.4 대비 유형 3: 프로파일 대비 (Profile Contrasts)
인접 시점 간 차이를 순차적으로 검정한다.
\[ C = \begin{bmatrix} -1 & 1 & 0 & 0 \\ 0 & -1 & 1 & 0 \\ 0 & 0 & -1 & 1 \end{bmatrix} \tag{2.16} \]
→ T2-T1, T3-T2, T4-T3 비교. 직교하지 않는다.
언제 사용하는가: 변화가 언제 시작되고 끝나는지 식별할 때. 예를 들어, 약물 효과가 2주째부터 3주째에 가장 크게 나타나는지 확인한다.
3.5 대비 유형 4: Helmert 대비
각 시점을 이후 시점들의 평균과 비교한다.
\[ C = \begin{bmatrix} 1 & -1/3 & -1/3 & -1/3 \\ 0 & 1 & -1/2 & -1/2 \\ 0 & 0 & 1 & -1 \end{bmatrix} \tag{2.17} \]
→ T1 vs 평균(T2,T3,T4); T2 vs 평균(T3,T4); T3 vs T4. 직교한다.
역방향(각 시점을 이전 시점들의 평균과 비교):
\[ C = \begin{bmatrix} -1 & 1 & 0 & 0 \\ -1/2 & -1/2 & 1 & 0 \\ -1/3 & -1/3 & -1/3 & 1 \end{bmatrix} \tag{2.18} \]
언제 사용하는가: 순서 있는 비교가 의미 있을 때. “이 단계가 이전 단계들 전체의 평균보다 높은가?”
3.6 대비 유형 5: 이탈 대비 (Deviation Contrasts)
각 시점을 나머지 모든 시점의 평균과 비교한다.
\[ C = \begin{bmatrix} 1 & -1/3 & -1/3 & -1/3 \\ -1/3 & 1 & -1/3 & -1/3 \\ -1/3 & -1/3 & 1 & -1/3 \end{bmatrix} \tag{2.19} \]
직교하지 않는다. 시간에 대한 “막연한 사전 지식”만 있을 때 유용하다.
3.7 다중비교 조정
\(n-1\)개 대비를 동시에 검정할 때 실험 단위의 1종 오류율이 증가한다.
- Bonferroni 보정: \(\alpha^* = \alpha/(n-1)\). 가장 보수적.
- Fisher 보호 검정: 전체 \(H_T\)가 유의할 때만 개별 대비를 검정. 적당히 보수적.
- 직교 다항식의 경우: 최고차 다항식부터 역방향으로 검정하여 처음 유의한 차수에서 멈춘다.
- 조정 없는 접근: 일부 통계학자는 사전 지정된 소수의 대비에 대해 조정이 불필요하다고 주장한다 (Cook & Farewell, 1996).
권장: 대비를 사전에 지정하고, Fisher 보호 검정을 기본으로 사용한다.
4 다중 표본 반복측정 ANOVA
4.1 모형 정의 (분할구획 설계, Split-Plot ANOVA)
\(s\)개 집단, 각 집단 \(h\)에 \(N_h\)명의 피험자, \(n\) 시점의 설계에서 모형은
\[ y_{hij} = \mu + \gamma_h + \tau_j + (\gamma\tau)_{hj} + \pi_{i(h)} + e_{hij}, \tag{2.20} \]
- \(\gamma_h\): 집단 \(h\)의 효과 ( \(\sum_h \gamma_h = 0\) )
- \(\tau_j\): 시점 \(j\)의 효과 ( \(\sum_j \tau_j = 0\) )
- \((\gamma\tau)_{hj}\): 집단 × 시간 교호작용 ( \(\sum_h\sum_j (\gamma\tau)_{hj} = 0\) )
- \(\pi_{i(h)}\): 집단 \(h\) 내 피험자 \(i\)의 개인차 성분 (nested)
- \(e_{hij}\): 오차
분포 가정은 \(\pi_{i(h)} \sim N(0, \sigma_\pi^2)\), \(e_{hij} \sim N(0, \sigma_e^2)\)이며, 공분산 구조는 단일 표본과 동일한 복합대칭 구조 (2.3)을 갖는다.
직관: 약물 그룹과 위약 그룹의 우울 점수를 4시점에 걸쳐 비교한다고 하자. 핵심 질문은 “두 집단의 시간에 따른 변화 곡선이 평행한가, 즉 집단×시간 교호작용이 있는가?”이다.
4.2 설계 구조
| 집단 | 피험자 | 시점 1 | 시점 2 | \(\cdots\) | 시점 \(n\) |
|---|---|---|---|---|---|
| 1 | 1 | \(y_{111}\) | \(y_{112}\) | \(\cdots\) | \(y_{11n}\) |
| 1 | 2 | \(y_{121}\) | \(y_{122}\) | \(\cdots\) | \(y_{12n}\) |
| \(\vdots\) | \(\vdots\) | ||||
| 1 | \(N_1\) | \(y_{1N_11}\) | \(y_{1N_12}\) | \(\cdots\) | \(y_{1N_1n}\) |
| \(\vdots\) | |||||
| \(s\) | 1 | \(y_{s11}\) | \(y_{s12}\) | \(\cdots\) | \(y_{s1n}\) |
| \(s\) | \(N_s\) | \(y_{sN_s1}\) | \(y_{sN_s2}\) | \(\cdots\) | \(y_{sN_sn}\) |
피험자는 집단에 nested되고, 시점과 교차(crossed)된다.
4.3 ANOVA 표
| 변동 원인 | \(df\) | \(MS\) | \(E(MS)\) |
|---|---|---|---|
| 집단(Group) | \(s-1\) | \(MS_G\) | \(\sigma_e^2 + n\sigma_\pi^2 + D_G\) |
| 시간(Time) | \(n-1\) | \(MS_T\) | \(\sigma_e^2 + D_T\) |
| 집단×시간 | \((s-1)(n-1)\) | \(MS_{GT}\) | \(\sigma_e^2 + D_{GT}\) |
| 집단 내 피험자 | \(N-s\) | \(MS_{S(G)}\) | \(\sigma_e^2 + n\sigma_\pi^2\) |
| 잔차 | \((N-s)(n-1)\) | \(MS_R\) | \(\sigma_e^2\) |
| 합계 | \(Nn-1\) |
평균 표기: \(\bar{y}_{...}\) = 전체 평균, \(\bar{y}_{h..}\) = 집단 \(h\) 평균, \(\bar{y}_{..j}\) = 시점 \(j\) 평균, \(\bar{y}_{hi.}\) = 집단 \(h\) 피험자 \(i\)의 평균, \(\bar{y}_{h.j}\) = 집단 \(h\)의 시점 \(j\) 평균.
주요 SS 공식:
\[ SS_G = n\sum_h N_h(\bar{y}_{h..} - \bar{y}_{...})^2, \quad SS_T = N\sum_j (\bar{y}_{..j} - \bar{y}_{...})^2, \]
\[ SS_{GT} = \sum_h\sum_j N_h(\bar{y}_{h.j} - \bar{y}_{h..} - \bar{y}_{..j} + \bar{y}_{...})^2, \]
\[ SS_{S(G)} = n\sum_h\sum_i (\bar{y}_{hi.} - \bar{y}_{h..})^2. \]
4.4 가설 검정 순서
4.4.1 1단계: 집단×시간 교호작용 (주요 관심사)
\[ H_{GT}: D_{GT} = 0, \quad F_{GT} = \frac{MS_{GT}}{MS_R} \sim F_{(s-1)(n-1),\,(N-s)(n-1)}. \tag{2.21} \]
- 교호작용이 유의하면: 집단 효과가 시간에 따라 달라지므로, 집단과 시간의 주효과를 독립적으로 해석할 수 없다.
- 교호작용이 유의하지 않으면: 두 집단의 시간 프로파일이 평행하므로, 주효과를 별도로 검정한다.
4.4.2 2단계 (교호작용 없을 때): 주효과 검정
\[ H_T: \tau_1 = \cdots = \tau_n = 0, \quad F_T = \frac{MS_T}{MS_R} \sim F_{n-1,\,(N-s)(n-1)}, \tag{2.22} \]
\[ H_G: \gamma_1 = \cdots = \gamma_s = 0, \quad F_G = \frac{MS_G}{MS_{S(G)}} \sim F_{s-1,\,N-s}. \tag{2.23} \]
집단 효과 \(F_G\)의 분모는 \(MS_R\)이 아니라 \(MS_{S(G)}\) (집단 내 피험자 MS)이다. 피험자가 집단에 nested되어 있으므로, 집단 간 비교의 기준 오차는 집단 내 피험자 변동이다.
4.4.3 피험자 효과 검정
\[ H_{S(G)}: \sigma_\pi^2 = 0, \quad F_{S(G)} = \frac{MS_{S(G)}}{MS_R} \sim F_{N-s,\,(N-s)(n-1)}. \tag{2.24} \]
ICC 추정은 동일하다:
\[ ICC = \widehat\sigma_\pi^2 / (\widehat\sigma_\pi^2 + \widehat\sigma_e^2). \tag{2.25} \]
여기서 “설명되지 않은” 변동은 집단·시간·교호작용 고정 효과로 설명되지 않은 변동을 의미한다. ICC가 0에 가까우면 전통적 고정효과 ANOVA로도 충분하나, 종단 데이터에서는 드문 경우다.
4.5 집단×시간 교호작용의 직교 다항식 분해
집단×시간 \(SS\)를 다항식 성분별로 분해하면:
| G×T 성분 | \(df\) | \(SS\) |
|---|---|---|
| 선형 | \(s-1\) | \(SS_{GT_1} = \sum_h N_h \mathbf{c}_1\bar{\mathbf{y}}_{h.}\bar{\mathbf{y}}_{h.}'\mathbf{c}_1' - SS_{T_1}\) |
| 이차 | \(s-1\) | \(SS_{GT_2} = \sum_h N_h \mathbf{c}_2\bar{\mathbf{y}}_{h.}\bar{\mathbf{y}}_{h.}'\mathbf{c}_2' - SS_{T_2}\) |
| \((n-1)\)차 | \(s-1\) | \(\cdots\) |
| 합계 | \((s-1)(n-1)\) | \(SS_{GT}\) |
\(\mathbf{c}_j\)는 \(j\)차 대비의 \(1 \times n\) 벡터, \(\bar{\mathbf{y}}_{h.}\)는 집단 \(h\)의 시점별 평균 벡터.
F-통계량: \(F_{GT_j} = SS_{GT_j}/(s-1) / MS_R\).
실무적 의미: “두 집단의 선형 변화 기울기가 다른가?”(선형 교호작용), “두 집단의 변화 가속도가 다른가?”(이차 교호작용)를 분리해서 검정한다.
5 복합대칭 가정과 구형성
5.1 복합대칭 (Compound Symmetry)
반복측정 벡터의 분산은 행렬 형태로
\[ V(\mathbf{y}_i) = \sigma_\pi^2 \mathbf{1}_n\mathbf{1}_n' + \sigma_e^2 I_n. \tag{2.27} \]
CS 조건: - \(V(y_{ij}) = \sigma_\pi^2 + \sigma_e^2\) (모든 시점에서 동일한 분산) - \(C(y_{ij}, y_{ij'}) = \sigma_\pi^2\) (모든 시점 쌍에서 동일한 공분산) (2.28) - \(\text{Corr}(y_{ij}, y_{ij'}) = \sigma_\pi^2/(\sigma_\pi^2 + \sigma_e^2) = \text{ICC}\) (모든 쌍에서 동일한 상관) (2.29)
CS는 구형성(sphericity)의 특수 경우다.
5.2 구형성 (Sphericity / Circularity)
CS보다 약한 조건. 모든 쌍별 차이의 분산이 일정하면 구형성이 성립한다:
\[ V(y_{ij} - y_{ij'}) = V(y_{ij}) + V(y_{ij'}) - 2C(y_{ij}, y_{ij'}) = \text{상수} \quad \forall j, j'. \]
동치 조건: 직교정규 다항식 행렬 \(C\)에 대해
\[ C V(\mathbf{y}_i) C' = \text{상수} \cdot I_{n-1}. \tag{2.30} \]
구형성이 성립하면 반복측정 ANOVA의 F-검정이 유효하다. 위반되면 F-검정이 과자유로적이다.
5.3 Mauchly 구형성 검정
Mauchly(1940)의 카이제곱 검정으로 구형성을 검정한다. - 소표본에서 검정력이 낮다. - 대표본에서는 경미한 위반도 유의하게 나온다. - 정규성 이탈이나 이상치에 민감하다.
실무 지침: 엄격한 규칙이 아닌 참고 지표로 사용한다.
5.4 구형성 위반 시 보정
| 보정 방법 | 내용 | 특성 |
|---|---|---|
| Greenhouse-Geisser \(\hat\epsilon_{GG}\) | \(df\)를 \(\hat\epsilon_{GG}\)로 축소 | 보수적 |
| Huynh-Feldt \(\hat\epsilon_{HF}\) | \(df\)를 \(\hat\epsilon_{HF}\)로 축소 | 덜 보수적 |
| MANOVA | 비구조적 공분산 허용 | 완전 데이터 필요 |
\(1/n \le \hat\epsilon \le 1\). \(\hat\epsilon = 1\)은 완전한 구형성, \(1/n\)은 최대 위반.
직관: \(\epsilon < 1\)이면 유효 자유도가 줄어들어 기각역이 커진다(더 보수적). 이는 CS 가정이 실제보다 낙관적으로 계산된 자유도를 사용했기 때문이다.
6 예제: Bock(1975) 어휘 성장 자료
6.1 자료 개요
Bock(1975)의 어휘 성장 자료는 시카고 대학교 연구학교의 64명 학생을 추적한 종단 자료다. 8학년~11학년(4시점)에 걸쳐 어휘력 검사(Cooperative Reading Test)를 반복 측정했다. 가설: 신체 성장이 감속하는 시기에 어휘력 증가도 감속할 것이다.
6.2 요약 통계
| 학년 | 평균 | SD | 상관(8학년) | 상관(9학년) | 상관(10학년) |
|---|---|---|---|---|---|
| 8학년 | 1.137 | 1.889 | 1.000 | ||
| 9학년 | 2.542 | 2.085 | .810 | 1.000 | |
| 10학년 | 2.988 | 2.169 | .868 | .785 | 1.000 |
| 11학년 | 3.472 | 1.925 | .785 | .757 | .811 |
분산과 공분산이 시간에 걸쳐 대체로 동질적이어서 CS 가정이 타당하다. Mauchly 검정: \(\chi^2(5) = 6.32\), 유의하지 않음 → 구형성 기각 불가.
6.3 반복측정 ANOVA 결과
| 변동 원인 | \(df\) | \(SS\) | \(MS\) | \(F\) | \(p\) |
|---|---|---|---|---|---|
| 피험자 | 63 | 873.60 | 13.87 | 16.91 | .0001 |
| 학년(시간) | 3 | 194.34 | 64.78 | 79.02 | .0001 |
| 잔차 | 189 | 154.94 | 0.82 | ||
| 합계 | 255 | 1222.88 |
분산 성분 추정:
\[ \widehat\sigma_e^2 = MS_R = \frac{154.94}{189} = 0.82, \]
\[ \widehat\sigma_\pi^2 = \frac{MS_S - MS_R}{n} = \frac{13.87 - 0.82}{4} = 3.26, \]
\[ ICC = \frac{3.26}{3.26 + 0.82} = .80. \]
해석: 학년 효과를 제거한 뒤 남은 어휘력 분산의 80%가 피험자 간 개인차로 설명된다. 어휘력이 높은 학생은 4년 내내 높은 점수를 유지하는 경향이 매우 강하다.
6.4 직교 다항식 분해
학년 효과를 선형·이차·삼차 성분으로 분해하기 위해 4시점 직교 다항식 행렬을 적용한다:
\[ C = \begin{bmatrix} -0.6708 & -0.2236 & 0.2236 & 0.6708 \\ 0.5 & -0.5 & -0.5 & 0.5 \\ -0.2236 & 0.6708 & -0.6708 & 0.2236 \end{bmatrix} \]
시점 평균 벡터 \(\bar{\mathbf{y}}_{.} = (1.14, 2.54, 2.99, 3.47)'\) 에 \(C\) 를 곱하면
\[ \text{Linear} = 1.67, \quad \text{Quadratic} = -0.46, \quad \text{Cubic} = 0.22. \]
| 학년 추세 성분 | \(df\) | \(SS\) | \(F\) | \(p <\) |
|---|---|---|---|---|
| 선형 | 1 | 177.58 | 216.63 | .0001 |
| 이차 | 1 | 13.58 | 16.56 | .0001 |
| 삼차 | 1 | 3.17 | 3.86 | .051 |
해석: - 선형 성분 (계수 = 1.67 > 0): 학년이 오를수록 어휘력이 증가한다 (고도로 유의). - 이차 성분 (계수 = −0.46 < 0): 증가 속도가 감속한다 (유의). 가설을 지지한다. - 삼차 성분 (계수 = 0.22, \(p\) = .051): 감속이 부분적으로 반전되나, 경계선상 유의성.
주도적 패턴은 강한 선형 증가 + 유의한 감속 이다. 삼차 항은 상대적으로 미미하여 실질적 중요성이 낮다.
7 반복측정 ANOVA의 한계와 현대적 대안
7.1 주요 한계
| 한계 | 내용 | 영향 |
|---|---|---|
| 구형성 가정 | CS가 성립하지 않으면 F-검정 왜곡 | 1종 오류 증가 |
| 완전 데이터 요구 | 결측 피험자 완전 제외 (completer analysis) | 편의 발생 가능 |
| 동일 시점 요구 | 피험자마다 다른 측정 시점 불허 | 불균형 설계 불가 |
| 시변 공변량 불가 | 시간에 따라 변하는 예측변수 처리 불가 | 동적 관계 모형화 불가 |
| 개인별 곡선 없음 | 집단 평균만 추정 | 개인 이질성 무시 |
7.2 현대적 대안과의 비교
| 방법 | CS 가정 | 결측 | 시변 공변량 | 개인별 곡선 |
|---|---|---|---|---|
| 반복측정 ANOVA | 필요 | 제외 | 불가 | 불가 |
| MANOVA | 불필요 | 제외 | 불가 | 불가 |
| LMM (Ch.4) | 불필요 | MAR까지 허용 | 가능 | 가능 |
| GEE (Ch.8) | 불필요 | MAR까지 허용 | 가능 | 집단 평균 |
| 공분산 패턴 모형 (Ch.6) | 다양한 구조 | 일부 허용 | 제한적 | 불가 |
반복측정 ANOVA는 현재 일상적 사용이 권장되지 않는다. 그러나 이 방법은 종단 데이터 분석의 기초 개념을 이해하는 데 필수적이다:
- 분산 분해: \(SS\)를 피험자·시간·잔차로 나누는 논리는 LMM의 랜덤 효과 분리와 동일하다.
- ICC의 직관: 피험자 간 분산과 오차 분산의 비율이라는 개념은 모든 혼합 모형에 적용된다.
- 대비 분석: 직교 다항식 대비는 혼합효과 다항식 회귀 모형(Ch.5)의 기초다.
- 교호작용 검정: 집단×시간 교호작용의 논리는 LMM에서도 동일하게 적용된다.
8 Python · R 코드
8.1 R: 단일 표본 반복측정 ANOVA
library(tidyverse)
library(rstatix)
# Bock(1975) 어휘 성장 자료 (가상 예시 — 실제 개인 데이터 필요)
# 데이터: 64명 × 4학년(8~11학년)
# long format
vocab_long <- data.frame(
subject = rep(1:64, times = 4),
grade = rep(c(8, 9, 10, 11), each = 64),
score = c(...) # 실제 값 입력
)
# 반복측정 ANOVA
res_aov <- anova_test(
data = vocab_long,
dv = score,
wid = subject,
within = grade
)
get_anova_table(res_aov) # GGe 보정 포함
# 구형성 검정
res_aov$`Mauchly's Test for Sphericity`
# 사후 대비: 직교 다항식
library(emmeans)
model_aov <- aov(score ~ grade + Error(subject/grade), data = vocab_long)
emm <- emmeans(model_aov, ~ grade)
contrast(emm, "poly") # 선형, 이차, 삼차 대비8.2 R: 다중 표본 반복측정 ANOVA (임상 데이터 예시)
# 두 집단(약물/위약) × 4시점
library(rstatix)
clinical_long <- data.frame(
subject = rep(1:N, times = n),
group = rep(c("drug", "placebo"), ...),
time = rep(1:n, each = N),
hamd = c(...) # Hamilton 우울 척도
)
# Split-plot ANOVA
res <- anova_test(
data = clinical_long,
dv = hamd,
wid = subject,
between = group,
within = time
)
get_anova_table(res)
# 집단×시간 교호작용 세부 분석
res %>% filter(Effect == "group:time")8.3 Python: 반복측정 ANOVA (pingouin)
import pandas as pd
import pingouin as pg
# 단일 표본 반복측정 ANOVA
aov = pg.rm_anova(
data=vocab_long,
dv='score',
within='grade',
subject='subject',
detailed=True,
correction=True # GG 보정 적용
)
print(aov)
# 다중 표본 반복측정 ANOVA
aov_mixed = pg.mixed_anova(
data=clinical_long,
dv='hamd',
within='time',
between='group',
subject='subject',
correction=True
)
print(aov_mixed)
# 구형성 검정
spher = pg.sphericity(
data=vocab_long,
dv='score',
within='grade',
subject='subject'
)
print(f"Mauchly W={spher.W:.4f}, p={spher.pval:.4f}")8.4 SAS: PROC GLM (분할구획 ANOVA)
/* 반복측정 ANOVA: SAS PROC GLM */
PROC GLM DATA=clinical_long;
CLASS group subject time;
MODEL hamd = group time group*time;
RANDOM subject(group) / TEST;
REPEATED time 4 (1 2 3 4) POLYNOMIAL / SUMMARY;
/* POLYNOMIAL: 직교 다항식 대비 요청 */
RUN;9 요약
반복측정 ANOVA는 종단 데이터 분석의 고전적 출발점이다. 단일 표본 임의블록 ANOVA와 다중 표본 분할구획 ANOVA의 구조적 차이를 이해하면, ICC의 직관, 대비 분석, 교호작용 검정의 논리가 LMM으로 자연스럽게 이어진다.
핵심 개념:
- 복합대칭: 분산과 공분산이 시간에 걸쳐 동일 → 반복측정 ANOVA의 기본 가정
- 구형성: CS의 일반화 → F-검정 유효성의 충분 조건
- 대비 분석: 전체 시간 효과를 5가지 방식(직교 다항식, 기준셀, 프로파일, Helmert, 이탈)으로 분해
- 집단×시간 교호작용: 다중 표본에서의 주요 관심 검정; 유의하면 주효과 해석 불가
- ICC: 피험자 간 분산의 비율; 높을수록 독립 가정 위반이 심각
한계: 구형성 가정, 완전 데이터 요구, 시변 공변량 불가, 개인별 곡선 정보 없음. 이 한계를 해결하는 현대적 방법이 LMM(Ch.4)과 GEE(Ch.8)이다 (Hedeker & Gibbons, 2006).