Kwangmin Kim - 반복측정 ANOVA의 종단 데이터 적용 (ANOVA Approaches to Longitudinal Data)

1 개요

종단 데이터의 고전적 분석법은 크게 두 가지다: 반복측정 ANOVA(univariate mixed-model, split-plot ANOVA)와 MANOVA. 두 방법 모두 구간 척도와 정규 오차를 가정하며, 집단 평균 비교에 초점을 맞춘다. 개인별 성장 곡선에 대한 정보는 제공하지 않는다.

특성	반복측정 ANOVA	MANOVA
공분산 가정	복합대칭(compound symmetry)	비구조적(unstructured)
결측치 처리	불균형 설계 부분 허용	완전 데이터만 가능
시점 조건	피험자 간 동일 시점	피험자 간 동일 시점
시변 공변량	불가	불가
개인별 곡선	정보 없음	정보 없음

왜 지금도 배우는가?

반복측정 ANOVA와 MANOVA는 현재 일상적 사용이 권장되지 않는다. 그러나 이 방법들은 혼합효과 모형(LMM)과 GEE가 어떤 문제를 해결하기 위해 등장했는지를 이해하는 개념적 발판이다 (Hedeker & Gibbons, 2006, Ch.2).

2 단일 표본 반복측정 ANOVA

2.1 모형 정의

피험자가 하나의 집단에 속하고 \(n\) 시점에 반복 측정되는 경우, 임의블록 ANOVA(randomized blocks ANOVA)를 사용한다.

\(N\) 명의 피험자( \(i = 1, \ldots, N\) )와 \(n\) 시점( \(j = 1, \ldots, n\) )에 대해 모형은

\[ y_{ij} = \mu + \pi_i + \tau_j + e_{ij} \tag{2.1} \]

\(\mu\): 전체 평균
\(\pi_i\): 피험자 \(i\)의 개인차 성분 (시간에 걸쳐 일정하다고 가정)
\(\tau_j\): 시점 \(j\)의 효과 (모든 피험자에게 동일하다고 가정)
\(e_{ij}\): 오차

확률 성분의 분포 가정은

\[ \pi_i \sim N(0, \sigma_\pi^2), \quad e_{ij} \sim N(0, \sigma_e^2). \]

\(\sigma_\pi^2\)는 피험자 간(between-subjects) 분산, \(\sigma_e^2\)는 피험자 내(within-subjects) 분산이다. 이 모형은 피험자( \(\pi_i\) )는 랜덤 효과, 시간( \(\tau_j\) )은 고정 효과를 갖는 혼합 모형이다.

직관: 같은 사람이 4학년과 5학년에 모두 시험을 보면, 그 점수는 독립이 아니다. 영리한 학생은 두 시점 모두 높은 점수를 받는다. 이 체계적 개인차를 \(\pi_i\) 가 포착한다.

2.2 모형 가정과 공분산 구조

모형 가정을 정리하면

\[ \sum_{j=1}^n \tau_j = 0, \quad E(y_{ij}) = \mu + \tau_j, \]

\[ V(y_{ij}) = \sigma_\pi^2 + \sigma_e^2, \quad C(y_{ij}, y_{i'j}) = 0 \; (i \neq i'), \]

\[ C(y_{ij}, y_{ij'}) = \sigma_\pi^2 \; (j \neq j'). \]

같은 피험자의 두 시점 간 상관(급내상관계수, ICC)은

\[ \text{Corr}(y_{ij}, y_{ij'}) = \frac{\sigma_\pi^2}{\sigma_\pi^2 + \sigma_e^2}. \tag{2.2} \]

이 상관은 모든 시점 쌍에서 동일하다. 이로부터 반복측정 벡터의 분산-공분산 행렬은 복합대칭(compound symmetry, CS) 구조를 갖는다:

\[ V(\mathbf{y}_i) = \begin{bmatrix} \sigma_\pi^2 + \sigma_e^2 & \sigma_\pi^2 & \cdots & \sigma_\pi^2 \\ \sigma_\pi^2 & \sigma_\pi^2 + \sigma_e^2 & \cdots & \sigma_\pi^2 \\ \vdots & & \ddots & \vdots \\ \sigma_\pi^2 & \sigma_\pi^2 & \cdots & \sigma_\pi^2 + \sigma_e^2 \end{bmatrix}. \tag{2.3} \]

CS 가정의 비현실성

복합대칭은 두 가지 비현실적 함의를 갖는다.

분산이 시간에 따라 일정: 실제로는 처치 반응 여부에 따라 연구 후반부에 분산이 커진다.
공분산이 시점 간격과 무관: 실제로는 가까운 시점 간 상관이 먼 시점 간 상관보다 크다.

CS가 성립하지 않으면 F-검정이 과자유로적(too liberal)이 되어 1종 오류가 증가한다.

2.3 설계 구조

피험자와 시점의 완전 교차(crossed) 설계:

피험자	시점 1	시점 2	\(\cdots\)	시점 \(n\)
1	\(y_{11}\)	\(y_{12}\)	\(\cdots\)	\(y_{1n}\)
2	\(y_{21}\)	\(y_{22}\)	\(\cdots\)	\(y_{2n}\)
\(\vdots\)
\(N\)	\(y_{N1}\)	\(y_{N2}\)	\(\cdots\)	\(y_{Nn}\)

셀당 관측치가 1개이다. \(n = 2\)인 경우 이 설계와 분석은 대응 \(t\)-검정과 동일하다.

2.4 ANOVA 표

균형 설계( \(N\) 명, \(n\) 시점, 결측 없음)에서 ANOVA 표는 다음과 같다.

변동 원인	\(df\)	\(SS\)	\(MS\)	\(E(MS)\)
피험자	\(N-1\)	\(SS_S = n\sum_{i}(\bar{y}_{i.} - \bar{y}_{..})^2\)	\(MS_S\)	\(\sigma_e^2 + n\sigma_\pi^2\)
시간	\(n-1\)	\(SS_T = N\sum_{j}(\bar{y}_{.j} - \bar{y}_{..})^2\)	\(MS_T\)	\(\sigma_e^2 + \frac{N\sum(\tau_j - \bar\tau)^2}{n-1}\)
잔차	\((N-1)(n-1)\)	\(SS_R = \sum_{ij}(y_{ij} - \bar{y}_{i.} - \bar{y}_{.j} + \bar{y}_{..})^2\)	\(MS_R\)	\(\sigma_e^2\)
합계	\(Nn-1\)	\(SS_y = \sum_{ij}(y_{ij} - \bar{y}_{..})^2\)

\(\bar{y}_{..}\): 전체 평균, \(\bar{y}_{i.}\): 피험자 \(i\)의 평균, \(\bar{y}_{.j}\): 시점 \(j\)의 평균

2.5 가설 검정과 ICC 추정

시간 효과와 피험자 효과에 대한 F-검정은

\[ H_T: \tau_1 = \cdots = \tau_n = 0, \quad F_T = \frac{MS_T}{MS_R} \sim F_{n-1,\,(N-1)(n-1)}. \tag{2.4} \]

\[ H_S: \sigma_\pi^2 = 0, \quad F_S = \frac{MS_S}{MS_R} \sim F_{N-1,\,(N-1)(n-1)}. \]

분석의 주요 관심은 시간 효과( \(H_T\) ) 이다. 피험자 효과는 거의 항상 유의하다고 가정한다.

급내상관계수(ICC)는

\[ \widehat{ICC} = \frac{\widehat{\sigma}_\pi^2}{\widehat{\sigma}_\pi^2 + \widehat{\sigma}_e^2}, \tag{2.5} \]

분산 성분 추정치는

\[ \widehat{\sigma}_\pi^2 = \frac{MS_S - MS_R}{n}, \quad \widehat{\sigma}_e^2 = MS_R. \tag{2.6, 2.7} \]

\(MS_S \le MS_R\) 이면 \(\widehat\sigma_\pi^2 = 0\) 으로 처리한다.

직관: ICC는 \(R^2\)처럼 피험자가 설명하는 분산 비율을 나타낸다. 시간 효과를 제거한 뒤 남은 변동 중 피험자 간 개인차가 차지하는 몫이다. ICC가 높을수록 반복측정 간 상관이 강하고, 독립 관측 가정은 더 심각하게 위반된다.

3 시간 효과 분해: 대비 분석

3.1 대비의 일반 정의

시간의 전체 검정 \(H_T: \tau_1 = \cdots = \tau_n = 0\)은 매우 포괄적이다. 구체적인 시점 비교를 위해 \(n-1\)개의 대비(contrast) \(L_{j'}\) 를 구성한다.

\[ L_{j'} = \sum_{j=1}^n c_{j'j}\,\bar{y}_{.j}, \quad j' = 1, \ldots, n-1, \tag{2.10} \]

대비 계수의 합 조건: \(\sum_j c_{j'j} = 0\).

각 대비의 평균제곱과 검정통계량은

\[ MS_{j'} = \frac{N L_{j'}^2}{\sum_j c_{j'j}^2}, \tag{2.12} \]

\[ F_{j'} = \frac{MS_{j'}}{MS_R} \sim F_{1,\,(N-1)(n-1)}, \quad t_{j'} = \frac{L_{j'}}{\sqrt{MS_R \cdot \sum_j c_{j'j}^2 / N}} \sim t_{(N-1)(n-1)}. \]

직교 대비 집합을 사용하면 \(SS_T = \sum_{j'} SS_{j'}\) 로 시간 변동이 독립적으로 분해된다.

3.2 대비 유형 1: 직교 다항식 대비 (Trend Analysis)

\(n = 4\) 시점의 경우 직교 다항식 대비 행렬( \(\div\sqrt{4/20}\) 정규화 후):

\[ C = \begin{bmatrix} -3 & -1 & 1 & 3 \\ 1 & -1 & -1 & 1 \\ -1 & 3 & -3 & 1 \end{bmatrix} \div \sqrt{\tfrac{4}{20}} \tag{2.14} \]

각 행은 선형(linear), 이차(quadratic), 삼차(cubic) 추세를 추출한다.

언제 사용하는가: 시간에 따른 변화 형태(선형인가, 감속하는가, S자인가)를 파악할 때. 직교 다항식은 서로 독립이므로 \(SS_T\)의 독립 분해를 제공한다.

직관: 어휘력이 8학년 → 11학년 증가할 때, 증가 속도가 느려지는지(이차 음의 추세)를 선형 추세와 분리해서 검정할 수 있다.

3.3 대비 유형 2: 기준셀 대비 (Reference Cell / Simple Contrasts)

첫 번째 시점(기저선, baseline)을 기준으로 각 시점과의 차이를 검정한다.

\[ C = \begin{bmatrix} -1 & 1 & 0 & 0 \\ -1 & 0 & 1 & 0 \\ -1 & 0 & 0 & 1 \end{bmatrix} \tag{2.15} \]

→ T2-T1, T3-T1, T4-T1 비교. 직교하지 않는다.

언제 사용하는가: “처치 전과 비교해서 각 시점에 변화가 있었는가?”를 확인할 때. 임상시험에서 기저선 대비 각 추적 시점의 개선 여부를 보는 전형적 상황이다.

3.4 대비 유형 3: 프로파일 대비 (Profile Contrasts)

인접 시점 간 차이를 순차적으로 검정한다.

\[ C = \begin{bmatrix} -1 & 1 & 0 & 0 \\ 0 & -1 & 1 & 0 \\ 0 & 0 & -1 & 1 \end{bmatrix} \tag{2.16} \]

→ T2-T1, T3-T2, T4-T3 비교. 직교하지 않는다.

언제 사용하는가: 변화가 언제 시작되고 끝나는지 식별할 때. 예를 들어, 약물 효과가 2주째부터 3주째에 가장 크게 나타나는지 확인한다.

3.5 대비 유형 4: Helmert 대비

각 시점을 이후 시점들의 평균과 비교한다.

\[ C = \begin{bmatrix} 1 & -1/3 & -1/3 & -1/3 \\ 0 & 1 & -1/2 & -1/2 \\ 0 & 0 & 1 & -1 \end{bmatrix} \tag{2.17} \]

→ T1 vs 평균(T2,T3,T4); T2 vs 평균(T3,T4); T3 vs T4. 직교한다.

역방향(각 시점을 이전 시점들의 평균과 비교):

\[ C = \begin{bmatrix} -1 & 1 & 0 & 0 \\ -1/2 & -1/2 & 1 & 0 \\ -1/3 & -1/3 & -1/3 & 1 \end{bmatrix} \tag{2.18} \]

언제 사용하는가: 순서 있는 비교가 의미 있을 때. “이 단계가 이전 단계들 전체의 평균보다 높은가?”

3.6 대비 유형 5: 이탈 대비 (Deviation Contrasts)

각 시점을 나머지 모든 시점의 평균과 비교한다.

\[ C = \begin{bmatrix} 1 & -1/3 & -1/3 & -1/3 \\ -1/3 & 1 & -1/3 & -1/3 \\ -1/3 & -1/3 & 1 & -1/3 \end{bmatrix} \tag{2.19} \]

직교하지 않는다. 시간에 대한 “막연한 사전 지식”만 있을 때 유용하다.

3.7 다중비교 조정

\(n-1\)개 대비를 동시에 검정할 때 실험 단위의 1종 오류율이 증가한다.

Bonferroni 보정: \(\alpha^* = \alpha/(n-1)\). 가장 보수적.
Fisher 보호 검정: 전체 \(H_T\)가 유의할 때만 개별 대비를 검정. 적당히 보수적.
- 직교 다항식의 경우: 최고차 다항식부터 역방향으로 검정하여 처음 유의한 차수에서 멈춘다.
조정 없는 접근: 일부 통계학자는 사전 지정된 소수의 대비에 대해 조정이 불필요하다고 주장한다 (Cook & Farewell, 1996).

권장: 대비를 사전에 지정하고, Fisher 보호 검정을 기본으로 사용한다.

4 다중 표본 반복측정 ANOVA

4.1 모형 정의 (분할구획 설계, Split-Plot ANOVA)

\(s\)개 집단, 각 집단 \(h\)에 \(N_h\)명의 피험자, \(n\) 시점의 설계에서 모형은

\[ y_{hij} = \mu + \gamma_h + \tau_j + (\gamma\tau)_{hj} + \pi_{i(h)} + e_{hij}, \tag{2.20} \]

\(\gamma_h\): 집단 \(h\)의 효과 ( \(\sum_h \gamma_h = 0\) )
\(\tau_j\): 시점 \(j\)의 효과 ( \(\sum_j \tau_j = 0\) )
\((\gamma\tau)_{hj}\): 집단 × 시간 교호작용 ( \(\sum_h\sum_j (\gamma\tau)_{hj} = 0\) )
\(\pi_{i(h)}\): 집단 \(h\) 내 피험자 \(i\)의 개인차 성분 (nested)
\(e_{hij}\): 오차

분포 가정은 \(\pi_{i(h)} \sim N(0, \sigma_\pi^2)\), \(e_{hij} \sim N(0, \sigma_e^2)\)이며, 공분산 구조는 단일 표본과 동일한 복합대칭 구조 (2.3)을 갖는다.

직관: 약물 그룹과 위약 그룹의 우울 점수를 4시점에 걸쳐 비교한다고 하자. 핵심 질문은 “두 집단의 시간에 따른 변화 곡선이 평행한가, 즉 집단×시간 교호작용이 있는가?”이다.

4.2 설계 구조

집단	피험자	시점 1	시점 2	\(\cdots\)	시점 \(n\)
1	1	\(y_{111}\)	\(y_{112}\)	\(\cdots\)	\(y_{11n}\)
1	2	\(y_{121}\)	\(y_{122}\)	\(\cdots\)	\(y_{12n}\)
\(\vdots\)	\(\vdots\)
1	\(N_1\)	\(y_{1N_11}\)	\(y_{1N_12}\)	\(\cdots\)	\(y_{1N_1n}\)
\(\vdots\)
\(s\)	1	\(y_{s11}\)	\(y_{s12}\)	\(\cdots\)	\(y_{s1n}\)
\(s\)	\(N_s\)	\(y_{sN_s1}\)	\(y_{sN_s2}\)	\(\cdots\)	\(y_{sN_sn}\)

피험자는 집단에 nested되고, 시점과 교차(crossed)된다.

4.3 ANOVA 표

변동 원인	\(df\)	\(MS\)	\(E(MS)\)
집단(Group)	\(s-1\)	\(MS_G\)	\(\sigma_e^2 + n\sigma_\pi^2 + D_G\)
시간(Time)	\(n-1\)	\(MS_T\)	\(\sigma_e^2 + D_T\)
집단×시간	\((s-1)(n-1)\)	\(MS_{GT}\)	\(\sigma_e^2 + D_{GT}\)
집단 내 피험자	\(N-s\)	\(MS_{S(G)}\)	\(\sigma_e^2 + n\sigma_\pi^2\)
잔차	\((N-s)(n-1)\)	\(MS_R\)	\(\sigma_e^2\)
합계	\(Nn-1\)

평균 표기: \(\bar{y}_{...}\) = 전체 평균, \(\bar{y}_{h..}\) = 집단 \(h\) 평균, \(\bar{y}_{..j}\) = 시점 \(j\) 평균, \(\bar{y}_{hi.}\) = 집단 \(h\) 피험자 \(i\)의 평균, \(\bar{y}_{h.j}\) = 집단 \(h\)의 시점 \(j\) 평균.

주요 SS 공식:

\[ SS_G = n\sum_h N_h(\bar{y}_{h..} - \bar{y}_{...})^2, \quad SS_T = N\sum_j (\bar{y}_{..j} - \bar{y}_{...})^2, \]

\[ SS_{GT} = \sum_h\sum_j N_h(\bar{y}_{h.j} - \bar{y}_{h..} - \bar{y}_{..j} + \bar{y}_{...})^2, \]

\[ SS_{S(G)} = n\sum_h\sum_i (\bar{y}_{hi.} - \bar{y}_{h..})^2. \]

4.4 가설 검정 순서

4.4.1 1단계: 집단×시간 교호작용 (주요 관심사)

\[ H_{GT}: D_{GT} = 0, \quad F_{GT} = \frac{MS_{GT}}{MS_R} \sim F_{(s-1)(n-1),\,(N-s)(n-1)}. \tag{2.21} \]

교호작용이 유의하면: 집단 효과가 시간에 따라 달라지므로, 집단과 시간의 주효과를 독립적으로 해석할 수 없다.
교호작용이 유의하지 않으면: 두 집단의 시간 프로파일이 평행하므로, 주효과를 별도로 검정한다.

4.4.2 2단계 (교호작용 없을 때): 주효과 검정

\[ H_T: \tau_1 = \cdots = \tau_n = 0, \quad F_T = \frac{MS_T}{MS_R} \sim F_{n-1,\,(N-s)(n-1)}, \tag{2.22} \]

\[ H_G: \gamma_1 = \cdots = \gamma_s = 0, \quad F_G = \frac{MS_G}{MS_{S(G)}} \sim F_{s-1,\,N-s}. \tag{2.23} \]

집단 효과의 올바른 분모

집단 효과 \(F_G\)의 분모는 \(MS_R\)이 아니라 \(MS_{S(G)}\) (집단 내 피험자 MS)이다. 피험자가 집단에 nested되어 있으므로, 집단 간 비교의 기준 오차는 집단 내 피험자 변동이다.

4.4.3 피험자 효과 검정

\[ H_{S(G)}: \sigma_\pi^2 = 0, \quad F_{S(G)} = \frac{MS_{S(G)}}{MS_R} \sim F_{N-s,\,(N-s)(n-1)}. \tag{2.24} \]

ICC 추정은 동일하다:

\[ ICC = \widehat\sigma_\pi^2 / (\widehat\sigma_\pi^2 + \widehat\sigma_e^2). \tag{2.25} \]

여기서 “설명되지 않은” 변동은 집단·시간·교호작용 고정 효과로 설명되지 않은 변동을 의미한다. ICC가 0에 가까우면 전통적 고정효과 ANOVA로도 충분하나, 종단 데이터에서는 드문 경우다.

4.5 집단×시간 교호작용의 직교 다항식 분해

집단×시간 \(SS\)를 다항식 성분별로 분해하면:

G×T 성분	\(df\)	\(SS\)
선형	\(s-1\)	\(SS_{GT_1} = \sum_h N_h \mathbf{c}_1\bar{\mathbf{y}}_{h.}\bar{\mathbf{y}}_{h.}'\mathbf{c}_1' - SS_{T_1}\)
이차	\(s-1\)	\(SS_{GT_2} = \sum_h N_h \mathbf{c}_2\bar{\mathbf{y}}_{h.}\bar{\mathbf{y}}_{h.}'\mathbf{c}_2' - SS_{T_2}\)
\((n-1)\)차	\(s-1\)	\(\cdots\)
합계	\((s-1)(n-1)\)	\(SS_{GT}\)

\(\mathbf{c}_j\)는 \(j\)차 대비의 \(1 \times n\) 벡터, \(\bar{\mathbf{y}}_{h.}\)는 집단 \(h\)의 시점별 평균 벡터.

F-통계량: \(F_{GT_j} = SS_{GT_j}/(s-1) / MS_R\).

실무적 의미: “두 집단의 선형 변화 기울기가 다른가?”(선형 교호작용), “두 집단의 변화 가속도가 다른가?”(이차 교호작용)를 분리해서 검정한다.

5 복합대칭 가정과 구형성

5.1 복합대칭 (Compound Symmetry)

반복측정 벡터의 분산은 행렬 형태로

\[ V(\mathbf{y}_i) = \sigma_\pi^2 \mathbf{1}_n\mathbf{1}_n' + \sigma_e^2 I_n. \tag{2.27} \]

CS 조건: - \(V(y_{ij}) = \sigma_\pi^2 + \sigma_e^2\) (모든 시점에서 동일한 분산) - \(C(y_{ij}, y_{ij'}) = \sigma_\pi^2\) (모든 시점 쌍에서 동일한 공분산) (2.28) - \(\text{Corr}(y_{ij}, y_{ij'}) = \sigma_\pi^2/(\sigma_\pi^2 + \sigma_e^2) = \text{ICC}\) (모든 쌍에서 동일한 상관) (2.29)

CS는 구형성(sphericity)의 특수 경우다.

5.2 구형성 (Sphericity / Circularity)

CS보다 약한 조건. 모든 쌍별 차이의 분산이 일정하면 구형성이 성립한다:

\[ V(y_{ij} - y_{ij'}) = V(y_{ij}) + V(y_{ij'}) - 2C(y_{ij}, y_{ij'}) = \text{상수} \quad \forall j, j'. \]

동치 조건: 직교정규 다항식 행렬 \(C\)에 대해

\[ C V(\mathbf{y}_i) C' = \text{상수} \cdot I_{n-1}. \tag{2.30} \]

구형성이 성립하면 반복측정 ANOVA의 F-검정이 유효하다. 위반되면 F-검정이 과자유로적이다.

5.3 Mauchly 구형성 검정

Mauchly(1940)의 카이제곱 검정으로 구형성을 검정한다. - 소표본에서 검정력이 낮다. - 대표본에서는 경미한 위반도 유의하게 나온다. - 정규성 이탈이나 이상치에 민감하다.

실무 지침: 엄격한 규칙이 아닌 참고 지표로 사용한다.

5.4 구형성 위반 시 보정

보정 방법	내용	특성
Greenhouse-Geisser \(\hat\epsilon_{GG}\)	\(df\)를 \(\hat\epsilon_{GG}\)로 축소	보수적
Huynh-Feldt \(\hat\epsilon_{HF}\)	\(df\)를 \(\hat\epsilon_{HF}\)로 축소	덜 보수적
MANOVA	비구조적 공분산 허용	완전 데이터 필요

\(1/n \le \hat\epsilon \le 1\). \(\hat\epsilon = 1\)은 완전한 구형성, \(1/n\)은 최대 위반.

직관: \(\epsilon < 1\)이면 유효 자유도가 줄어들어 기각역이 커진다(더 보수적). 이는 CS 가정이 실제보다 낙관적으로 계산된 자유도를 사용했기 때문이다.

6 예제: Bock(1975) 어휘 성장 자료

6.1 자료 개요

Bock(1975)의 어휘 성장 자료는 시카고 대학교 연구학교의 64명 학생을 추적한 종단 자료다. 8학년~11학년(4시점)에 걸쳐 어휘력 검사(Cooperative Reading Test)를 반복 측정했다. 가설: 신체 성장이 감속하는 시기에 어휘력 증가도 감속할 것이다.

6.2 요약 통계

학년	평균	SD	상관(8학년)	상관(9학년)	상관(10학년)
8학년	1.137	1.889	1.000
9학년	2.542	2.085	.810	1.000
10학년	2.988	2.169	.868	.785	1.000
11학년	3.472	1.925	.785	.757	.811

분산과 공분산이 시간에 걸쳐 대체로 동질적이어서 CS 가정이 타당하다. Mauchly 검정: \(\chi^2(5) = 6.32\), 유의하지 않음 → 구형성 기각 불가.

6.3 반복측정 ANOVA 결과

변동 원인	\(df\)	\(SS\)	\(MS\)	\(F\)	\(p\)
피험자	63	873.60	13.87	16.91	.0001
학년(시간)	3	194.34	64.78	79.02	.0001
잔차	189	154.94	0.82
합계	255	1222.88

분산 성분 추정:

\[ \widehat\sigma_e^2 = MS_R = \frac{154.94}{189} = 0.82, \]

\[ \widehat\sigma_\pi^2 = \frac{MS_S - MS_R}{n} = \frac{13.87 - 0.82}{4} = 3.26, \]

\[ ICC = \frac{3.26}{3.26 + 0.82} = .80. \]

해석: 학년 효과를 제거한 뒤 남은 어휘력 분산의 80%가 피험자 간 개인차로 설명된다. 어휘력이 높은 학생은 4년 내내 높은 점수를 유지하는 경향이 매우 강하다.

6.4 직교 다항식 분해

학년 효과를 선형·이차·삼차 성분으로 분해하기 위해 4시점 직교 다항식 행렬을 적용한다:

\[ C = \begin{bmatrix} -0.6708 & -0.2236 & 0.2236 & 0.6708 \\ 0.5 & -0.5 & -0.5 & 0.5 \\ -0.2236 & 0.6708 & -0.6708 & 0.2236 \end{bmatrix} \]

시점 평균 벡터 \(\bar{\mathbf{y}}_{.} = (1.14, 2.54, 2.99, 3.47)'\) 에 \(C\) 를 곱하면

\[ \text{Linear} = 1.67, \quad \text{Quadratic} = -0.46, \quad \text{Cubic} = 0.22. \]

학년 추세 성분	\(df\)	\(SS\)	\(F\)	\(p <\)
선형	1	177.58	216.63	.0001
이차	1	13.58	16.56	.0001
삼차	1	3.17	3.86	.051

해석: - 선형 성분 (계수 = 1.67 > 0): 학년이 오를수록 어휘력이 증가한다 (고도로 유의). - 이차 성분 (계수 = −0.46 < 0): 증가 속도가 감속한다 (유의). 가설을 지지한다. - 삼차 성분 (계수 = 0.22, \(p\) = .051): 감속이 부분적으로 반전되나, 경계선상 유의성.

주도적 패턴은 강한 선형 증가 + 유의한 감속 이다. 삼차 항은 상대적으로 미미하여 실질적 중요성이 낮다.

7 반복측정 ANOVA의 한계와 현대적 대안

7.1 주요 한계

한계	내용	영향
구형성 가정	CS가 성립하지 않으면 F-검정 왜곡	1종 오류 증가
완전 데이터 요구	결측 피험자 완전 제외 (completer analysis)	편의 발생 가능
동일 시점 요구	피험자마다 다른 측정 시점 불허	불균형 설계 불가
시변 공변량 불가	시간에 따라 변하는 예측변수 처리 불가	동적 관계 모형화 불가
개인별 곡선 없음	집단 평균만 추정	개인 이질성 무시

7.2 현대적 대안과의 비교

방법	CS 가정	결측	시변 공변량	개인별 곡선
반복측정 ANOVA	필요	제외	불가	불가
MANOVA	불필요	제외	불가	불가
LMM (Ch.4)	불필요	MAR까지 허용	가능	가능
GEE (Ch.8)	불필요	MAR까지 허용	가능	집단 평균
공분산 패턴 모형 (Ch.6)	다양한 구조	일부 허용	제한적	불가

반복측정 ANOVA의 위치

반복측정 ANOVA는 현재 일상적 사용이 권장되지 않는다. 그러나 이 방법은 종단 데이터 분석의 기초 개념을 이해하는 데 필수적이다:

분산 분해: \(SS\)를 피험자·시간·잔차로 나누는 논리는 LMM의 랜덤 효과 분리와 동일하다.
ICC의 직관: 피험자 간 분산과 오차 분산의 비율이라는 개념은 모든 혼합 모형에 적용된다.
대비 분석: 직교 다항식 대비는 혼합효과 다항식 회귀 모형(Ch.5)의 기초다.
교호작용 검정: 집단×시간 교호작용의 논리는 LMM에서도 동일하게 적용된다.

8 Python · R 코드

8.1 R: 단일 표본 반복측정 ANOVA

library(tidyverse)
library(rstatix)

# Bock(1975) 어휘 성장 자료 (가상 예시 — 실제 개인 데이터 필요)
# 데이터: 64명 × 4학년(8~11학년)
# long format
vocab_long <- data.frame(
  subject = rep(1:64, times = 4),
  grade   = rep(c(8, 9, 10, 11), each = 64),
  score   = c(...)  # 실제 값 입력
)

# 반복측정 ANOVA
res_aov <- anova_test(
  data = vocab_long,
  dv = score,
  wid = subject,
  within = grade
)
get_anova_table(res_aov)  # GGe 보정 포함

# 구형성 검정
res_aov$`Mauchly's Test for Sphericity`

# 사후 대비: 직교 다항식
library(emmeans)
model_aov <- aov(score ~ grade + Error(subject/grade), data = vocab_long)
emm <- emmeans(model_aov, ~ grade)
contrast(emm, "poly")  # 선형, 이차, 삼차 대비

8.2 R: 다중 표본 반복측정 ANOVA (임상 데이터 예시)

# 두 집단(약물/위약) × 4시점
library(rstatix)

clinical_long <- data.frame(
  subject = rep(1:N, times = n),
  group   = rep(c("drug", "placebo"), ...),
  time    = rep(1:n, each = N),
  hamd    = c(...)  # Hamilton 우울 척도
)

# Split-plot ANOVA
res <- anova_test(
  data = clinical_long,
  dv = hamd,
  wid = subject,
  between = group,
  within = time
)
get_anova_table(res)

# 집단×시간 교호작용 세부 분석
res %>% filter(Effect == "group:time")

8.3 Python: 반복측정 ANOVA (pingouin)

import pandas as pd
import pingouin as pg

# 단일 표본 반복측정 ANOVA
aov = pg.rm_anova(
    data=vocab_long,
    dv='score',
    within='grade',
    subject='subject',
    detailed=True,
    correction=True   # GG 보정 적용
)
print(aov)

# 다중 표본 반복측정 ANOVA
aov_mixed = pg.mixed_anova(
    data=clinical_long,
    dv='hamd',
    within='time',
    between='group',
    subject='subject',
    correction=True
)
print(aov_mixed)

# 구형성 검정
spher = pg.sphericity(
    data=vocab_long,
    dv='score',
    within='grade',
    subject='subject'
)
print(f"Mauchly W={spher.W:.4f}, p={spher.pval:.4f}")

8.4 SAS: PROC GLM (분할구획 ANOVA)

/* 반복측정 ANOVA: SAS PROC GLM */
PROC GLM DATA=clinical_long;
  CLASS group subject time;
  MODEL hamd = group time group*time;
  RANDOM subject(group) / TEST;
  REPEATED time 4 (1 2 3 4) POLYNOMIAL / SUMMARY;
  /* POLYNOMIAL: 직교 다항식 대비 요청 */
RUN;

9 요약

반복측정 ANOVA는 종단 데이터 분석의 고전적 출발점이다. 단일 표본 임의블록 ANOVA와 다중 표본 분할구획 ANOVA의 구조적 차이를 이해하면, ICC의 직관, 대비 분석, 교호작용 검정의 논리가 LMM으로 자연스럽게 이어진다.

핵심 개념:

복합대칭: 분산과 공분산이 시간에 걸쳐 동일 → 반복측정 ANOVA의 기본 가정
구형성: CS의 일반화 → F-검정 유효성의 충분 조건
대비 분석: 전체 시간 효과를 5가지 방식(직교 다항식, 기준셀, 프로파일, Helmert, 이탈)으로 분해
집단×시간 교호작용: 다중 표본에서의 주요 관심 검정; 유의하면 주효과 해석 불가
ICC: 피험자 간 분산의 비율; 높을수록 독립 가정 위반이 심각

한계: 구형성 가정, 완전 데이터 요구, 시변 공변량 불가, 개인별 곡선 정보 없음. 이 한계를 해결하는 현대적 방법이 LMM(Ch.4)과 GEE(Ch.8)이다 (Hedeker & Gibbons, 2006).