1 12.3 의 자리 — 일치성에서 점근 분포로
12.1~12.2 절은 평균제곱 일치성 (Theorem 12.1.1, 12.1.4, 12.2.1) 을 보였다:
\[ \mathbb{E}\|\hat\mu - \mu\|^2,\ \mathbb{E}\|\hat C - C\|_S^2,\ \mathbb{E}\|\hat v_j - v_j\|^2,\ \mathbb{E}|\hat\lambda_j - \lambda_j|^2 = O(N^{-1}). \]
이로부터 Chebyshev 부등식으로 확률 수렴 (consistency in probability) 이 따라온다. 그러나 유의성 검정 (significance test) 을 만들려면 점근 분포가 필요하다 — “추정량이 모수에 가깝다” 는 정성적 진술로는 임계값 (critical value) 을 계산할 수 없다.
12.3 의 핵심 메시지: 가정 12.0.1 하에서 위 모든 추정량이 점근적으로 정규 (asymptotically normal) 이다. 이는 12.1~12.2 의 평균제곱 일치성보다 일반적으로 더 강한 결과지만 (분포 수렴이 모멘트 수렴을 함의하지 않으므로), 12.1~12.2 의 모멘트 경계는 여전히 가치가 있다.
이 절부터는 좀 더 일반적으로 분리 가능 실 Hilbert 공간 \(\mathcal{H}\) 에서의 결과로 서술한다. \(L^2\) 는 그 특수 경우.
- Theorem 12.3.1 — 표본 평균과 공분산 연산자의 점근 정규성 (함수 CLT 직접 적용).
- Theorem 12.3.2 — EFPC 와 고유값의 점근 전개 (\(Z_N = \sqrt N (\hat C - C)\) 의 사영으로 표현).
EFPC 의 점근 분포는 공분산 연산자의 점근 분포에서 항상 유도된다 — 고유분해의 섭동 이론 (perturbation theory) 이 둘을 잇는다.
2 Theorem 12.3.1 — 표본 평균과 공분산의 점근 정규성
\(X_1, \dots, X_N\) 이 \(\mathcal{H}\) 에서 iid 이고 \(\mathbb{E}\|X_n\|^2 < \infty\) 일 때:
\[ \sqrt N (\hat\mu - \mu) \;\overset{d}{\to}\; \mathcal{N}(0, C) \quad \text{in } \mathcal{H}. \]
추가로 \(\mathbb{E}\|X\|^4 < \infty\) 이면:
\[ \sqrt N (\hat C - C) \;\overset{d}{\to}\; \mathcal{N}(0, \Gamma) \quad \text{in } \mathcal{S} \]
여기서
\[ \Gamma = \mathbb{E}\big[((X_1-\mu) \otimes (X_1-\mu) - C) \otimes ((X_1-\mu) \otimes (X_1-\mu) - C)\big] \in \mathcal{S} \otimes \mathcal{S}. \]
증명 핵심 — 평균 부분: Hilbert 공간 CLT (Theorem 11.3.2) 의 직접 적용. iid 함수 \(X_n - \mu\) 에 함수 CLT 를 적용하면 \(\sqrt N (\hat\mu - \mu) \Rightarrow \mathcal{N}(0, C)\) 가 곧바로 나온다.
증명 핵심 — 공분산 부분: 다음 트릭으로 \(\hat\mu\) 추정 효과를 무시한다.
Oracle 공분산 \(\tilde C\) 를 도입 — \(\mu\) 를 진짜 안다고 가정한 경우: \[ \tilde C = \frac{1}{N}\sum_{n=1}^N (X_n - \mu) \otimes (X_n - \mu). \] 이는 iid 합이므로 함수 CLT 직접 적용 가능: \(\sqrt N (\tilde C - C) \Rightarrow \mathcal{N}(0, \Gamma)\).
\(\hat C\) 와 \(\tilde C\) 의 차이가 점근적으로 무시할 수 있음: \[ \sqrt N (\tilde C - \hat C) = \frac{1}{\sqrt N}\big[\sqrt N(\hat\mu - \mu) \otimes \sqrt N(\hat\mu - \mu)\big]. \] 분해 식을 정리하면 위 형태가 나오는데, \(\sqrt N (\hat\mu - \mu) = O_P(1)\) 이므로 분자는 \(O_P(1)\) 이고, \(1/\sqrt N\) 으로 나누어 전체가 \(O_P(N^{-1/2}) = o_P(1)\).
Slutsky 로 \(\sqrt N (\hat C - C) = \sqrt N (\tilde C - C) + o_P(1) \Rightarrow \mathcal{N}(0, \Gamma)\).
직관: “표본 평균을 빼는 효과는 점근적으로 사라진다” — 다변량에서 표본 공분산 행렬 \(S\) 가 분모 \(N-1\) vs \(N\) 에 무관하게 점근적으로 같은 분포를 따르는 것과 동일한 구조다. \(\sqrt N (\hat\mu - \mu)\) 가 가우스로 수렴하므로 그 텐서 곱이 \(O_P(1)\) 이 되고, 추가로 \(1/\sqrt N\) 이 곱해져 사라진다.
\(\Gamma\) 의 의미: \(\hat C\) 의 점근 공분산 연산자는 \(\mathcal{S} \otimes \mathcal{S}\) (HS 연산자의 텐서 곱) 의 원소다. 이는 다변량에서 “공분산 행렬의 추정량의 공분산이 4차 텐서” 인 것의 함수 버전이다. 일반적으로 \(\Gamma\) 는 매우 복잡하지만, 가우스 가정을 추가하면 단순화 된다 (Theorem 12.3.3 에서).
3 Theorem 12.3.2 — EFPC 와 고유값의 점근 전개
\(X_1, \dots, X_N\) 이 \(\mathcal{H}\) 의 iid 원소이고 \(\mathbb{E}\|X\|^4 < \infty\), 첫 \(p\) 개 고유값이 단순할 때 (\(\lambda_1 > \cdots > \lambda_p > \lambda_{p+1} \ge \cdots\)). \(j = 1, \dots, p\) 에 대해:
\[ N^{1/2}(\hat\lambda_j - \lambda_j) = \langle Z_N,\, v_j \otimes v_j\rangle + o_P(1), \]
\[ N^{1/2}(\hat v_j - v_j) = T_{jN} + o_P(1), \]
여기서 \(Z_N = \sqrt N (\hat C - C) \in \mathcal{S}\), 그리고
\[ T_{jN} = \sum_{k \ne j} \frac{1}{\lambda_j - \lambda_k}\,\langle Z_N, v_k \otimes v_j\rangle\,v_k. \]
의미: \(\hat\lambda_j - \lambda_j\) 와 \(\hat v_j - v_j\) 가 \(\hat C - C\) 의 사영 (projection) 으로 표현된다. 고유분해의 점근 분포는 공분산 연산자의 점근 분포에서 자동으로 유도된다.
증명: Kokoszka & Reimherr (2013) 에서 제공 — Hall & Hosseini-Nasab (2006) 의 일반화. 핵심 도구는 연산자 섭동 이론 (operator perturbation theory): 자기 수반 연산자의 고유값·고유함수가 연산자의 작은 변화에 어떻게 반응하는지 정량화한 Davis-Kahan 정리의 함수 버전.
고유값 표현의 직관: \(\hat\lambda_j - \lambda_j\) 가 \(\hat C - C\) 를 \(v_j \otimes v_j\) 방향으로 사영한 양이다. \(v_j\) 가 \(C\) 의 고유함수이므로 \(\langle C, v_j \otimes v_j\rangle = \lambda_j\), 따라서 \(\langle \hat C - C, v_j \otimes v_j\rangle \approx \hat\lambda_j - \lambda_j\) 가 자연스럽다.
고유함수 표현의 직관: \(T_{jN}\) 의 분모 \(\lambda_j - \lambda_k\) 가 핵심이다. 고유값 간격 (eigenvalue gap) 이 작을수록 추정 분산이 커진다 — 가까운 고유값들은 대응하는 고유함수가 잘 분리되지 않기 때문이다. 이는 단순성 가정 \(\lambda_j > \lambda_{j+1}\) 이 필수인 이유를 다시 한번 확인해 준다 (gap 이 0 이면 분모가 0 이 되어 식이 폭발).
독립 가정의 완화: 흥미롭게도 12.3.2 의 결론은 독립 가정 없이도 성립한다 — Kokoszka & Reimherr (2013) 이 정상 함수 시계열 설정에서도 같은 점근 전개가 살아남음을 보였다. 이는 12.1~12.2 의 일치성이 weakly dependent 시계열로 확장되는 것과 정합된다.
4 Theorem 12.3.3 + Corollary — 가우스 함수의 분산 공식
\(X_1, \dots, X_N\) 이 \(\mathcal{H}\) 의 iid 가우스 원소일 때:
\[ \langle \Gamma, v_k \otimes v_j \otimes v_l \otimes v_j\rangle = \lambda_j \lambda_k\, \mathbf{1}_{k=l} + \lambda_j^2\, \mathbf{1}_{j=k=l}. \]
의미와 증명 도구: \(\Gamma\) (\(\hat C\) 의 점근 공분산) 의 4 중 텐서 사영을 계산하는 식이다. 핵심은 Isserlis 정리 (Wick’s theorem) — 가우스 확률변수의 4 차 모멘트가 2 차 모멘트들의 곱으로 분해된다는 정리: \[ \mathbb{E}[X_a X_b X_c X_d] = \mathbb{E}[X_a X_b]\mathbb{E}[X_c X_d] + \mathbb{E}[X_a X_c]\mathbb{E}[X_b X_d] + \mathbb{E}[X_a X_d]\mathbb{E}[X_b X_c]. \]
함수 가우스의 경우 \(\langle X_1, v_i\rangle\) 들은 평균 \(0\), 분산 \(\lambda_i\) 의 독립 정규변수가 되므로 4 차 모멘트가 위 페어링 합으로 단순화된다.
왜 이 공식이 중요한가: 다음 두 Corollary 의 직접적 도구다.
\[ N^{1/2}(\hat\lambda_j - \lambda_j) \overset{d}{\to} \mathcal{N}\big(0,\, \langle \Gamma, v_j^{\otimes 4}\rangle\big), \] \[ N^{1/2}(\hat v_j - v_j) \overset{d}{\to} \mathcal{N}(0, C_j), \] \[ C_j = \sum_{k \ne j}\sum_{l \ne j} \frac{\langle \Gamma, v_k \otimes v_j \otimes v_l \otimes v_j\rangle}{(\lambda_j - \lambda_k)(\lambda_j - \lambda_l)}\,(v_k \otimes v_l). \]
\(X_n\) 이 가우스이면: \[ N^{1/2}(\hat\lambda_j - \lambda_j) \overset{d}{\to} \mathcal{N}(0, 2\lambda_j^2), \] \[ N^{1/2}(\hat v_j - v_j) \overset{d}{\to} \mathcal{N}(0, C_j), \quad C_j = \sum_{k \ne j} \frac{\lambda_k \lambda_j}{(\lambda_j - \lambda_k)^2}\,(v_k \otimes v_k). \]
가우스 케이스의 우아함: \(\hat\lambda_j\) 의 점근 분산이 \(2\lambda_j^2\) 라는 단순한 식이 된다. 이는 다변량 가우스에서 표본 공분산 행렬의 고유값이 \(\mathcal{N}(\lambda_j, 2\lambda_j^2/N)\) 로 점근하는 결과 (Anderson, 2003) 의 함수 버전이다. 고유함수의 점근 공분산 \(C_j\) 는 다른 방향 (\(v_k\), \(k \ne j\)) 으로의 변동 합이며, 분모의 gap \((\lambda_j - \lambda_k)^2\) 가 다시 등장 — gap 이 작은 방향의 분산이 지배한다.
RT-PCR 직관: 정상 곡선들의 첫 PC 가 “평균 증폭 수준” 이고 두 번째 PC 가 “증폭 속도” 라면, 고유값 \(\lambda_1 \gg \lambda_2\) 인 경우 첫 PC 의 추정 분산은 \(2\lambda_1^2/N\) 으로 작고 안정적이지만, 비슷한 크기의 PC (\(\lambda_2 \approx \lambda_3\)) 가 있으면 그들의 고유함수가 서로 섞이기 쉬워 추정이 불안정해진다.
5 12.4 — 평균 함수 가설 검정
\[ H_0: \mathbb{E}[X_n] = \mu_0 \quad \text{vs} \quad H_A: \mathbb{E}[X_n] \ne \mu_0, \]
여기서 \(\mu_0\) 는 미리 지정된 결정 함수 (deterministic function).
이 단순한 문제가 함수 검정의 모든 핵심 쟁점을 노출한다 — 함수 모수의 차이 \(\hat\mu - \mu_0\) 가 무한차원 객체이므로 “최선의” 검정 통계량이 존재하지 않는다. 두 가지 자연스러운 접근이 있다.
| 접근 | 통계량 | 점근 분포 (under \(H_0\)) |
|---|---|---|
| Norm | \(T_{\mathrm{Norm}} = N\|\hat\mu - \mu_0\|^2\) | \(\sum_{i=1}^\infty \lambda_i \chi_i^2(1)\) (가중 카이제곱) |
| PC | \(T_{\mathrm{PC}} = N\sum_{i=1}^p \frac{\langle \hat\mu - \mu_0, \hat v_i\rangle^2}{\hat\lambda_i}\) | \(\chi^2(p)\) |
각 접근의 trade-off 가 본 절의 핵심이다.
6 Norm 접근 — Theorem 12.4.1
가정 12.0.1 하에서:
\(H_0\) 하에서: \[ T_{\mathrm{Norm}} \overset{d}{\to} T_\infty := \sum_{i=1}^\infty \lambda_i\, \chi_i^2(1), \] \(\chi_i^2(1)\): iid 자유도 1 카이제곱.
\(H_A\) 하에서 (\(\mu^*\): 진짜 평균): \[ T_{\mathrm{Norm}} = N\|\mu^* - \mu_0\|^2 + O_P(N^{1/2}) \;\overset{P}{\to}\; \infty. \]
증명 핵심 (\(H_0\) 부분): Theorem 12.3.1 + Continuous Mapping Theorem.
- \(\sqrt N (\hat\mu - \mu_0) \overset{d}{\to} Z \sim \mathcal{N}(0, C)\) (under \(H_0\), \(\mu = \mu_0\)).
- Continuous mapping (\(x \mapsto \|x\|^2\) 가 연속): \(T_{\mathrm{Norm}} = \|\sqrt N (\hat\mu - \mu_0)\|^2 \overset{d}{\to} \|Z\|^2\).
- 가우스 확률 원소의 노름 제곱은 KL 전개로: \[ \|Z\|^2 = \sum_{i=1}^\infty \lambda_i N_i^2, \quad N_i \overset{iid}{\sim} \mathcal{N}(0,1). \]
- \(N_i^2 \sim \chi^2(1)\) 이므로 \(\|Z\|^2 = \sum \lambda_i \chi_i^2(1)\).
증명 핵심 (\(H_A\) 부분): \(\Delta = \mu^* - \mu_0 \ne 0\) 일 때: \[ N\|\hat\mu - \mu_0\|^2 = N\|\Delta\|^2 + 2\sqrt N\langle \sqrt N(\hat\mu - \mu^*), \Delta\rangle + \|\sqrt N(\hat\mu - \mu^*)\|^2. \] \(\sqrt N(\hat\mu - \mu^*) = O_P(1)\) 이므로 우변 = \(N\|\Delta\|^2 + O_P(N^{1/2}) + O_P(1) \to \infty\). 검정의 일관성 (consistency) — \(H_A\) 가 참이면 \(H_0\) 를 기각할 확률이 \(1\) 로 수렴.
임계값 계산의 도전: \(T_\infty = \sum \lambda_i \chi_i^2(1)\) 의 분포는 닫힌 형태가 없다. 가능한 방법:
- \(\lambda_i\) 를 \(\hat\lambda_i\) 로 치환 + 무한 합 절단 + 시뮬레이션 — 가장 흔한 방식.
imhof()함수 (R 의CompQuadForm패키지) — 가중 카이제곱 분포의 cdf 를 정확히 (수치적으로) 계산. 극단 꼬리 (extreme tail) 에서도 정확한 P-값 제공.- Saddle-point 근사 — Davies (1980) 등의 방법.
본 정리에서 Section 8.6 (정상성 검정) 에서 만난 동일한 문제 구조 — 두 곳 모두 가중 카이제곱 분포의 분위수가 필요하다.
직관: “곡선 전체의 차이를 \(L^2\) 거리로 측정한다” — 평균 곡선이 얼마나 멀리 떨어져 있는지를 한 숫자로 요약. 단점은 임계값 계산이 비싸고 \(\lambda_i\) 추정에 의존.
7 PC 접근 — Theorem 12.4.2
다변량 통계학의 Hotelling \(T^2\) 검정의 함수 일반화. 다변량의 \(T^2\) 식:
\[ T^2 = N(\bar{\mathbf{X}} - \boldsymbol{\mu}_0)^\top \mathbf{S}^{-1} (\bar{\mathbf{X}} - \boldsymbol{\mu}_0). \]
함수에서는 \(\hat C\) 의 역 (inverse) 이 존재하지 않는다 — \(\hat C\) 의 치역이 \(N\) 차원 부분공간이라 무한차원에서 invertible 하지 않다. PC 접근의 핵심 아이디어: FPCA 로 차원 축소 후 다변량 \(T^2\) 를 적용.
\[ T_{\mathrm{PC}} = N\sum_{i=1}^p \frac{\langle \hat\mu - \mu_0,\, \hat v_i\rangle^2}{\hat\lambda_i}. \]
왜 cross term 이 없는가: 표본 평균의 사영 \(\langle \hat\mu, \hat v_i\rangle\) 들은 비상관 (uncorrelated). 식 (12.8): \[ \mathrm{Cov}(\langle \hat\mu, v_i\rangle, \langle \hat\mu, v_j\rangle) = N^{-1}\lambda_i \mathbf{1}_{i=j}. \] 이는 \(\hat\mu\) 의 점근 공분산 연산자 \(C/N\) 의 EFPC 사영 식에서 나온다. EFPC 가 자연스럽게 \(T^2\) 의 cross term 을 0 으로 만든다 — 다변량에서 PC 회귀 후 다중공선성이 사라지는 것과 같은 효과.
\(X_1, \dots, X_N\) 이 iid 제곱적분 가능하고 첫 \(p\) 개 고유값이 단순할 때:
\(H_0\) 하에서: \[ T_{\mathrm{PC}} \overset{d}{\to} \chi^2(p). \]
\(H_A\) 하에서 (단, \(\langle \mu^*, v_i\rangle \ne 0\) 인 \(i \le p\) 가 적어도 하나 존재): \[ T_{\mathrm{PC}} = N\|\Gamma_p(\Delta)\|^2 + O_P(N^{1/2}) \;\overset{P}{\to}\; \infty, \] \[ \Gamma_p(x) = \sum_{i=1}^p \lambda_i^{-1/2}\langle x, v_i\rangle\,v_i. \]
증명 핵심 (\(H_0\)): Theorem 12.3.1 + Theorem 12.2.1 + Slutsky + Continuous Mapping.
\(\sqrt N (\hat\mu - \mu_0) \Rightarrow Z \sim \mathcal{N}(0, C)\), \(\hat v_i \to v_i\), \(\hat\lambda_i \to \lambda_i\) 모두 결합: \[ T_{\mathrm{PC}} \overset{d}{\to} \sum_{i=1}^p \frac{\langle Z, v_i\rangle^2}{\lambda_i}. \] \(\langle Z, v_i\rangle / \sqrt{\lambda_i}\) 가 표준 정규이고 (KL 전개 + EFPC 사영 분산 \(\lambda_i\)), \(i \ne j\) 면 비상관이므로 \(\sum\) 은 자유도 \(p\) 카이제곱.
\(H_A\) 부분: 다음 분해: \[ T_{\mathrm{PC}} = N\sum_{i=1}^p \frac{\langle \hat\mu - \mu^* + \Delta, \hat v_i\rangle^2}{\hat\lambda_i}. \] 전개하면 \(N\|\Gamma_p(\Delta)\|^2 + O_P(N^{1/2})\), \(\Gamma_p\) 가 위처럼 정의된 첫 \(p\) EFPC 로의 정규화 사영. \(\Delta\) 가 \(v_1, \dots, v_p\) 와 평행 성분이 있으면 \(\Gamma_p(\Delta) \ne 0\) 이고 통계량이 \(\infty\) 로 발산 → 일관성.
Hotelling \(T^2\) 와의 직접 연결: \(\hat C\) 의 Moore-Penrose pseudo-inverse 를 첫 \(p\) 개 EFPC 로 정의하면: \[ \hat C_p^+ := \sum_{j=1}^p \hat\lambda_j^{-1}\,\hat v_j \otimes \hat v_j. \] 그러면 \[ N\langle \hat C_p^+(\hat\mu - \mu_0),\, \hat\mu - \mu_0\rangle = N\sum_{j=1}^p \frac{\langle \hat\mu - \mu_0, \hat v_j\rangle^2}{\hat\lambda_j} = T_{\mathrm{PC}}. \] \(T_{\mathrm{PC}}\) 는 함수 Hotelling \(T^2\) 의 정확한 표현 — 무한차원에서 역행렬이 안 되므로 유한 차원으로 절단한 pseudo-inverse 로 우회 한 것.
직관: “함수 차이를 첫 \(p\) 개 주축 (EFPC) 으로 사영해 다변량 검정으로 환원한다.” 차원이 \(p\) 로 명확하므로 임계값이 표준 \(\chi^2(p)\) — 임계값 계산이 단순하고 \(\lambda_i\) 추정 의존성이 없다.
\(p\) 선택의 중요성: - \(p\) 가 너무 작으면 \(\Delta\) 의 일부 정보가 손실 (\(\langle \Delta, v_i\rangle\), \(i > p\) 가 무시됨) → 검정력 손실. - \(p\) 가 너무 크면 작은 \(\hat\lambda_j\) 가 분모로 들어와 통계량이 불안정 (작은 EFPC 의 추정 잡음이 커짐). - 권장: CPV 85% 또는 작은 한 자릿수 (\(p = 3 \sim 5\)).
8 Norm vs PC — 검정력 비교
두 통계량의 점근 발산 속도: \[ T_{\mathrm{Norm}} \approx N\|\Delta\|^2, \qquad T_{\mathrm{PC}} \approx N\|\Gamma_p(\Delta)\|^2. \]
검정력은 \(\|\Delta\|^2\) vs \(\|\Gamma_p(\Delta)\|^2\) 의 상대 크기에 의해 결정된다.
| 시나리오 | \(\Delta\) 형태 | 우월한 접근 | 이유 |
|---|---|---|---|
| 부드러운 alternative | \(\Delta\) 가 첫 몇 EFPC 의 선형 결합 | PC | \(\Gamma_p(\Delta)\) 가 \(\Delta\) 의 거의 전체 정보 보존, 차원 축소로 검정력 집중 |
| 거친 (high-frequency) alternative | \(\Delta\) 가 후순위 EFPC 에 큰 성분 | Norm | PC 가 \(i > p\) 정보를 버려 검정력 손실 |
| 알 수 없음 | — | 시뮬레이션 비교 권장 | 사전 정보 없이는 예측 불가 |
일반 권장 (Kokoszka & Reimherr 2017): 첫 몇 PC 가 분산의 큰 비율을 설명하면 (예: \(p = 3\) 으로 80% 이상) PC 접근, 그 외에는 norm 접근. 둘 다 시도해 비교하는 것이 안전.
다변량과의 차이: 다변량 Hotelling \(T^2\) 는 차원이 고정 (\(p\)) 이라 PC 절단이 없지만, 함수에서는 차원이 \(\infty\) 라 절단이 본질적이다. PC 접근 = 함수의 본질적 무한차원성을 다변량 차원 축소로 우회 하는 전략이다.
9 R 시뮬레이션 — Norm vs PC 검정력 비교 (Kokoszka 12.4 의 simulation study)
Kokoszka 의 시뮬레이션 (Table 12.1) 을 재현한다.
9.1 Step 1: 데이터 생성 (Matérn process)
library(MASS) # mvrnorm
generate_matern <- function(N, T_grid, var = 1, scale = 1/4, smooth = 5/2) {
# Matern covariance kernel
d <- as.matrix(dist(T_grid))
rho <- ifelse(d == 0, 1, {
arg <- sqrt(2 * smooth) * d / scale
(2^(1 - smooth) / gamma(smooth)) * arg^smooth * besselK(arg, smooth)
})
diag(rho) <- 1
Sigma <- var * rho
mvrnorm(N, mu = rep(0, length(T_grid)), Sigma = Sigma)
}
# 평균 함수: c1 * sqrt(2) * sin((k-1/2) pi t)
mu_alt <- function(T_grid, c1, k) {
c1 * sqrt(2) * sin((k - 1/2) * pi * T_grid)
}9.2 Step 2: Norm 통계량 (가중 카이제곱) 검정
test_norm <- function(X, mu0, alpha = 0.10, R = 5000, p_trunc = 20) {
N <- nrow(X)
T_grid_step <- 1 / (ncol(X) - 1)
mu_hat <- colMeans(X)
T_norm <- N * sum((mu_hat - mu0)^2) * T_grid_step
# H0 하의 임계값 — sum lambda_i chi^2_i(1) 시뮬레이션
X_centered <- scale(X, center = mu_hat, scale = FALSE)
C_hat <- crossprod(X_centered) / N * T_grid_step
lambda_hat <- pmax(eigen(C_hat, symmetric = TRUE)$values, 0)[1:p_trunc]
null_dist <- rowSums(matrix(rchisq(R * p_trunc, df = 1), nrow = R) %*% diag(lambda_hat))
c_alpha <- quantile(null_dist, 1 - alpha)
list(stat = T_norm, crit = c_alpha, reject = T_norm > c_alpha)
}9.3 Step 3: PC 통계량 (χ²(p)) 검정
test_pc <- function(X, mu0, alpha = 0.10, p = 3) {
N <- nrow(X)
T_grid_step <- 1 / (ncol(X) - 1)
mu_hat <- colMeans(X)
X_centered <- scale(X, center = mu_hat, scale = FALSE)
C_hat <- crossprod(X_centered) / N * T_grid_step
ev <- eigen(C_hat, symmetric = TRUE)
v_hat <- ev$vectors[, 1:p] / sqrt(T_grid_step) # L^2 정규화
lambda_hat <- pmax(ev$values[1:p], 1e-10)
diff <- mu_hat - mu0
proj <- as.numeric(crossprod(v_hat, diff) * T_grid_step)
T_pc <- N * sum(proj^2 / lambda_hat)
c_alpha <- qchisq(1 - alpha, df = p)
list(stat = T_pc, crit = c_alpha, reject = T_pc > c_alpha)
}9.4 Step 4: 검정력 비교 — Table 12.1 재현
set.seed(123)
N <- 100
T_grid <- seq(0, 1, length.out = 50)
c1_values <- c(0, 0.1, 0.2, 0.3) # alternative size
k_values <- c(1, 2, 5) # alternative frequency
n_rep <- 200 # Kokoszka 책은 1000, 빠른 시뮬용으로 200
results <- expand.grid(c1 = c1_values, k = k_values)
results$norm_rate <- NA
results$pc1_rate <- NA
results$pc3_rate <- NA
for (i in seq_len(nrow(results))) {
c1 <- results$c1[i]; k <- results$k[i]
mu_true <- mu_alt(T_grid, c1, k)
mu0 <- rep(0, length(T_grid))
rejs <- replicate(n_rep, {
X <- generate_matern(N, T_grid)
X <- sweep(X, 2, mu_true, "+") # 평균 추가
c(test_norm(X, mu0)$reject,
test_pc(X, mu0, p = 1)$reject,
test_pc(X, mu0, p = 3)$reject)
})
results$norm_rate[i] <- mean(rejs[1, ])
results$pc1_rate[i] <- mean(rejs[2, ])
results$pc3_rate[i] <- mean(rejs[3, ])
}
print(results)예상 결과 패턴 (Kokoszka Table 12.1):
| \(c_1\) | \(k\) | 평균 함수의 매끄러움 | Norm vs PC 우열 |
|---|---|---|---|
| 0 | 임의 | \(H_0\) — empirical size \(\approx \alpha\) | 둘 다 \(\alpha\) 근방 |
| 0.2~0.3 | 1 | 매우 부드러움 (첫 EFPC 와 정렬) | PC-1 이 가장 강력 |
| 0.2~0.3 | 2~3 | 보통 | PC-3 와 Norm 비슷 |
| 0.2~0.3 | \(\ge 5\) | 거침 (high frequency) | Norm 이 우월 — PC-3 가 정보 손실 |
해석: \(k = 1\) (alternative 가 첫 EFPC 와 평행) 이면 PC-1 으로 충분하고 PC-3 보다 강력 — 잡음을 적게 본다. \(k \ge 5\) (alternative 가 후순위 방향) 이면 PC 가 그 정보를 버려 검정력 폭락, Norm 만이 살아남음.
9.5 Step 5: H_0 하의 empirical size 확인
# c1 = 0 — empirical size 가 alpha = 0.10 근방에 있어야
size_norm <- mean(replicate(500, {
X <- generate_matern(N, T_grid)
test_norm(X, rep(0, length(T_grid)))$reject
}))
size_pc <- mean(replicate(500, {
X <- generate_matern(N, T_grid)
test_pc(X, rep(0, length(T_grid)), p = 3)$reject
}))
cat(sprintf("Empirical size — Norm: %.3f, PC-3: %.3f (target 0.10)\n", size_norm, size_pc))해석: 두 size 모두 \(0.10\) 근방 (\(\pm 0.01\)) 이어야 검정이 정확히 보정 (calibrated) 되어 있다. 큰 편차가 있으면 임계값 시뮬레이션 횟수 (\(R\)) 부족이거나 절단 차원 (\(p_{\mathrm{trunc}}\)) 부족.
10 핵심 정리 표
| 결과 | 정리 | 점근 분포 / 핵심 식 | 가정 |
|---|---|---|---|
| 표본 평균 정규성 | 12.3.1 | \(\sqrt N (\hat\mu - \mu) \Rightarrow \mathcal{N}(0, C)\) | \(\mathbb{E}\|X\|^2 < \infty\) |
| 공분산 연산자 정규성 | 12.3.1 | \(\sqrt N (\hat C - C) \Rightarrow \mathcal{N}(0, \Gamma)\) | \(\mathbb{E}\|X\|^4 < \infty\) |
| 고유값 점근 전개 | 12.3.2 | \(\sqrt N (\hat\lambda_j - \lambda_j) = \langle Z_N, v_j^{\otimes 2}\rangle + o_P(1)\) | + \(\lambda_j\) 단순 |
| 고유함수 점근 전개 | 12.3.2 | \(\sqrt N (\hat v_j - v_j) = T_{jN} + o_P(1)\) | 동일 |
| 가우스 고유값 분산 | 12.3.2/Cor.2 | \(\mathrm{Var}(\sqrt N \hat\lambda_j) \to 2\lambda_j^2\) | 가우스 + 단순 |
| Norm 검정 (\(H_0\)) | 12.4.1 | \(T_{\mathrm{Norm}} \Rightarrow \sum \lambda_i \chi_i^2(1)\) | iid + 12.0.1 |
| Norm 검정 (\(H_A\)) | 12.4.1 | \(T_{\mathrm{Norm}} \to \infty\) | \(\Delta \ne 0\) |
| PC 검정 (\(H_0\)) | 12.4.2 | \(T_{\mathrm{PC}} \Rightarrow \chi^2(p)\) | + 첫 \(p\) 단순 |
| PC 검정 (\(H_A\)) | 12.4.2 | \(T_{\mathrm{PC}} \to \infty\) | \(\langle \mu^*, v_i\rangle \ne 0\), \(i \le p\) |
한 문장 요약: 12.3 절은 12.1~12.2 의 일치성을 점근 정규성으로 격상하고, 12.4 절은 그 결과를 평균 함수 검정 두 가지 (\(T_{\mathrm{Norm}}\): 가중 카이제곱·계산 비싸지만 일반적 / \(T_{\mathrm{PC}}\): 단순 카이제곱·smooth alternative 에 강력) 로 운영한다.
11 응용 분야
| 분야 | 12.3~12.4 결과의 활용 |
|---|---|
| 임상시험 | 두 처치 그룹의 평균 곡선 비교 (two-sample 확장: \(\hat\mu_A - \hat\mu_B\) 의 점근 정규성으로 동일 검정 구조) |
| RT-PCR | 정상 vs 비정상 곡선의 평균 비교, 억제제 농도 효과 검정 |
| 환경 (기온) | 기준 시기 vs 현재의 평균 일별 기온 곡선 차이 검정 (기후 변화 신호 탐지) |
| 금융 (intraday) | 평균 일중 수익률 곡선 = 0 인지 (Ch.12.6 BOA 적용의 토대) |
| Neuroimaging | DTI/fMRI 그룹 간 평균 곡선 비교 + 다중 비교 (다음 12.5 절의 동시 신뢰 대역으로 확장) |
RT-PCR 실무 직관: “정상 곡선 100 개의 평균이 알려진 reference \(\mu_0\) 와 같은가?” 검정. - \(T_{\mathrm{PC}}\) (\(p=3\)): 빠른 계산, \(\chi^2(3)\) 임계값. 정상/이상 그룹의 차이가 첫 몇 PC (전체 진폭, 증폭 속도) 에 집중되면 강력. - \(T_{\mathrm{Norm}}\): \(\hat\lambda_i\) 추정 + 시뮬레이션 필요. 차이가 미세하지만 곡선 전체에 퍼져 있으면 강력. - 둘 다 시도해 일관된 결론이면 신뢰 ↑.
12 다음 절 — 12.5 동시 신뢰 대역
12.4 의 검정 통계량은 “평균 곡선이 같은가?” 의 binary 답만 준다. 12.5 의 동시 신뢰 대역 (simultaneous confidence band) 은 평균 곡선의 추정 불확실성을 함수 전 구간 띠로 시각화한다 — 검정과 동일한 점근 도구 (함수 CLT + KL 전개) 를 사용하지만 출력이 띠 형태다. Ch.12 overview 글의 동시 신뢰 대역 섹션 참조.
13 관련 주제
선행 지식
- 12.1~12.2 — 표본 평균·공분산·EFPC의 일치성 (HS 노름·부호 보정·N⁻¹/² 모수적 속도) — 본 글의 일치성 토대
- Ch.10 — 힐베르트 공간 이론 개관 — HS 노름·텐서 곱
- 3.1~3.2 — L² 공간과 확률 함수, Karhunen-Loève 전개 — KL 가우스 표현
- 3.3 — 선형 변환과 공분산 연산자
본 글의 대상 (Ch.12.3~12.4)
- Ch.12 — 확률 표본으로부터의 추론 개관 — Ch.12 전체의 한 호흡 정리
관련 — 검정과 신뢰 대역
- 12.5 동시 신뢰 대역 (다음 절)
- 12.6 BOA 누적 수익률 적용 (Ch.12 응용)
- 5.5~5.6 — FPCA 기반 핵 추정과 효과 없음 카이제곱 검정 — 함수 회귀에서의 PC 절단 카이제곱 검정 (구조 동일)
시계열 확장
- 8.5~8.6 — 장기 공분산 함수 (LRCF) 와 정상성 검정 — 가중 카이제곱 분포가 다시 등장
Hotelling \(T^2\) 의 다변량 토대
- 다변량 통계학 교재 (Anderson, 2003 / Johnson & Wichern, 2007 Ch.5) — Hotelling \(T^2\) 와 그 확장 패턴
14 참고문헌
- Kokoszka, P., & Reimherr, M. (2017). Introduction to Functional Data Analysis, Sections 12.3, 12.4. Chapman & Hall/CRC.
- Kokoszka, P., & Reimherr, M. (2013). Asymptotic normality of the principal components of functional time series. — Theorem 12.3.2 의 원본.
- Hall, P., & Hosseini-Nasab, M. (2006). On properties of functional principal components analysis. — EFPC 점근 전개의 시초.
- Davies, R. B. (1980). The distribution of a linear combination of \(\chi^2\) random variables. —
imhof()함수의 알고리즘. - Anderson, T. W. (2003). An Introduction to Multivariate Statistical Analysis (3rd ed.). — 다변량 표본 공분산 행렬의 점근 분포.
- Horváth, L., & Kokoszka, P. (2012). Inference for Functional Data with Applications. — 더 복잡한 검정 문제.