Ch.12.3~12.4 — 점근 정규성과 평균 함수 가설 검정 (Asymptotic Normality & Mean Test)

함수 CLT·EFPC 점근 전개·Norm 접근 (가중 χ²)·PC 접근 (χ²(p))·검정력 비교

Kokoszka & Reimherr (2017) 12.3~12.4 절은 12.1~12.2 의 일치성 결과를 점근 분포로 격상하고 이를 평균 함수 검정 \(H_0: \mu = \mu_0\) 에 적용한다. Theorem 12.3.1~12.3.3 으로 표본 평균 \(\sqrt N (\hat\mu - \mu) \Rightarrow \mathcal{N}(0, C)\), 표본 공분산 연산자, EFPC, 고유값의 점근 정규성을 확립하고, 12.4 에서 norm 접근 (가중 카이제곱 \(\sum \lambda_i \chi_i^2(1)\)) 과 PC 접근 (절단 \(\chi^2(p)\)) 두 검정 통계량을 비교한다. 본 글은 정리·증명 핵심 단계· 직관·다변량 Hotelling \(T^2\) 와의 대비·R 시뮬레이션 흐름으로 정리한다.

Statistics
Functional Data Analysis
저자

Kwangmin Kim

공개

2026년 05월 07일

1 12.3 의 자리 — 일치성에서 점근 분포로

12.1~12.2 절은 평균제곱 일치성 (Theorem 12.1.1, 12.1.4, 12.2.1) 을 보였다:

\[ \mathbb{E}\|\hat\mu - \mu\|^2,\ \mathbb{E}\|\hat C - C\|_S^2,\ \mathbb{E}\|\hat v_j - v_j\|^2,\ \mathbb{E}|\hat\lambda_j - \lambda_j|^2 = O(N^{-1}). \]

이로부터 Chebyshev 부등식으로 확률 수렴 (consistency in probability) 이 따라온다. 그러나 유의성 검정 (significance test) 을 만들려면 점근 분포가 필요하다 — “추정량이 모수에 가깝다” 는 정성적 진술로는 임계값 (critical value) 을 계산할 수 없다.

12.3 의 핵심 메시지: 가정 12.0.1 하에서 위 모든 추정량이 점근적으로 정규 (asymptotically normal) 이다. 이는 12.1~12.2 의 평균제곱 일치성보다 일반적으로 더 강한 결과지만 (분포 수렴이 모멘트 수렴을 함의하지 않으므로), 12.1~12.2 의 모멘트 경계는 여전히 가치가 있다.

이 절부터는 좀 더 일반적으로 분리 가능 실 Hilbert 공간 \(\mathcal{H}\) 에서의 결과로 서술한다. \(L^2\) 는 그 특수 경우.

12.3 의 두 정리 미리 보기
  • Theorem 12.3.1 — 표본 평균과 공분산 연산자의 점근 정규성 (함수 CLT 직접 적용).
  • Theorem 12.3.2 — EFPC 와 고유값의 점근 전개 (\(Z_N = \sqrt N (\hat C - C)\) 의 사영으로 표현).

EFPC 의 점근 분포는 공분산 연산자의 점근 분포에서 항상 유도된다 — 고유분해의 섭동 이론 (perturbation theory) 이 둘을 잇는다.

2 Theorem 12.3.1 — 표본 평균과 공분산의 점근 정규성

Theorem 12.3.1

\(X_1, \dots, X_N\)\(\mathcal{H}\) 에서 iid 이고 \(\mathbb{E}\|X_n\|^2 < \infty\) 일 때:

\[ \sqrt N (\hat\mu - \mu) \;\overset{d}{\to}\; \mathcal{N}(0, C) \quad \text{in } \mathcal{H}. \]

추가로 \(\mathbb{E}\|X\|^4 < \infty\) 이면:

\[ \sqrt N (\hat C - C) \;\overset{d}{\to}\; \mathcal{N}(0, \Gamma) \quad \text{in } \mathcal{S} \]

여기서

\[ \Gamma = \mathbb{E}\big[((X_1-\mu) \otimes (X_1-\mu) - C) \otimes ((X_1-\mu) \otimes (X_1-\mu) - C)\big] \in \mathcal{S} \otimes \mathcal{S}. \]

증명 핵심 — 평균 부분: Hilbert 공간 CLT (Theorem 11.3.2) 의 직접 적용. iid 함수 \(X_n - \mu\) 에 함수 CLT 를 적용하면 \(\sqrt N (\hat\mu - \mu) \Rightarrow \mathcal{N}(0, C)\) 가 곧바로 나온다.

증명 핵심 — 공분산 부분: 다음 트릭으로 \(\hat\mu\) 추정 효과를 무시한다.

  1. Oracle 공분산 \(\tilde C\) 를 도입 — \(\mu\) 를 진짜 안다고 가정한 경우: \[ \tilde C = \frac{1}{N}\sum_{n=1}^N (X_n - \mu) \otimes (X_n - \mu). \] 이는 iid 합이므로 함수 CLT 직접 적용 가능: \(\sqrt N (\tilde C - C) \Rightarrow \mathcal{N}(0, \Gamma)\).

  2. \(\hat C\)\(\tilde C\) 의 차이가 점근적으로 무시할 수 있음: \[ \sqrt N (\tilde C - \hat C) = \frac{1}{\sqrt N}\big[\sqrt N(\hat\mu - \mu) \otimes \sqrt N(\hat\mu - \mu)\big]. \] 분해 식을 정리하면 위 형태가 나오는데, \(\sqrt N (\hat\mu - \mu) = O_P(1)\) 이므로 분자는 \(O_P(1)\) 이고, \(1/\sqrt N\) 으로 나누어 전체가 \(O_P(N^{-1/2}) = o_P(1)\).

  3. Slutsky\(\sqrt N (\hat C - C) = \sqrt N (\tilde C - C) + o_P(1) \Rightarrow \mathcal{N}(0, \Gamma)\).

직관: “표본 평균을 빼는 효과는 점근적으로 사라진다” — 다변량에서 표본 공분산 행렬 \(S\) 가 분모 \(N-1\) vs \(N\) 에 무관하게 점근적으로 같은 분포를 따르는 것과 동일한 구조다. \(\sqrt N (\hat\mu - \mu)\) 가 가우스로 수렴하므로 그 텐서 곱이 \(O_P(1)\) 이 되고, 추가로 \(1/\sqrt N\) 이 곱해져 사라진다.

\(\Gamma\) 의 의미: \(\hat C\) 의 점근 공분산 연산자는 \(\mathcal{S} \otimes \mathcal{S}\) (HS 연산자의 텐서 곱) 의 원소다. 이는 다변량에서 “공분산 행렬의 추정량의 공분산이 4차 텐서” 인 것의 함수 버전이다. 일반적으로 \(\Gamma\) 는 매우 복잡하지만, 가우스 가정을 추가하면 단순화 된다 (Theorem 12.3.3 에서).

3 Theorem 12.3.2 — EFPC 와 고유값의 점근 전개

Theorem 12.3.2

\(X_1, \dots, X_N\)\(\mathcal{H}\) 의 iid 원소이고 \(\mathbb{E}\|X\|^4 < \infty\), 첫 \(p\) 개 고유값이 단순할 때 (\(\lambda_1 > \cdots > \lambda_p > \lambda_{p+1} \ge \cdots\)). \(j = 1, \dots, p\) 에 대해:

\[ N^{1/2}(\hat\lambda_j - \lambda_j) = \langle Z_N,\, v_j \otimes v_j\rangle + o_P(1), \]

\[ N^{1/2}(\hat v_j - v_j) = T_{jN} + o_P(1), \]

여기서 \(Z_N = \sqrt N (\hat C - C) \in \mathcal{S}\), 그리고

\[ T_{jN} = \sum_{k \ne j} \frac{1}{\lambda_j - \lambda_k}\,\langle Z_N, v_k \otimes v_j\rangle\,v_k. \]

의미: \(\hat\lambda_j - \lambda_j\)\(\hat v_j - v_j\)\(\hat C - C\) 의 사영 (projection) 으로 표현된다. 고유분해의 점근 분포는 공분산 연산자의 점근 분포에서 자동으로 유도된다.

증명: Kokoszka & Reimherr (2013) 에서 제공 — Hall & Hosseini-Nasab (2006) 의 일반화. 핵심 도구는 연산자 섭동 이론 (operator perturbation theory): 자기 수반 연산자의 고유값·고유함수가 연산자의 작은 변화에 어떻게 반응하는지 정량화한 Davis-Kahan 정리의 함수 버전.

고유값 표현의 직관: \(\hat\lambda_j - \lambda_j\)\(\hat C - C\)\(v_j \otimes v_j\) 방향으로 사영한 양이다. \(v_j\)\(C\) 의 고유함수이므로 \(\langle C, v_j \otimes v_j\rangle = \lambda_j\), 따라서 \(\langle \hat C - C, v_j \otimes v_j\rangle \approx \hat\lambda_j - \lambda_j\) 가 자연스럽다.

고유함수 표현의 직관: \(T_{jN}\) 의 분모 \(\lambda_j - \lambda_k\) 가 핵심이다. 고유값 간격 (eigenvalue gap) 이 작을수록 추정 분산이 커진다 — 가까운 고유값들은 대응하는 고유함수가 잘 분리되지 않기 때문이다. 이는 단순성 가정 \(\lambda_j > \lambda_{j+1}\) 이 필수인 이유를 다시 한번 확인해 준다 (gap 이 0 이면 분모가 0 이 되어 식이 폭발).

독립 가정의 완화: 흥미롭게도 12.3.2 의 결론은 독립 가정 없이도 성립한다 — Kokoszka & Reimherr (2013) 이 정상 함수 시계열 설정에서도 같은 점근 전개가 살아남음을 보였다. 이는 12.1~12.2 의 일치성이 weakly dependent 시계열로 확장되는 것과 정합된다.

4 Theorem 12.3.3 + Corollary — 가우스 함수의 분산 공식

Theorem 12.3.3 (Gaussian moment formula)

\(X_1, \dots, X_N\)\(\mathcal{H}\) 의 iid 가우스 원소일 때:

\[ \langle \Gamma, v_k \otimes v_j \otimes v_l \otimes v_j\rangle = \lambda_j \lambda_k\, \mathbf{1}_{k=l} + \lambda_j^2\, \mathbf{1}_{j=k=l}. \]

의미와 증명 도구: \(\Gamma\) (\(\hat C\) 의 점근 공분산) 의 4 중 텐서 사영을 계산하는 식이다. 핵심은 Isserlis 정리 (Wick’s theorem) — 가우스 확률변수의 4 차 모멘트가 2 차 모멘트들의 곱으로 분해된다는 정리: \[ \mathbb{E}[X_a X_b X_c X_d] = \mathbb{E}[X_a X_b]\mathbb{E}[X_c X_d] + \mathbb{E}[X_a X_c]\mathbb{E}[X_b X_d] + \mathbb{E}[X_a X_d]\mathbb{E}[X_b X_c]. \]

함수 가우스의 경우 \(\langle X_1, v_i\rangle\) 들은 평균 \(0\), 분산 \(\lambda_i\) 의 독립 정규변수가 되므로 4 차 모멘트가 위 페어링 합으로 단순화된다.

왜 이 공식이 중요한가: 다음 두 Corollary 의 직접적 도구다.

Corollary 12.3.1 (일반 점근 분포)

\[ N^{1/2}(\hat\lambda_j - \lambda_j) \overset{d}{\to} \mathcal{N}\big(0,\, \langle \Gamma, v_j^{\otimes 4}\rangle\big), \] \[ N^{1/2}(\hat v_j - v_j) \overset{d}{\to} \mathcal{N}(0, C_j), \] \[ C_j = \sum_{k \ne j}\sum_{l \ne j} \frac{\langle \Gamma, v_k \otimes v_j \otimes v_l \otimes v_j\rangle}{(\lambda_j - \lambda_k)(\lambda_j - \lambda_l)}\,(v_k \otimes v_l). \]

Corollary 12.3.2 (가우스 단순화)

\(X_n\) 이 가우스이면: \[ N^{1/2}(\hat\lambda_j - \lambda_j) \overset{d}{\to} \mathcal{N}(0, 2\lambda_j^2), \] \[ N^{1/2}(\hat v_j - v_j) \overset{d}{\to} \mathcal{N}(0, C_j), \quad C_j = \sum_{k \ne j} \frac{\lambda_k \lambda_j}{(\lambda_j - \lambda_k)^2}\,(v_k \otimes v_k). \]

가우스 케이스의 우아함: \(\hat\lambda_j\) 의 점근 분산이 \(2\lambda_j^2\) 라는 단순한 식이 된다. 이는 다변량 가우스에서 표본 공분산 행렬의 고유값이 \(\mathcal{N}(\lambda_j, 2\lambda_j^2/N)\) 로 점근하는 결과 (Anderson, 2003) 의 함수 버전이다. 고유함수의 점근 공분산 \(C_j\) 는 다른 방향 (\(v_k\), \(k \ne j\)) 으로의 변동 합이며, 분모의 gap \((\lambda_j - \lambda_k)^2\) 가 다시 등장 — gap 이 작은 방향의 분산이 지배한다.

RT-PCR 직관: 정상 곡선들의 첫 PC 가 “평균 증폭 수준” 이고 두 번째 PC 가 “증폭 속도” 라면, 고유값 \(\lambda_1 \gg \lambda_2\) 인 경우 첫 PC 의 추정 분산은 \(2\lambda_1^2/N\) 으로 작고 안정적이지만, 비슷한 크기의 PC (\(\lambda_2 \approx \lambda_3\)) 가 있으면 그들의 고유함수가 서로 섞이기 쉬워 추정이 불안정해진다.

5 12.4 — 평균 함수 가설 검정

검정 문제

\[ H_0: \mathbb{E}[X_n] = \mu_0 \quad \text{vs} \quad H_A: \mathbb{E}[X_n] \ne \mu_0, \]

여기서 \(\mu_0\) 는 미리 지정된 결정 함수 (deterministic function).

이 단순한 문제가 함수 검정의 모든 핵심 쟁점을 노출한다 — 함수 모수의 차이 \(\hat\mu - \mu_0\) 가 무한차원 객체이므로 “최선의” 검정 통계량이 존재하지 않는다. 두 가지 자연스러운 접근이 있다.

접근 통계량 점근 분포 (under \(H_0\))
Norm \(T_{\mathrm{Norm}} = N\|\hat\mu - \mu_0\|^2\) \(\sum_{i=1}^\infty \lambda_i \chi_i^2(1)\) (가중 카이제곱)
PC \(T_{\mathrm{PC}} = N\sum_{i=1}^p \frac{\langle \hat\mu - \mu_0, \hat v_i\rangle^2}{\hat\lambda_i}\) \(\chi^2(p)\)

각 접근의 trade-off 가 본 절의 핵심이다.

6 Norm 접근 — Theorem 12.4.1

Theorem 12.4.1

가정 12.0.1 하에서:

\(H_0\) 하에서: \[ T_{\mathrm{Norm}} \overset{d}{\to} T_\infty := \sum_{i=1}^\infty \lambda_i\, \chi_i^2(1), \] \(\chi_i^2(1)\): iid 자유도 1 카이제곱.

\(H_A\) 하에서 (\(\mu^*\): 진짜 평균): \[ T_{\mathrm{Norm}} = N\|\mu^* - \mu_0\|^2 + O_P(N^{1/2}) \;\overset{P}{\to}\; \infty. \]

증명 핵심 (\(H_0\) 부분): Theorem 12.3.1 + Continuous Mapping Theorem.

  1. \(\sqrt N (\hat\mu - \mu_0) \overset{d}{\to} Z \sim \mathcal{N}(0, C)\) (under \(H_0\), \(\mu = \mu_0\)).
  2. Continuous mapping (\(x \mapsto \|x\|^2\) 가 연속): \(T_{\mathrm{Norm}} = \|\sqrt N (\hat\mu - \mu_0)\|^2 \overset{d}{\to} \|Z\|^2\).
  3. 가우스 확률 원소의 노름 제곱은 KL 전개로: \[ \|Z\|^2 = \sum_{i=1}^\infty \lambda_i N_i^2, \quad N_i \overset{iid}{\sim} \mathcal{N}(0,1). \]
  4. \(N_i^2 \sim \chi^2(1)\) 이므로 \(\|Z\|^2 = \sum \lambda_i \chi_i^2(1)\).

증명 핵심 (\(H_A\) 부분): \(\Delta = \mu^* - \mu_0 \ne 0\) 일 때: \[ N\|\hat\mu - \mu_0\|^2 = N\|\Delta\|^2 + 2\sqrt N\langle \sqrt N(\hat\mu - \mu^*), \Delta\rangle + \|\sqrt N(\hat\mu - \mu^*)\|^2. \] \(\sqrt N(\hat\mu - \mu^*) = O_P(1)\) 이므로 우변 = \(N\|\Delta\|^2 + O_P(N^{1/2}) + O_P(1) \to \infty\). 검정의 일관성 (consistency)\(H_A\) 가 참이면 \(H_0\) 를 기각할 확률이 \(1\) 로 수렴.

임계값 계산의 도전: \(T_\infty = \sum \lambda_i \chi_i^2(1)\) 의 분포는 닫힌 형태가 없다. 가능한 방법:

  1. \(\lambda_i\)\(\hat\lambda_i\) 로 치환 + 무한 합 절단 + 시뮬레이션 — 가장 흔한 방식.
  2. imhof() 함수 (R 의 CompQuadForm 패키지) — 가중 카이제곱 분포의 cdf 를 정확히 (수치적으로) 계산. 극단 꼬리 (extreme tail) 에서도 정확한 P-값 제공.
  3. Saddle-point 근사 — Davies (1980) 등의 방법.

본 정리에서 Section 8.6 (정상성 검정) 에서 만난 동일한 문제 구조 — 두 곳 모두 가중 카이제곱 분포의 분위수가 필요하다.

직관: “곡선 전체의 차이를 \(L^2\) 거리로 측정한다” — 평균 곡선이 얼마나 멀리 떨어져 있는지를 한 숫자로 요약. 단점은 임계값 계산이 비싸고 \(\lambda_i\) 추정에 의존.

7 PC 접근 — Theorem 12.4.2

다변량 통계학의 Hotelling \(T^2\) 검정의 함수 일반화. 다변량의 \(T^2\) 식:

\[ T^2 = N(\bar{\mathbf{X}} - \boldsymbol{\mu}_0)^\top \mathbf{S}^{-1} (\bar{\mathbf{X}} - \boldsymbol{\mu}_0). \]

함수에서는 \(\hat C\) 의 역 (inverse) 이 존재하지 않는다 — \(\hat C\) 의 치역이 \(N\) 차원 부분공간이라 무한차원에서 invertible 하지 않다. PC 접근의 핵심 아이디어: FPCA 로 차원 축소 후 다변량 \(T^2\) 를 적용.

정의: PC 검정 통계량

\[ T_{\mathrm{PC}} = N\sum_{i=1}^p \frac{\langle \hat\mu - \mu_0,\, \hat v_i\rangle^2}{\hat\lambda_i}. \]

왜 cross term 이 없는가: 표본 평균의 사영 \(\langle \hat\mu, \hat v_i\rangle\) 들은 비상관 (uncorrelated). 식 (12.8): \[ \mathrm{Cov}(\langle \hat\mu, v_i\rangle, \langle \hat\mu, v_j\rangle) = N^{-1}\lambda_i \mathbf{1}_{i=j}. \] 이는 \(\hat\mu\) 의 점근 공분산 연산자 \(C/N\) 의 EFPC 사영 식에서 나온다. EFPC 가 자연스럽게 \(T^2\) 의 cross term 을 0 으로 만든다 — 다변량에서 PC 회귀 후 다중공선성이 사라지는 것과 같은 효과.

Theorem 12.4.2

\(X_1, \dots, X_N\) 이 iid 제곱적분 가능하고 첫 \(p\) 개 고유값이 단순할 때:

\(H_0\) 하에서: \[ T_{\mathrm{PC}} \overset{d}{\to} \chi^2(p). \]

\(H_A\) 하에서 (단, \(\langle \mu^*, v_i\rangle \ne 0\)\(i \le p\) 가 적어도 하나 존재): \[ T_{\mathrm{PC}} = N\|\Gamma_p(\Delta)\|^2 + O_P(N^{1/2}) \;\overset{P}{\to}\; \infty, \] \[ \Gamma_p(x) = \sum_{i=1}^p \lambda_i^{-1/2}\langle x, v_i\rangle\,v_i. \]

증명 핵심 (\(H_0\)): Theorem 12.3.1 + Theorem 12.2.1 + Slutsky + Continuous Mapping.

\(\sqrt N (\hat\mu - \mu_0) \Rightarrow Z \sim \mathcal{N}(0, C)\), \(\hat v_i \to v_i\), \(\hat\lambda_i \to \lambda_i\) 모두 결합: \[ T_{\mathrm{PC}} \overset{d}{\to} \sum_{i=1}^p \frac{\langle Z, v_i\rangle^2}{\lambda_i}. \] \(\langle Z, v_i\rangle / \sqrt{\lambda_i}\) 가 표준 정규이고 (KL 전개 + EFPC 사영 분산 \(\lambda_i\)), \(i \ne j\) 면 비상관이므로 \(\sum\) 은 자유도 \(p\) 카이제곱.

\(H_A\) 부분: 다음 분해: \[ T_{\mathrm{PC}} = N\sum_{i=1}^p \frac{\langle \hat\mu - \mu^* + \Delta, \hat v_i\rangle^2}{\hat\lambda_i}. \] 전개하면 \(N\|\Gamma_p(\Delta)\|^2 + O_P(N^{1/2})\), \(\Gamma_p\) 가 위처럼 정의된 첫 \(p\) EFPC 로의 정규화 사영. \(\Delta\)\(v_1, \dots, v_p\) 와 평행 성분이 있으면 \(\Gamma_p(\Delta) \ne 0\) 이고 통계량이 \(\infty\) 로 발산 → 일관성.

Hotelling \(T^2\) 와의 직접 연결: \(\hat C\) 의 Moore-Penrose pseudo-inverse 를 첫 \(p\) 개 EFPC 로 정의하면: \[ \hat C_p^+ := \sum_{j=1}^p \hat\lambda_j^{-1}\,\hat v_j \otimes \hat v_j. \] 그러면 \[ N\langle \hat C_p^+(\hat\mu - \mu_0),\, \hat\mu - \mu_0\rangle = N\sum_{j=1}^p \frac{\langle \hat\mu - \mu_0, \hat v_j\rangle^2}{\hat\lambda_j} = T_{\mathrm{PC}}. \] \(T_{\mathrm{PC}}\) 는 함수 Hotelling \(T^2\) 의 정확한 표현 — 무한차원에서 역행렬이 안 되므로 유한 차원으로 절단한 pseudo-inverse 로 우회 한 것.

직관: “함수 차이를 첫 \(p\) 개 주축 (EFPC) 으로 사영해 다변량 검정으로 환원한다.” 차원이 \(p\) 로 명확하므로 임계값이 표준 \(\chi^2(p)\) — 임계값 계산이 단순하고 \(\lambda_i\) 추정 의존성이 없다.

\(p\) 선택의 중요성: - \(p\) 가 너무 작으면 \(\Delta\) 의 일부 정보가 손실 (\(\langle \Delta, v_i\rangle\), \(i > p\) 가 무시됨) → 검정력 손실. - \(p\) 가 너무 크면 작은 \(\hat\lambda_j\) 가 분모로 들어와 통계량이 불안정 (작은 EFPC 의 추정 잡음이 커짐). - 권장: CPV 85% 또는 작은 한 자릿수 (\(p = 3 \sim 5\)).

8 Norm vs PC — 검정력 비교

두 통계량의 점근 발산 속도: \[ T_{\mathrm{Norm}} \approx N\|\Delta\|^2, \qquad T_{\mathrm{PC}} \approx N\|\Gamma_p(\Delta)\|^2. \]

검정력은 \(\|\Delta\|^2\) vs \(\|\Gamma_p(\Delta)\|^2\) 의 상대 크기에 의해 결정된다.

시나리오 \(\Delta\) 형태 우월한 접근 이유
부드러운 alternative \(\Delta\) 가 첫 몇 EFPC 의 선형 결합 PC \(\Gamma_p(\Delta)\)\(\Delta\) 의 거의 전체 정보 보존, 차원 축소로 검정력 집중
거친 (high-frequency) alternative \(\Delta\) 가 후순위 EFPC 에 큰 성분 Norm PC 가 \(i > p\) 정보를 버려 검정력 손실
알 수 없음 시뮬레이션 비교 권장 사전 정보 없이는 예측 불가

일반 권장 (Kokoszka & Reimherr 2017): 첫 몇 PC 가 분산의 큰 비율을 설명하면 (예: \(p = 3\) 으로 80% 이상) PC 접근, 그 외에는 norm 접근. 둘 다 시도해 비교하는 것이 안전.

다변량과의 차이: 다변량 Hotelling \(T^2\) 는 차원이 고정 (\(p\)) 이라 PC 절단이 없지만, 함수에서는 차원이 \(\infty\) 라 절단이 본질적이다. PC 접근 = 함수의 본질적 무한차원성을 다변량 차원 축소로 우회 하는 전략이다.

9 R 시뮬레이션 — Norm vs PC 검정력 비교 (Kokoszka 12.4 의 simulation study)

Kokoszka 의 시뮬레이션 (Table 12.1) 을 재현한다.

9.1 Step 1: 데이터 생성 (Matérn process)

library(MASS)  # mvrnorm

generate_matern <- function(N, T_grid, var = 1, scale = 1/4, smooth = 5/2) {
  # Matern covariance kernel
  d <- as.matrix(dist(T_grid))
  rho <- ifelse(d == 0, 1, {
    arg <- sqrt(2 * smooth) * d / scale
    (2^(1 - smooth) / gamma(smooth)) * arg^smooth * besselK(arg, smooth)
  })
  diag(rho) <- 1
  Sigma <- var * rho

  mvrnorm(N, mu = rep(0, length(T_grid)), Sigma = Sigma)
}

# 평균 함수: c1 * sqrt(2) * sin((k-1/2) pi t)
mu_alt <- function(T_grid, c1, k) {
  c1 * sqrt(2) * sin((k - 1/2) * pi * T_grid)
}

9.2 Step 2: Norm 통계량 (가중 카이제곱) 검정

test_norm <- function(X, mu0, alpha = 0.10, R = 5000, p_trunc = 20) {
  N <- nrow(X)
  T_grid_step <- 1 / (ncol(X) - 1)

  mu_hat <- colMeans(X)
  T_norm <- N * sum((mu_hat - mu0)^2) * T_grid_step

  # H0 하의 임계값 — sum lambda_i chi^2_i(1) 시뮬레이션
  X_centered <- scale(X, center = mu_hat, scale = FALSE)
  C_hat <- crossprod(X_centered) / N * T_grid_step
  lambda_hat <- pmax(eigen(C_hat, symmetric = TRUE)$values, 0)[1:p_trunc]

  null_dist <- rowSums(matrix(rchisq(R * p_trunc, df = 1), nrow = R) %*% diag(lambda_hat))
  c_alpha <- quantile(null_dist, 1 - alpha)

  list(stat = T_norm, crit = c_alpha, reject = T_norm > c_alpha)
}

9.3 Step 3: PC 통계량 (χ²(p)) 검정

test_pc <- function(X, mu0, alpha = 0.10, p = 3) {
  N <- nrow(X)
  T_grid_step <- 1 / (ncol(X) - 1)

  mu_hat <- colMeans(X)
  X_centered <- scale(X, center = mu_hat, scale = FALSE)
  C_hat <- crossprod(X_centered) / N * T_grid_step

  ev <- eigen(C_hat, symmetric = TRUE)
  v_hat <- ev$vectors[, 1:p] / sqrt(T_grid_step)  # L^2 정규화
  lambda_hat <- pmax(ev$values[1:p], 1e-10)

  diff <- mu_hat - mu0
  proj <- as.numeric(crossprod(v_hat, diff) * T_grid_step)
  T_pc <- N * sum(proj^2 / lambda_hat)

  c_alpha <- qchisq(1 - alpha, df = p)

  list(stat = T_pc, crit = c_alpha, reject = T_pc > c_alpha)
}

9.4 Step 4: 검정력 비교 — Table 12.1 재현

set.seed(123)
N <- 100
T_grid <- seq(0, 1, length.out = 50)

c1_values <- c(0, 0.1, 0.2, 0.3)  # alternative size
k_values <- c(1, 2, 5)             # alternative frequency
n_rep <- 200                        # Kokoszka 책은 1000, 빠른 시뮬용으로 200

results <- expand.grid(c1 = c1_values, k = k_values)
results$norm_rate <- NA
results$pc1_rate <- NA
results$pc3_rate <- NA

for (i in seq_len(nrow(results))) {
  c1 <- results$c1[i]; k <- results$k[i]
  mu_true <- mu_alt(T_grid, c1, k)
  mu0 <- rep(0, length(T_grid))

  rejs <- replicate(n_rep, {
    X <- generate_matern(N, T_grid)
    X <- sweep(X, 2, mu_true, "+")  # 평균 추가
    c(test_norm(X, mu0)$reject,
      test_pc(X, mu0, p = 1)$reject,
      test_pc(X, mu0, p = 3)$reject)
  })
  results$norm_rate[i] <- mean(rejs[1, ])
  results$pc1_rate[i]  <- mean(rejs[2, ])
  results$pc3_rate[i]  <- mean(rejs[3, ])
}
print(results)

예상 결과 패턴 (Kokoszka Table 12.1):

\(c_1\) \(k\) 평균 함수의 매끄러움 Norm vs PC 우열
0 임의 \(H_0\) — empirical size \(\approx \alpha\) 둘 다 \(\alpha\) 근방
0.2~0.3 1 매우 부드러움 (첫 EFPC 와 정렬) PC-1 이 가장 강력
0.2~0.3 2~3 보통 PC-3 와 Norm 비슷
0.2~0.3 \(\ge 5\) 거침 (high frequency) Norm 이 우월 — PC-3 가 정보 손실

해석: \(k = 1\) (alternative 가 첫 EFPC 와 평행) 이면 PC-1 으로 충분하고 PC-3 보다 강력 — 잡음을 적게 본다. \(k \ge 5\) (alternative 가 후순위 방향) 이면 PC 가 그 정보를 버려 검정력 폭락, Norm 만이 살아남음.

9.5 Step 5: H_0 하의 empirical size 확인

# c1 = 0 — empirical size 가 alpha = 0.10 근방에 있어야
size_norm <- mean(replicate(500, {
  X <- generate_matern(N, T_grid)
  test_norm(X, rep(0, length(T_grid)))$reject
}))
size_pc <- mean(replicate(500, {
  X <- generate_matern(N, T_grid)
  test_pc(X, rep(0, length(T_grid)), p = 3)$reject
}))
cat(sprintf("Empirical size — Norm: %.3f, PC-3: %.3f (target 0.10)\n", size_norm, size_pc))

해석: 두 size 모두 \(0.10\) 근방 (\(\pm 0.01\)) 이어야 검정이 정확히 보정 (calibrated) 되어 있다. 큰 편차가 있으면 임계값 시뮬레이션 횟수 (\(R\)) 부족이거나 절단 차원 (\(p_{\mathrm{trunc}}\)) 부족.

10 핵심 정리 표

결과 정리 점근 분포 / 핵심 식 가정
표본 평균 정규성 12.3.1 \(\sqrt N (\hat\mu - \mu) \Rightarrow \mathcal{N}(0, C)\) \(\mathbb{E}\|X\|^2 < \infty\)
공분산 연산자 정규성 12.3.1 \(\sqrt N (\hat C - C) \Rightarrow \mathcal{N}(0, \Gamma)\) \(\mathbb{E}\|X\|^4 < \infty\)
고유값 점근 전개 12.3.2 \(\sqrt N (\hat\lambda_j - \lambda_j) = \langle Z_N, v_j^{\otimes 2}\rangle + o_P(1)\) + \(\lambda_j\) 단순
고유함수 점근 전개 12.3.2 \(\sqrt N (\hat v_j - v_j) = T_{jN} + o_P(1)\) 동일
가우스 고유값 분산 12.3.2/Cor.2 \(\mathrm{Var}(\sqrt N \hat\lambda_j) \to 2\lambda_j^2\) 가우스 + 단순
Norm 검정 (\(H_0\)) 12.4.1 \(T_{\mathrm{Norm}} \Rightarrow \sum \lambda_i \chi_i^2(1)\) iid + 12.0.1
Norm 검정 (\(H_A\)) 12.4.1 \(T_{\mathrm{Norm}} \to \infty\) \(\Delta \ne 0\)
PC 검정 (\(H_0\)) 12.4.2 \(T_{\mathrm{PC}} \Rightarrow \chi^2(p)\) + 첫 \(p\) 단순
PC 검정 (\(H_A\)) 12.4.2 \(T_{\mathrm{PC}} \to \infty\) \(\langle \mu^*, v_i\rangle \ne 0\), \(i \le p\)

한 문장 요약: 12.3 절은 12.1~12.2 의 일치성을 점근 정규성으로 격상하고, 12.4 절은 그 결과를 평균 함수 검정 두 가지 (\(T_{\mathrm{Norm}}\): 가중 카이제곱·계산 비싸지만 일반적 / \(T_{\mathrm{PC}}\): 단순 카이제곱·smooth alternative 에 강력) 로 운영한다.

11 응용 분야

분야 12.3~12.4 결과의 활용
임상시험 두 처치 그룹의 평균 곡선 비교 (two-sample 확장: \(\hat\mu_A - \hat\mu_B\) 의 점근 정규성으로 동일 검정 구조)
RT-PCR 정상 vs 비정상 곡선의 평균 비교, 억제제 농도 효과 검정
환경 (기온) 기준 시기 vs 현재의 평균 일별 기온 곡선 차이 검정 (기후 변화 신호 탐지)
금융 (intraday) 평균 일중 수익률 곡선 = 0 인지 (Ch.12.6 BOA 적용의 토대)
Neuroimaging DTI/fMRI 그룹 간 평균 곡선 비교 + 다중 비교 (다음 12.5 절의 동시 신뢰 대역으로 확장)

RT-PCR 실무 직관: “정상 곡선 100 개의 평균이 알려진 reference \(\mu_0\) 와 같은가?” 검정. - \(T_{\mathrm{PC}}\) (\(p=3\)): 빠른 계산, \(\chi^2(3)\) 임계값. 정상/이상 그룹의 차이가 첫 몇 PC (전체 진폭, 증폭 속도) 에 집중되면 강력. - \(T_{\mathrm{Norm}}\): \(\hat\lambda_i\) 추정 + 시뮬레이션 필요. 차이가 미세하지만 곡선 전체에 퍼져 있으면 강력. - 둘 다 시도해 일관된 결론이면 신뢰 ↑.

12 다음 절 — 12.5 동시 신뢰 대역

12.4 의 검정 통계량은 “평균 곡선이 같은가?” 의 binary 답만 준다. 12.5 의 동시 신뢰 대역 (simultaneous confidence band) 은 평균 곡선의 추정 불확실성을 함수 전 구간 띠로 시각화한다 — 검정과 동일한 점근 도구 (함수 CLT + KL 전개) 를 사용하지만 출력이 띠 형태다. Ch.12 overview 글의 동시 신뢰 대역 섹션 참조.

13 관련 주제

선행 지식

본 글의 대상 (Ch.12.3~12.4)

관련 — 검정과 신뢰 대역

시계열 확장

Hotelling \(T^2\) 의 다변량 토대

  • 다변량 통계학 교재 (Anderson, 2003 / Johnson & Wichern, 2007 Ch.5) — Hotelling \(T^2\) 와 그 확장 패턴

14 참고문헌

  • Kokoszka, P., & Reimherr, M. (2017). Introduction to Functional Data Analysis, Sections 12.3, 12.4. Chapman & Hall/CRC.
  • Kokoszka, P., & Reimherr, M. (2013). Asymptotic normality of the principal components of functional time series. — Theorem 12.3.2 의 원본.
  • Hall, P., & Hosseini-Nasab, M. (2006). On properties of functional principal components analysis. — EFPC 점근 전개의 시초.
  • Davies, R. B. (1980). The distribution of a linear combination of \(\chi^2\) random variables. — imhof() 함수의 알고리즘.
  • Anderson, T. W. (2003). An Introduction to Multivariate Statistical Analysis (3rd ed.). — 다변량 표본 공분산 행렬의 점근 분포.
  • Horváth, L., & Kokoszka, P. (2012). Inference for Functional Data with Applications. — 더 복잡한 검정 문제.

Subscribe

Enjoy this blog? Get notified of new posts by email: