FDA 5.5~5.6 — FPCA 기반 핵 추정과 효과 없음 카이제곱 검정

두 함수의 EFPC 로 이변량 핵 ψ(t,s) 를 분해하고, 적분 연산자 관계로 H₀: ψ=0 을 χ²_{pq} 로 검정

Kokoszka & Reimherr (2017) Ch.5.5~5.6 의 핵심을 다룬다. 함수-on-함수 회귀 모형에서 결정적 기저 대신 X·Y 의 EFPC 를 기저로 사용한 핵 분해 ψ(t,s) = Σ (σ_ℓk/λ_ℓ) u_k(t) v_ℓ(s) 의 유도와 추정 (5.5), 그리고 H_0: ψ=0 의 카이제곱 검정 — 적분 연산자 관계 λ_i Ψ(v_i) = Δ(v_i) 를 활용한 통계량 T̂N(p,q) ~ χ²{pq} 와 알고리즘 5.6.1 (5.6) 을 다룬다. 캐나다 기온-강수 데이터 적용 코드를 포함한다.

Statistics
Functional Data Analysis
저자

Kwangmin Kim

공개

2026년 05월 07일

1 두 절의 역할

이 포스트의 범위
주제 핵심 도구
5.5 FPCA 기반 핵 ψ(t,s) 의 분해와 추정 두 함수의 KL 전개 + 점수 공분산
5.6 효과 없음 검정 H₀: ψ=0 적분 연산자 + χ²_{pq} 분포

5.5 는 함수-on-함수 회귀의 핵 추정에 대한 두 번째 접근 — 5.3 의 결정적 기저(B-spline, Fourier) + 라플라시안 벌점 대신, X 와 Y 자체의 데이터 기반 기저(EFPC) 를 사용. 핵 ψ(t,s) 가 두 EFPC 시스템으로 분해되며, 분해 계수가 점수 공분산의 단순한 비율로 표현된다.

5.6 은 5.5 에서 구축한 framework 위에서 자연스럽게 따라오는 추론 도구 — “회귀자 X 가 반응 Y 에 정말 영향을 주는가?” 의 가설을 카이제곱 검정으로 평가. 적합 전 사전 검증, 또는 적합 후 사후 정당화의 표준 절차이다.

두 절의 연결: 5.5 의 분해 식이 검정 통계량의 분포를 결정한다 — 추정과 검정이 같은 수학 구조를 공유.


2 FPCA 기반 핵 추정의 동기

2.1 5.3 접근의 한계

5.3 의 양방향 결정적 기저는 일반적이고 자동화된(pffr) 도구를 제공하지만 다음 한계가 있다.

  • 모수의 수가 곱셈적 폭발\(G = M_t \times M_s\) 가 수백 개에 이름. 작은 표본에서 과적합 위험.
  • 기저가 데이터와 무관 — B-spline 이나 Fourier 가 진짜 핵의 형태와 잘 맞지 않으면 비효율적.
  • 벌점 모수 선택의 의존성 — REML 이 자동화하지만 결과가 벌점 형태에 민감.

2.2 FPCA 접근의 핵심 아이디어

\(\psi(t, s)\) 를 X 의 변동이 큰 방향과 Y 의 변동이 큰 방향의 결합으로 분해한다.

X 의 EFPC \(\{v_\ell\}\) 와 Y 의 EFPC \(\{u_k\}\) 가 각각 \(L^2\) 의 기저를 이루므로, 텐서 곱 \(\{u_k(t) v_\ell(s)\}\)\(L^2(\mathcal{T} \times \mathcal{S})\) 의 기저. 이 기저가 데이터의 변동 방향과 정렬되어 있어 적은 항으로도 정확한 표현이 가능하다.

2.3 비유: 음향 등화기 (Equalizer)

음향 시스템에서 입력 음악을 베이스·중음·고음으로 분해(X 의 FPC), 출력도 비슷하게 분해(Y 의 FPC), 그 사이의 변환 강도를 슬라이더로 조절. 모든 슬라이더의 행렬이 시스템의 응답 특성 — 즉 핵 \(\psi(t, s)\).

데이터 기반 EFPC 를 쓰는 것은 “음악의 본질적 주파수 대역에 슬라이더를 배치” 하는 것 — 그 음악에 가장 효율적인 좌표계.


3 사전 작업: 영 절편으로의 환원

3.1 핵심 관찰

핵 추정 문제를 단순화하기 위해 평균 기여를 제거한다. 모형 (5.10) 의 양변에 기댓값:

\[ E[Y_i(t)] = \alpha(t) + \int \psi(t, s) E[X_i(s)] \, ds, \]

\(\mu_Y(t) = \alpha(t) + \int \psi(t, s) \mu_X(s) \, ds\). 이를 빼면:

\[ Y_i(t) - \mu_Y(t) = \int \psi(t, s) \{X_i(s) - \mu_X(s)\} \, ds + \varepsilon_i(t). \]

3.2 표본 평균 추정

밀집(dense) 관측 또는 평활화된 함수 객체의 경우:

\[ \widehat{\mu}_Y(t) = \frac{1}{N} \sum_{i=1}^{N} Y_i(t), \quad \widehat{\mu}_X(t) = \frac{1}{N} \sum_{i=1}^{N} X_i(t). \]

희소 관측의 경우는 Ch.7 의 PACE 같은 별도 추정량 사용.

3.3 영 평균 모형

평균을 차감한 곡선 \(X_i^c, Y_i^c\) 로 작업:

\[ Y_i^c(t) = \int \psi(t, s) X_i^c(s) \, ds + \varepsilon_i(t), \quad i = 1, 2, \ldots, N. \tag{5.14} \]

추정된 \(\widehat{\psi}\) 로부터 절편 회복:

\[ \widehat{\alpha}(t) = \widehat{\mu}_Y(t) - \int \widehat{\psi}(t, s) \widehat{\mu}_X(s) \, ds. \]

3.4 직관: 평균 차감의 의미

함수 회귀에서 평균 차감은 회귀자 곡선에서 “공통 패턴” 을 제거하는 작업. 모든 단위가 공유하는 부분(평균 함수) 을 빼면, 단위 사이의 차이 패턴 만 남는다 — 회귀계수가 추정해야 하는 진짜 신호.

이는 다변량 회귀에서 회귀자를 표준화하기 전 평균을 차감하는 것과 같은 동기 — 상수 효과를 절편으로 분리.


4 핵의 EFPC 분해

4.1 모집단 KL 전개

평균이 0 인 \(X, Y\) 에 대해:

\[ X(s) = \sum_{i=1}^{\infty} \xi_i v_i(s), \quad Y(t) = \sum_{j=1}^{\infty} \zeta_j u_j(t), \tag{5.16} \]

여기서 \(v_i\)\(X\) 의 FPC, \(u_j\)\(Y\) 의 FPC, \(\xi_i = \langle X, v_i \rangle\), \(\zeta_j = \langle Y, u_j \rangle\) 는 점수.

4.2 핵의 기저 표현

\(\{v_i\}\)\(L^2(\mathcal{S})\) 의 기저, \(\{u_j\}\)\(L^2(\mathcal{T})\) 의 기저이므로 텐서 곱 \(\{u_k(t) v_\ell(s)\}\)\(L^2(\mathcal{T} \times \mathcal{S})\) 의 기저. \(\iint \psi^2 \, dt \, ds < \infty\) 가정 하에 \(\psi\) 도 이 기저로 전개:

\[ \psi(t, s) = \sum_{k = 1}^{\infty} \sum_{\ell = 1}^{\infty} \psi_{k\ell} u_k(t) v_\ell(s). \]

문제는 계수 \(\psi_{k\ell}\) 가 무엇인가.

4.3 분해 계수의 유도

식 (5.15) \(Y(t) = \int \psi(t, s) X(s) \, ds + \varepsilon(t)\) 에 KL 전개 (5.16) 와 핵 전개를 대입:

\[ \sum_{j} \zeta_j u_j(t) = \int \left( \sum_{k, \ell} \psi_{k\ell} u_k(t) v_\ell(s) \right) \left( \sum_{i} \xi_i v_i(s) \right) ds + \varepsilon(t). \]

내부 적분에서 \(\{v_i\}\) 의 정규직교성 \(\int v_\ell(s) v_i(s) \, ds = \delta_{\ell i}\) 사용:

\[ \sum_{j} \zeta_j u_j(t) = \sum_{k} \sum_{i} \psi_{ki} \xi_i u_k(t) + \varepsilon(t). \]

양변에 \(u_\ell(t)\) 를 곱하고 \(t\) 에 대해 적분, \(\{u_k\}\) 의 정규직교성:

\[ \zeta_\ell = \sum_{i} \psi_{\ell i} \xi_i + \int u_\ell(t) \varepsilon(t) \, dt. \tag{5.18} \]

4.4 핵심 식

\(\xi_k = \langle X, v_k \rangle\)\(\int u_\ell \varepsilon \, dt\) 와 독립(둘 다 평균 0 이므로 곱의 기대값 0), 점수의 비상관성 \(E[\xi_k \xi_i] = \delta_{ki} \lambda_k\) 사용:

\[ E[\xi_k \zeta_\ell] = \sum_{i} \psi_{\ell i} E[\xi_k \xi_i] = \psi_{\ell k} E[\xi_k^2] = \psi_{\ell k} \lambda_k. \]

따라서 \(\psi_{\ell k} = E[\xi_k \zeta_\ell] / \lambda_k\). 인덱스를 다시 정리하면:

\[ \boxed{ \psi_{k\ell} = \frac{E[\xi_\ell \zeta_k]}{E[\xi_\ell^2]} = \frac{\sigma_{\ell k}}{\lambda_\ell} } \tag{5.17} \]

여기서 \(\sigma_{\ell k} = E[\xi_\ell \zeta_k]\) (입력·출력 점수의 공분산), \(\lambda_\ell\) (\(X\)\(\ell\) 번째 고유값).

4.5 직관 1: 단순 회귀의 함수 일반화

이 공식의 모양:

\[ \psi_{k\ell} = \frac{\text{Cov}(\xi_\ell, \zeta_k)}{\text{Var}(\xi_\ell)}. \]

이는 단순 선형 회귀의 기울기 공식. \(\zeta_k\)\(\xi_\ell\) 에 회귀한 결과의 기울기 — 표준 다변량 회귀의 가장 단순한 1차원 형태.

함수 회귀가 무한 개의 1차원 회귀로 분해된다는 사실이 이 분해의 본질적 단순성 이다.

4.6 직관 2: 좌표계가 자동 정렬됨

다변량 회귀에서 회귀자가 다공선이면 \((\mathbf{X}^T \mathbf{X})^{-1}\) 이 불안정. PCR(Principal Component Regression) 은 회귀자를 PC 로 변환하여 다공선성을 해결한다.

함수-on-함수 회귀에서 무한차원 다공선성이 본질적인데, EFPC 좌표계를 쓰면 다공선성이 자동 분해 된다 — 점수들이 비상관(uncorrelated) 이므로 \((\mathbf{X}^T \mathbf{X})^{-1}\) 이 대각행렬이 되고, 회귀가 무한 개의 독립 1차원 회귀로 환원.

4.7 비유: 자연 좌표계

지구상의 모든 점을 위도/경도로 표시할 수도 있고, X/Y/Z 직교좌표로 표시할 수도 있다. 위도/경도는 지구의 형태(타원체) 에 적응한 자연 좌표계 — 지표면 거리 계산이 직교좌표보다 자연스럽다.

함수 회귀에서 EFPC 좌표계는 데이터의 본질적 형태에 적응한 자연 좌표계 — B-spline 이나 Fourier 같은 외부 기저보다 적합.


5 표본 추정량

5.1 점수 공분산의 표본 추정

\(\sigma_{\ell k} = E[\xi_\ell \zeta_k]\) 를 표본 평균으로 추정:

\[ \widehat{\sigma}_{\ell k} = \frac{1}{N} \sum_{i=1}^{N} \langle X_i, \widehat{v}_\ell \rangle \langle Y_i, \widehat{u}_k \rangle. \]

5.2 핵의 추정량 (식 5.19)

\[ \boxed{ \widehat{\psi}(t, s) = \sum_{k=1}^{q} \sum_{\ell=1}^{p} \frac{\widehat{\sigma}_{\ell k}}{\widehat{\lambda}_\ell} \widehat{u}_k(t) \widehat{v}_\ell(s) } \]

여기서:

  • \(\widehat{v}_\ell, \widehat{\lambda}_\ell\)\(X\)\(\ell\) 번째 추정 EFPC·고유값.
  • \(\widehat{u}_k\)\(Y\)\(k\) 번째 추정 EFPC.
  • \(p, q\) — 절단 차원 (X 의 PC 수, Y 의 PC 수).
  • \(\widehat{\sigma}_{\ell k}\) — 표본 점수 공분산.

5.3 절단 차원 선택

\(p, q\) 는 누적 분산 비율(CPV) 또는 스크리 도표로 결정. 일반적 경험 규칙:

  • \(X\) 의 변동의 85% 를 설명하는 첫 \(p\) 개 PC.
  • \(Y\) 의 변동의 85% 를 설명하는 첫 \(q\) 개 PC.

도메인이나 표본 크기에 따라 임계값(85%, 90%, 95%) 을 조정.

5.4 직관: 작은 λ_ℓ 의 위험

분해 식에서 \(\widehat{\lambda}_\ell\) 이 분모에 등장 — 작은 λ 의 PC 는 추정량을 폭발시킨다. 이는 다변량 회귀의 다공선성 문제가 PC 좌표계에서 표면화된 것.

해결: 작은 λ 의 PC 를 절단하여 분모 0 을 회피. 이것이 “\(p\) 를 적절히 작게 잡아야 하는 이유” 이다 — 분산 설명력이 작은 PC 는 신호 대 잡음비가 낮아 회귀에서 노이즈를 증폭한다.

이는 5.3 의 거칠기 벌점이 작은 λ 방향을 자동으로 축소하는 것과 같은 동기 — 두 접근 모두 작은 분산 방향을 통제 하지만 방법이 다르다 (절단 vs 비례 축소).


6 응용 사례: 캐나다 기온 → 강수량

6.1 데이터 배경

fda 패키지의 daily 데이터셋 — 캐나다 35 개 관측소의 일평균 기온/강수량 곡선.

  • \(X_i(t)\)\(i\) 번째 관측소의 일평균 기온 곡선.
  • \(Y_i(t)\) — 일평균 강수량 곡선.
  • 두 곡선 모두 \(t \in \{1, \ldots, 365\}\).

6.2 모형

\[ Y_i(t) = \alpha(t) + \int \psi(t, s) X_i(s) \, ds + \varepsilon_i(t). \]

질문: “어느 시점의 기온이 어느 시점의 강수량에 영향을 주는가?

6.3 직관: 기온-강수 관계의 물리학

따뜻한 공기가 더 많은 수증기를 운반하므로 여름 강수가 겨울보다 많다. 그러나 단순한 동시(同時) 관계뿐만 아니라:

  • 시간 지연 효과 — 봄의 기온 상승이 여름 강수를 좌우.
  • 누적 효과 — 장기 기온 추세가 강수 패턴을 형성.

\(\psi(t, s)\) 는 이런 모든 시간 관계를 한 번에 표현. \(\widehat{\psi}(t_0, s_0)\) 의 큰 값은 “\(s_0\) 의 기온이 \(t_0\) 의 강수에 강한 영향” 을 의미.

6.4 코드: FPCA 기반 핵 추정

library(fda)
data(daily)

precav <- daily$precav
tempav <- daily$tempav
daytime <- (1:365) - 0.5
dayrange <- c(0, 365)
dayperiod <- 365

# 1. Fourier 기저 + harmonic acceleration penalty 로 곡선 평활
daybasis <- create.fourier.basis(dayrange, 365)
Lcoef <- c(0, (2 * pi / dayperiod)^2, 0)
harmaccelLfd <- vec2Lfd(Lcoef, dayrange)
lambda <- 1e6
fdParobj <- fdPar(daybasis, harmaccelLfd, lambda)

precfd <- smooth.basis(daytime, precav, fdParobj)$fd
tempfd <- smooth.basis(argvals = daytime, tempav, fdParobj)$fd

# 2. 평균 차감 (식별성 위한 영 절편 환원)
precfd.c <- center.fd(precfd)
tempfd.c <- center.fd(tempfd)

# 3. EFPC 추정 — X 는 4 개, Y 는 6 개
prec.pca <- pca.fd(precfd.c, nharm = 6)   # Y 의 EFPC
temp.pca <- pca.fd(tempfd.c, nharm = 4)   # X 의 EFPC

# 4. 점수 공분산 행렬: sigma_{ell k}
sigmas <- t(temp.pca$scores) %*% prec.pca$scores   # 4 x 6

# 5. 분해 계수: psi_{k ell} = sigma_{ell k} / lambda_ell
cs <- diag(1 / temp.pca$values[1:4]) %*% sigmas    # 4 x 6

# 6. beta(t,s) 의 기저 표현
beta.coefs <- temp.pca$harmonics$coefs %*% cs %*% t(prec.pca$harmonics$coefs)
beta.bifd <- bifd(beta.coefs,
                  sbasisobj = temp.pca$harmonics$basis,
                  tbasisobj = prec.pca$harmonics$basis)

# 7. (Problem 5.13 참조) bifd 객체를 시각화하는 함수 적용
# plot(beta.bifd, ...) — persp 또는 contour 그림

6.5 결과 해석의 패턴

\(\widehat{\psi}(t, s)\) 의 표면을 시각화하면:

  • 양의 영역 — 기온 증가가 강수 증가를 유발하는 (s, t) 조합. 보통 여름-여름 또는 봄-여름.
  • 음의 영역 — 기온 증가가 강수 감소를 유발. 사막 효과나 건조한 기후 패턴.
  • 0 에 가까운 영역 — 영향 없음. 보통 기온과 강수의 시간차가 큰 경우.

캐나다 기온-강수 데이터에서는 일반적으로 “기온 상승의 영향이 같은 시점 또는 약간 이후의 강수에 가장 강하게 나타남” 패턴.

6.6 직관: EFPC 분해의 효율성

35 개 관측소 × 365 시점이라는 큰 데이터에서, 4 + 6 = 10 개 EFPC 점수만으로 핵을 추정한다. 모수 수가 24 (\(4 \times 6\)) 에 불과 — 5.3 의 결정적 기저(예: 30 × 30 = 900 모수) 보다 훨씬 절약.

이것이 가능한 이유는 데이터에 강한 주성분 구조(연주기) 가 있기 때문 — 기온/강수의 가장 중요한 변동이 첫 몇 PC 에 집중. 이런 구조가 없는 데이터에서는 5.3 접근이 더 적합할 수 있다.


7 효과 없음 검정

7.1 검정 문제

함수-on-함수 모형 (5.15) \(Y(t) = \int \psi(t, s) X(s) \, ds + \varepsilon(t)\) 에서:

\[ H_0: \psi(t, s) = 0 \quad \text{vs.} \quad H_A: \psi(t, s) \neq 0. \]

\(\psi\)\(L^2(\mathcal{T} \times \mathcal{S})\) 의 원소이므로 \(H_0\)\(\iint \psi^2 = 0\) 와 동치 — 거의 모든 \((t, s)\) 에서 \(\psi = 0\).

7.2 직관: 검정의 의미

회귀자 X 가 반응 Y 에 어떤 선형 효과도 주지 않는가?

다변량 회귀의 \(H_0: \boldsymbol{\beta} = \mathbf{0}\) (전 회귀자 일괄 효과 없음) 의 함수 일반화. 유의하면 “X 가 Y 의 변동을 일부 설명한다” 는 증거.

이 검정은 적합 전에 사전 검증 또는 적합 후에 모형 정당화의 도구로 쓰인다. 유의하지 않으면 “이 모형 자체가 의미 없을 수 있음” 을 의미하므로, 도메인 지식으로 비선형 항이나 추가 회귀자를 검토하는 신호.


8 검정 통계량의 동기

8.1 적분 연산자의 도입

표본 가정: \((Y_i, X_i, \varepsilon_i)\)\((Y, X, \varepsilon)\) 의 iid 복제, \(\{\varepsilon_i\}\)\(\{X_i\}\) 와 독립, 모든 함수가 제곱적분.

세 연산자 정의:

\[ C(x) = E[\langle X, x \rangle X], \quad \Gamma(x) = E[\langle Y, x \rangle Y], \quad \Delta(x) = E[\langle X, x \rangle Y]. \]

연산자 의미
\(C\) \(X\) 의 공분산 연산자 — 자기 변동
\(\Gamma\) \(Y\) 의 공분산 연산자 — 자기 변동
\(\Delta\) \(X\)-\(Y\) 의 교차 공분산 연산자 — 두 함수 사이 변동

각각의 고유 분해:

\[ C(v_i) = \lambda_i v_i, \quad \Gamma(u_j) = \gamma_j u_j. \]

(여기서 \(\gamma_j\)\(Y\) 의 고유값으로, 5.3 의 \(\boldsymbol{\gamma}\) 와는 다른 객체이다 — 표기 충돌 주의.)

8.2 핵심 관계식 (식 5.20)

\(\Psi\) 가 핵 \(\psi\) 의 적분 연산자일 때:

\[ \lambda_i \Psi(v_i) = \Delta(v_i). \tag{5.20} \]

8.3 식 (5.20) 의 유도 직관

모형 \(Y = \Psi(X) + \varepsilon\) 에서 양변에 \(\langle X, v_i \rangle\) 를 곱하고 기대값:

\[ E[\langle X, v_i \rangle Y] = E[\langle X, v_i \rangle \Psi(X)] + E[\langle X, v_i \rangle \varepsilon]. \]

좌변 = \(\Delta(v_i)\). 우변에서 \(X = \sum_j \xi_j v_j\)\(\Psi(X) = \sum_j \xi_j \Psi(v_j)\) 사용, \(\varepsilon \perp X\) 로 둘째 항 = 0:

\[ \Delta(v_i) = \sum_j E[\xi_i \xi_j] \Psi(v_j) = \lambda_i \Psi(v_i). \]

8.4 직관: 핵 작용을 점수 공분산으로 변환

식 (5.20) 의 의미: 핵 ψ 가 X 의 한 PC 방향에 작용한 결과를 X-Y 의 교차 공분산으로 측정 가능.

\(\Psi(v_i)\) 는 추상적 함수이지만, \(\Delta(v_i) / \lambda_i\)표본에서 직접 계산 가능 — 따라서 \(\Psi\) 의 정보가 X-Y 의 교차 공분산 구조에 모두 담긴다.

이 관계가 검정 통계량 구성의 핵심.

8.5 H_0 의 등가 조건

\(\Psi(X) = \sum_i \xi_i \Psi(v_i)\) 이고 (5.20) 에 의해 \(\Psi(v_i) = \Delta(v_i) / \lambda_i\) (\(\lambda_i > 0\) 인 i 에 대해). 따라서:

\[ \Psi(X) = 0 \iff \Delta(v_i) = 0 \text{ for all } i \text{ such that } \lambda_i > 0. \]

\(\{u_j\}\)\(L^2(\mathcal{T})\) 의 기저이므로:

\[ \Delta(v_i) = 0 \iff \langle \Delta(v_i), u_j \rangle = 0 \text{ for all } j. \]

따라서 \(H_0\)무한히 많은 조건의 결합:

\[ \langle \Delta(v_i), u_j \rangle = 0, \quad \forall i, j \geq 1. \]

8.6 절단 검정

무한 개의 조건을 검정할 수 없으므로 유한 부분 집합으로 절단:

\[ \langle \Delta(v_i), u_j \rangle = 0, \quad 1 \leq i \leq p, \ 1 \leq j \leq q. \tag{5.21} \]

여기서 \(p, q\)\(X, Y\) 의 분산을 충분히 설명하는 차원.

8.7 직관: 절단의 정당화

\(\widehat{\Delta}(v_i) \approx N^{-1} \sum_n \langle X_n, v_i \rangle Y_n\)\(Y_1, \ldots, Y_N\) 의 선형 결합. \(\{u_1, \ldots, u_q\}\) 의 span 이 \(\{Y_n\}\) 을 잘 근사하면, \(\widehat{\Delta}(v_i)\) 도 그 span 에 잘 표현된다.

따라서 \(\langle \Delta(v_i), u_j \rangle\) (\(j > q\)) 는 추정에서 거의 잡히지 않는 정보 — 절단해도 검정력 손실이 작다.


9 검정 통계량과 분포

9.1 통계량 정의 (식 5.22)

\[ \boxed{ \widehat{T}_N(p, q) = N \sum_{k=1}^{p} \sum_{j=1}^{q} \widehat{\lambda}_k^{-1} \widehat{\gamma}_j^{-1} \langle \widehat{\Delta}(\widehat{v}_k), \widehat{u}_j \rangle^2. } \]

여기서 표본 연산자:

\[ \widehat{C}(x) = \frac{1}{N} \sum_{n=1}^{N} \langle X_n, x \rangle X_n, \quad \widehat{\Gamma}(x) = \frac{1}{N} \sum_{n=1}^{N} \langle Y_n, x \rangle Y_n, \quad \widehat{\Delta}(x) = \frac{1}{N} \sum_{n=1}^{N} \langle X_n, x \rangle Y_n. \]

\(\widehat{\lambda}_k, \widehat{v}_k\)\(\widehat{C}\) 의 고유값/고유함수. \(\widehat{\gamma}_j, \widehat{u}_j\)\(\widehat{\Gamma}\) 의 고유값/고유함수.

9.2 점근 분포

\(H_0\) 가 참이면:

\[ \widehat{T}_N(p, q) \xrightarrow{d} \chi^2_{pq}. \]

자유도 = \(p \times q\) (점수 쌍의 개수).

9.3 직관: 통계량의 형태 해석

식 (5.22) 의 각 항을 분해:

\[ \widehat{\lambda}_k^{-1} \widehat{\gamma}_j^{-1} \langle \widehat{\Delta}(\widehat{v}_k), \widehat{u}_j \rangle^2. \]

  • \(\langle \widehat{\Delta}(\widehat{v}_k), \widehat{u}_j \rangle\)표본에서 계산한 X 의 k번째 PC 점수와 Y 의 j번째 PC 점수의 평균 곱 (식 5.6.1 의 단계 3 참조). \(H_0\) 하에서 두 점수가 독립이면 0 에 수렴.
  • \(\widehat{\lambda}_k \widehat{\gamma}_j\) 로 정규화 — 큰 분산을 가진 PC 의 점수가 자연히 큰 절댓값을 가지므로, 이를 표준화하여 PC 사이 비교 가능.
  • \(N\) 곱 — CLT 의 표준 스케일링.
  • 제곱 합 — pq 개의 (점근적으로 독립) 표준 정규 변수의 제곱 합.

표준 정규 변수의 제곱합이 카이제곱 분포 — 통계학의 기본 정리.

9.4 비유: 다채널 누화 검사

전화 시스템에 \(p\) 개 입력 채널과 \(q\) 개 출력 채널이 있다. “어떤 입력도 어떤 출력에 누화되지 않는가?” 를 검정하려면 \(p \times q\) 개의 입출력 쌍 모두에서 누화 강도를 측정·합산.

한 쌍이라도 강하게 누화되면 합이 커지고 귀무가설(완전 차폐) 이 기각. 함수 회귀의 효과 없음 검정도 같은 구조 — pq 개의 PC 쌍에서 정규화된 점수 공분산을 합산한다.


10 알고리즘 5.6.1

효과 없음 카이제곱 검정 절차
  1. 차원 선택: 스크리 도표 또는 누적 분산비로 \(p\) (\(X\) 의 EFPC 수), \(q\) (\(Y\) 의 EFPC 수) 선택.

  2. 중심화: \(X_n^c, Y_n^c\) 로 평균 차감 (5.5 와 동일).

  3. 점수 계산: \(\langle X_n, \widehat{v}_k \rangle\) (\(k = 1, \ldots, p\)) 와 \(\langle Y_n, \widehat{u}_j \rangle\) (\(j = 1, \ldots, q\)). 표준 FPC 소프트웨어의 출력.

  4. 검정 통계량 계산:

    \[ \langle \widehat{\Delta}(\widehat{v}_k), \widehat{u}_j \rangle = \frac{1}{N} \sum_{n=1}^{N} \langle X_n, \widehat{v}_k \rangle \langle Y_n, \widehat{u}_j \rangle, \]

    를 모든 \((k, j)\) 쌍에 대해 계산. 식 (5.22) 에 대입.

  5. 결정: \(\widehat{T}_N(p, q) > \chi^2_{pq}(\alpha)\)\(H_0\) 기각.

10.1 R 구현 예시

# 가상 데이터로 효과 없음 검정 시연
library(fda)

# 1. X, Y 의 fd 객체와 EFPC 가 이미 계산되어 있다고 가정
# X_fd, Y_fd, X_pca (nharm = p), Y_pca (nharm = q)

# 점수 행렬 추출
xi_scores <- X_pca$scores      # N x p
zeta_scores <- Y_pca$scores    # N x q
N <- nrow(xi_scores)
p <- ncol(xi_scores)
q <- ncol(zeta_scores)

# 고유값
lambda_X <- X_pca$values[1:p]
gamma_Y <- Y_pca$values[1:q]

# 점수 공분산 (표본 평균 곱)
score_cov <- t(xi_scores) %*% zeta_scores / N   # p x q

# 검정 통계량
T_stat <- N * sum((score_cov^2) / outer(lambda_X, gamma_Y))

# p-value: pq 자유도 카이제곱
df <- p * q
p_value <- pchisq(T_stat, df = df, lower.tail = FALSE)

cat("Test statistic:", round(T_stat, 4), "\n")
cat("Degrees of freedom:", df, "\n")
cat("p-value:", round(p_value, 6), "\n")

if (p_value < 0.05) {
  cat("Reject H0: X has significant linear effect on Y\n")
} else {
  cat("Fail to reject H0: no evidence of linear effect\n")
}

10.2 직관: 검정과 추정의 통합

식 (5.22) 의 통계량은 5.5 의 핵 추정량 (5.19) 와 같은 객체\(\widehat{\sigma}_{kj} = \langle \widehat{\Delta}(\widehat{v}_k), \widehat{u}_j \rangle\) 를 사용한다. 즉 검정에 필요한 모든 양은 추정 단계에서 이미 계산되어 있다.

따라서 5.5 로 핵을 추정한 후 5.6 의 검정으로 자연스럽게 넘어간다 — 추가 계산 거의 없이 검정 가능.


11 p, q 선택의 실무 가이드

11.1 너무 작으면

검정력 손실. 진짜 효과가 후순위 PC 에 있으면 (예: 첫 번째 PC 가 평균 수준이고 진짜 신호는 두 번째 PC 에 있는 경우) 검출 불가.

11.2 너무 크면

자유도 증가로 임계값 증가 → 검정력 손실. 또한 작은 \(\widehat{\lambda}_k\) 가 분모에 등장하여 통계량이 불안정.

11.3 권장 절차

p, q 선택의 실무 단계
  1. CPV 임계값 시작: \(X, Y\) 각각 85% (또는 90%) 분산 설명 시점.
  2. 민감도 분석: \(p, q\)\(\pm 1\) 변화시키며 결과 안정성 확인.
  3. 표본 크기 고려: \(N\) 이 작으면 보수적으로 선택 (\(p, q < 5\) 권장).
  4. 도메인 지식: 진짜 효과가 후순위 PC 에 있을 가능성이 있으면 추가 PC 포함.

11.4 비유: 카메라의 분해능

해상도가 낮은 카메라(작은 p, q)는 빠르고 견고하지만 세부를 놓친다. 해상도가 높은 카메라(큰 p, q)는 세부를 잡지만 잡음에도 민감. 데이터의 본질적 구조에 맞는 해상도 를 선택하는 것이 핵심 — 너무 낮지도, 너무 높지도 않게.


12 검정의 한계와 보완

12.1 한계 1: 선형 효과만 검출

이 검정은 선형 모형 (5.10) 하에서 의 효과 검출. \(X\)\(Y\) 사이에 비선형 관계가 있어도 선형 부분이 0 이면 \(H_0\) 가 참이 아닐 수 있음에도 기각하지 못할 수 있다.

해결: 비선형 효과는 5.7 의 산점도 진단 또는 Ch.6 의 함수 GLM 으로 검사.

12.2 한계 2: iid 가정

오차 함수 \(\varepsilon_i\) 가 iid 가우스. 시간 시리즈 함수 데이터(Ch.8) 같은 종속 데이터에서는 점근 분포가 달라진다 (장기 공분산 기반의 변형 통계량 필요).

12.3 한계 3: 절단 차원의 영향

p, q 선택이 결과에 영향. 민감도 분석 권장 (위 가이드 참조).

12.4 보완 도구

상황 도구
비선형성 의심 5.7 산점도 진단
시간 종속성 Ch.8 함수 시계열 검정
강건성 필요 부트스트랩 또는 순열 검정 (fosr.perm)
다중 회귀자 각 회귀자별 검정 + 다중 비교 보정

13 두 절의 통합 시각

13.1 한 줄 요약

함수-on-함수 회귀의 핵 ψ(t,s) 는 X 와 Y 의 EFPC 텐서 곱으로 분해되며, 분해 계수가 점수 공분산 / X 의 고유값의 단순 비율 (식 5.17) 이다. 이 분해 framework 에서 효과 없음 검정 H₀: ψ=0 이 자연스럽게 도출 — 점수 공분산 제곱의 정규화된 합이 χ²_{pq} 분포를 따른다 (식 5.22).

13.2 5.3~5.4 와의 비교

측면 5.3~5.4 (양방향 기저) 5.5~5.6 (FPCA 기반)
기저 결정적 (B-spline 등) 데이터 기반 (EFPC)
모수 수 \(G = M_t \times M_s\) 큰 수 \(p \times q\) 작은 수
정칙화 라플라시안 벌점 (연속) EFPC 절단 (이산)
자동화 pffr (REML) pca.fd + 행렬 곱
검정 (별도 도구 필요) 자연스러운 χ² 검정 따라옴
강점 일반적, 자동화 데이터 적응적, 검정 통합
약점 모수 폭발 EFPC 가 Y 와 무관할 수 있음

두 접근은 보완적이며 실무에서는 함께 사용 — pffr 로 추정한 후 5.6 의 카이제곱 검정으로 사후 검증.

13.3 Chapter 5 후속 절과의 연결

후속 절 5.5~5.6 의 도구를 어떻게 확장하는가
5.7 선형성 진단 EFPC 점수 산점도 — 5.5 의 분해가 진단 도구로 변환
5.8 확장과 참고문헌 Scheipl et al. (2015) mixed model, Yao et al. (2005) 희소 데이터
Ch.6 함수 GLM EFPC 분해 + 링크 함수로 비정규 반응 일반화
Ch.8 함수 시계열 FAR(1) 의 추정 연산자 \(\Phi = C_1 C^{-1}\) — 5.5 의 framework 응용
Ch.12 추론 평균 함수 검정·신뢰 밴드 — 5.6 의 카이제곱 framework 일반화

5.5~5.6 의 토대 — EFPC 분해 + 점수 공분산 + 카이제곱 검정 — 이 FDA 의 추론 framework 의 표준이며, 후속 챕터들이 모두 이 위에서 추가 도구를 쌓는다.


14 관련 주제

선행 지식

후속 주제

관련 개념

Subscribe

Enjoy this blog? Get notified of new posts by email: