1 두 절의 역할
| 절 | 주제 | 핵심 도구 |
|---|---|---|
| 5.5 | FPCA 기반 핵 ψ(t,s) 의 분해와 추정 | 두 함수의 KL 전개 + 점수 공분산 |
| 5.6 | 효과 없음 검정 H₀: ψ=0 | 적분 연산자 + χ²_{pq} 분포 |
5.5 는 함수-on-함수 회귀의 핵 추정에 대한 두 번째 접근 — 5.3 의 결정적 기저(B-spline, Fourier) + 라플라시안 벌점 대신, X 와 Y 자체의 데이터 기반 기저(EFPC) 를 사용. 핵 ψ(t,s) 가 두 EFPC 시스템으로 분해되며, 분해 계수가 점수 공분산의 단순한 비율로 표현된다.
5.6 은 5.5 에서 구축한 framework 위에서 자연스럽게 따라오는 추론 도구 — “회귀자 X 가 반응 Y 에 정말 영향을 주는가?” 의 가설을 카이제곱 검정으로 평가. 적합 전 사전 검증, 또는 적합 후 사후 정당화의 표준 절차이다.
두 절의 연결: 5.5 의 분해 식이 검정 통계량의 분포를 결정한다 — 추정과 검정이 같은 수학 구조를 공유.
2 FPCA 기반 핵 추정의 동기
2.1 5.3 접근의 한계
5.3 의 양방향 결정적 기저는 일반적이고 자동화된(pffr) 도구를 제공하지만 다음 한계가 있다.
- 모수의 수가 곱셈적 폭발 — \(G = M_t \times M_s\) 가 수백 개에 이름. 작은 표본에서 과적합 위험.
- 기저가 데이터와 무관 — B-spline 이나 Fourier 가 진짜 핵의 형태와 잘 맞지 않으면 비효율적.
- 벌점 모수 선택의 의존성 — REML 이 자동화하지만 결과가 벌점 형태에 민감.
2.2 FPCA 접근의 핵심 아이디어
핵 \(\psi(t, s)\) 를 X 의 변동이 큰 방향과 Y 의 변동이 큰 방향의 결합으로 분해한다.
X 의 EFPC \(\{v_\ell\}\) 와 Y 의 EFPC \(\{u_k\}\) 가 각각 \(L^2\) 의 기저를 이루므로, 텐서 곱 \(\{u_k(t) v_\ell(s)\}\) 가 \(L^2(\mathcal{T} \times \mathcal{S})\) 의 기저. 이 기저가 데이터의 변동 방향과 정렬되어 있어 적은 항으로도 정확한 표현이 가능하다.
2.3 비유: 음향 등화기 (Equalizer)
음향 시스템에서 입력 음악을 베이스·중음·고음으로 분해(X 의 FPC), 출력도 비슷하게 분해(Y 의 FPC), 그 사이의 변환 강도를 슬라이더로 조절. 모든 슬라이더의 행렬이 시스템의 응답 특성 — 즉 핵 \(\psi(t, s)\).
데이터 기반 EFPC 를 쓰는 것은 “음악의 본질적 주파수 대역에 슬라이더를 배치” 하는 것 — 그 음악에 가장 효율적인 좌표계.
3 사전 작업: 영 절편으로의 환원
3.1 핵심 관찰
핵 추정 문제를 단순화하기 위해 평균 기여를 제거한다. 모형 (5.10) 의 양변에 기댓값:
\[ E[Y_i(t)] = \alpha(t) + \int \psi(t, s) E[X_i(s)] \, ds, \]
즉 \(\mu_Y(t) = \alpha(t) + \int \psi(t, s) \mu_X(s) \, ds\). 이를 빼면:
\[ Y_i(t) - \mu_Y(t) = \int \psi(t, s) \{X_i(s) - \mu_X(s)\} \, ds + \varepsilon_i(t). \]
3.2 표본 평균 추정
밀집(dense) 관측 또는 평활화된 함수 객체의 경우:
\[ \widehat{\mu}_Y(t) = \frac{1}{N} \sum_{i=1}^{N} Y_i(t), \quad \widehat{\mu}_X(t) = \frac{1}{N} \sum_{i=1}^{N} X_i(t). \]
희소 관측의 경우는 Ch.7 의 PACE 같은 별도 추정량 사용.
3.3 영 평균 모형
평균을 차감한 곡선 \(X_i^c, Y_i^c\) 로 작업:
\[ Y_i^c(t) = \int \psi(t, s) X_i^c(s) \, ds + \varepsilon_i(t), \quad i = 1, 2, \ldots, N. \tag{5.14} \]
추정된 \(\widehat{\psi}\) 로부터 절편 회복:
\[ \widehat{\alpha}(t) = \widehat{\mu}_Y(t) - \int \widehat{\psi}(t, s) \widehat{\mu}_X(s) \, ds. \]
3.4 직관: 평균 차감의 의미
함수 회귀에서 평균 차감은 회귀자 곡선에서 “공통 패턴” 을 제거하는 작업. 모든 단위가 공유하는 부분(평균 함수) 을 빼면, 단위 사이의 차이 패턴 만 남는다 — 회귀계수가 추정해야 하는 진짜 신호.
이는 다변량 회귀에서 회귀자를 표준화하기 전 평균을 차감하는 것과 같은 동기 — 상수 효과를 절편으로 분리.
4 핵의 EFPC 분해
4.1 모집단 KL 전개
평균이 0 인 \(X, Y\) 에 대해:
\[ X(s) = \sum_{i=1}^{\infty} \xi_i v_i(s), \quad Y(t) = \sum_{j=1}^{\infty} \zeta_j u_j(t), \tag{5.16} \]
여기서 \(v_i\) 는 \(X\) 의 FPC, \(u_j\) 는 \(Y\) 의 FPC, \(\xi_i = \langle X, v_i \rangle\), \(\zeta_j = \langle Y, u_j \rangle\) 는 점수.
4.2 핵의 기저 표현
\(\{v_i\}\) 가 \(L^2(\mathcal{S})\) 의 기저, \(\{u_j\}\) 가 \(L^2(\mathcal{T})\) 의 기저이므로 텐서 곱 \(\{u_k(t) v_\ell(s)\}\) 는 \(L^2(\mathcal{T} \times \mathcal{S})\) 의 기저. \(\iint \psi^2 \, dt \, ds < \infty\) 가정 하에 \(\psi\) 도 이 기저로 전개:
\[ \psi(t, s) = \sum_{k = 1}^{\infty} \sum_{\ell = 1}^{\infty} \psi_{k\ell} u_k(t) v_\ell(s). \]
문제는 계수 \(\psi_{k\ell}\) 가 무엇인가.
4.3 분해 계수의 유도
식 (5.15) \(Y(t) = \int \psi(t, s) X(s) \, ds + \varepsilon(t)\) 에 KL 전개 (5.16) 와 핵 전개를 대입:
\[ \sum_{j} \zeta_j u_j(t) = \int \left( \sum_{k, \ell} \psi_{k\ell} u_k(t) v_\ell(s) \right) \left( \sum_{i} \xi_i v_i(s) \right) ds + \varepsilon(t). \]
내부 적분에서 \(\{v_i\}\) 의 정규직교성 \(\int v_\ell(s) v_i(s) \, ds = \delta_{\ell i}\) 사용:
\[ \sum_{j} \zeta_j u_j(t) = \sum_{k} \sum_{i} \psi_{ki} \xi_i u_k(t) + \varepsilon(t). \]
양변에 \(u_\ell(t)\) 를 곱하고 \(t\) 에 대해 적분, \(\{u_k\}\) 의 정규직교성:
\[ \zeta_\ell = \sum_{i} \psi_{\ell i} \xi_i + \int u_\ell(t) \varepsilon(t) \, dt. \tag{5.18} \]
4.4 핵심 식
\(\xi_k = \langle X, v_k \rangle\) 가 \(\int u_\ell \varepsilon \, dt\) 와 독립(둘 다 평균 0 이므로 곱의 기대값 0), 점수의 비상관성 \(E[\xi_k \xi_i] = \delta_{ki} \lambda_k\) 사용:
\[ E[\xi_k \zeta_\ell] = \sum_{i} \psi_{\ell i} E[\xi_k \xi_i] = \psi_{\ell k} E[\xi_k^2] = \psi_{\ell k} \lambda_k. \]
따라서 \(\psi_{\ell k} = E[\xi_k \zeta_\ell] / \lambda_k\). 인덱스를 다시 정리하면:
\[ \boxed{ \psi_{k\ell} = \frac{E[\xi_\ell \zeta_k]}{E[\xi_\ell^2]} = \frac{\sigma_{\ell k}}{\lambda_\ell} } \tag{5.17} \]
여기서 \(\sigma_{\ell k} = E[\xi_\ell \zeta_k]\) (입력·출력 점수의 공분산), \(\lambda_\ell\) (\(X\) 의 \(\ell\) 번째 고유값).
4.5 직관 1: 단순 회귀의 함수 일반화
이 공식의 모양:
\[ \psi_{k\ell} = \frac{\text{Cov}(\xi_\ell, \zeta_k)}{\text{Var}(\xi_\ell)}. \]
이는 단순 선형 회귀의 기울기 공식. \(\zeta_k\) 를 \(\xi_\ell\) 에 회귀한 결과의 기울기 — 표준 다변량 회귀의 가장 단순한 1차원 형태.
함수 회귀가 무한 개의 1차원 회귀로 분해된다는 사실이 이 분해의 본질적 단순성 이다.
4.6 직관 2: 좌표계가 자동 정렬됨
다변량 회귀에서 회귀자가 다공선이면 \((\mathbf{X}^T \mathbf{X})^{-1}\) 이 불안정. PCR(Principal Component Regression) 은 회귀자를 PC 로 변환하여 다공선성을 해결한다.
함수-on-함수 회귀에서 무한차원 다공선성이 본질적인데, EFPC 좌표계를 쓰면 다공선성이 자동 분해 된다 — 점수들이 비상관(uncorrelated) 이므로 \((\mathbf{X}^T \mathbf{X})^{-1}\) 이 대각행렬이 되고, 회귀가 무한 개의 독립 1차원 회귀로 환원.
4.7 비유: 자연 좌표계
지구상의 모든 점을 위도/경도로 표시할 수도 있고, X/Y/Z 직교좌표로 표시할 수도 있다. 위도/경도는 지구의 형태(타원체) 에 적응한 자연 좌표계 — 지표면 거리 계산이 직교좌표보다 자연스럽다.
함수 회귀에서 EFPC 좌표계는 데이터의 본질적 형태에 적응한 자연 좌표계 — B-spline 이나 Fourier 같은 외부 기저보다 적합.
5 표본 추정량
5.1 점수 공분산의 표본 추정
\(\sigma_{\ell k} = E[\xi_\ell \zeta_k]\) 를 표본 평균으로 추정:
\[ \widehat{\sigma}_{\ell k} = \frac{1}{N} \sum_{i=1}^{N} \langle X_i, \widehat{v}_\ell \rangle \langle Y_i, \widehat{u}_k \rangle. \]
5.2 핵의 추정량 (식 5.19)
\[ \boxed{ \widehat{\psi}(t, s) = \sum_{k=1}^{q} \sum_{\ell=1}^{p} \frac{\widehat{\sigma}_{\ell k}}{\widehat{\lambda}_\ell} \widehat{u}_k(t) \widehat{v}_\ell(s) } \]
여기서:
- \(\widehat{v}_\ell, \widehat{\lambda}_\ell\) — \(X\) 의 \(\ell\) 번째 추정 EFPC·고유값.
- \(\widehat{u}_k\) — \(Y\) 의 \(k\) 번째 추정 EFPC.
- \(p, q\) — 절단 차원 (X 의 PC 수, Y 의 PC 수).
- \(\widehat{\sigma}_{\ell k}\) — 표본 점수 공분산.
5.3 절단 차원 선택
\(p, q\) 는 누적 분산 비율(CPV) 또는 스크리 도표로 결정. 일반적 경험 규칙:
- \(X\) 의 변동의 85% 를 설명하는 첫 \(p\) 개 PC.
- \(Y\) 의 변동의 85% 를 설명하는 첫 \(q\) 개 PC.
도메인이나 표본 크기에 따라 임계값(85%, 90%, 95%) 을 조정.
5.4 직관: 작은 λ_ℓ 의 위험
분해 식에서 \(\widehat{\lambda}_\ell\) 이 분모에 등장 — 작은 λ 의 PC 는 추정량을 폭발시킨다. 이는 다변량 회귀의 다공선성 문제가 PC 좌표계에서 표면화된 것.
해결: 작은 λ 의 PC 를 절단하여 분모 0 을 회피. 이것이 “\(p\) 를 적절히 작게 잡아야 하는 이유” 이다 — 분산 설명력이 작은 PC 는 신호 대 잡음비가 낮아 회귀에서 노이즈를 증폭한다.
이는 5.3 의 거칠기 벌점이 작은 λ 방향을 자동으로 축소하는 것과 같은 동기 — 두 접근 모두 작은 분산 방향을 통제 하지만 방법이 다르다 (절단 vs 비례 축소).
6 응용 사례: 캐나다 기온 → 강수량
6.1 데이터 배경
fda 패키지의 daily 데이터셋 — 캐나다 35 개 관측소의 일평균 기온/강수량 곡선.
- \(X_i(t)\) — \(i\) 번째 관측소의 일평균 기온 곡선.
- \(Y_i(t)\) — 일평균 강수량 곡선.
- 두 곡선 모두 \(t \in \{1, \ldots, 365\}\).
6.2 모형
\[ Y_i(t) = \alpha(t) + \int \psi(t, s) X_i(s) \, ds + \varepsilon_i(t). \]
질문: “어느 시점의 기온이 어느 시점의 강수량에 영향을 주는가?”
6.3 직관: 기온-강수 관계의 물리학
따뜻한 공기가 더 많은 수증기를 운반하므로 여름 강수가 겨울보다 많다. 그러나 단순한 동시(同時) 관계뿐만 아니라:
- 시간 지연 효과 — 봄의 기온 상승이 여름 강수를 좌우.
- 누적 효과 — 장기 기온 추세가 강수 패턴을 형성.
핵 \(\psi(t, s)\) 는 이런 모든 시간 관계를 한 번에 표현. \(\widehat{\psi}(t_0, s_0)\) 의 큰 값은 “\(s_0\) 의 기온이 \(t_0\) 의 강수에 강한 영향” 을 의미.
6.4 코드: FPCA 기반 핵 추정
library(fda)
data(daily)
precav <- daily$precav
tempav <- daily$tempav
daytime <- (1:365) - 0.5
dayrange <- c(0, 365)
dayperiod <- 365
# 1. Fourier 기저 + harmonic acceleration penalty 로 곡선 평활
daybasis <- create.fourier.basis(dayrange, 365)
Lcoef <- c(0, (2 * pi / dayperiod)^2, 0)
harmaccelLfd <- vec2Lfd(Lcoef, dayrange)
lambda <- 1e6
fdParobj <- fdPar(daybasis, harmaccelLfd, lambda)
precfd <- smooth.basis(daytime, precav, fdParobj)$fd
tempfd <- smooth.basis(argvals = daytime, tempav, fdParobj)$fd
# 2. 평균 차감 (식별성 위한 영 절편 환원)
precfd.c <- center.fd(precfd)
tempfd.c <- center.fd(tempfd)
# 3. EFPC 추정 — X 는 4 개, Y 는 6 개
prec.pca <- pca.fd(precfd.c, nharm = 6) # Y 의 EFPC
temp.pca <- pca.fd(tempfd.c, nharm = 4) # X 의 EFPC
# 4. 점수 공분산 행렬: sigma_{ell k}
sigmas <- t(temp.pca$scores) %*% prec.pca$scores # 4 x 6
# 5. 분해 계수: psi_{k ell} = sigma_{ell k} / lambda_ell
cs <- diag(1 / temp.pca$values[1:4]) %*% sigmas # 4 x 6
# 6. beta(t,s) 의 기저 표현
beta.coefs <- temp.pca$harmonics$coefs %*% cs %*% t(prec.pca$harmonics$coefs)
beta.bifd <- bifd(beta.coefs,
sbasisobj = temp.pca$harmonics$basis,
tbasisobj = prec.pca$harmonics$basis)
# 7. (Problem 5.13 참조) bifd 객체를 시각화하는 함수 적용
# plot(beta.bifd, ...) — persp 또는 contour 그림6.5 결과 해석의 패턴
\(\widehat{\psi}(t, s)\) 의 표면을 시각화하면:
- 양의 영역 — 기온 증가가 강수 증가를 유발하는 (s, t) 조합. 보통 여름-여름 또는 봄-여름.
- 음의 영역 — 기온 증가가 강수 감소를 유발. 사막 효과나 건조한 기후 패턴.
- 0 에 가까운 영역 — 영향 없음. 보통 기온과 강수의 시간차가 큰 경우.
캐나다 기온-강수 데이터에서는 일반적으로 “기온 상승의 영향이 같은 시점 또는 약간 이후의 강수에 가장 강하게 나타남” 패턴.
6.6 직관: EFPC 분해의 효율성
35 개 관측소 × 365 시점이라는 큰 데이터에서, 4 + 6 = 10 개 EFPC 점수만으로 핵을 추정한다. 모수 수가 24 (\(4 \times 6\)) 에 불과 — 5.3 의 결정적 기저(예: 30 × 30 = 900 모수) 보다 훨씬 절약.
이것이 가능한 이유는 데이터에 강한 주성분 구조(연주기) 가 있기 때문 — 기온/강수의 가장 중요한 변동이 첫 몇 PC 에 집중. 이런 구조가 없는 데이터에서는 5.3 접근이 더 적합할 수 있다.
7 효과 없음 검정
7.1 검정 문제
함수-on-함수 모형 (5.15) \(Y(t) = \int \psi(t, s) X(s) \, ds + \varepsilon(t)\) 에서:
\[ H_0: \psi(t, s) = 0 \quad \text{vs.} \quad H_A: \psi(t, s) \neq 0. \]
\(\psi\) 는 \(L^2(\mathcal{T} \times \mathcal{S})\) 의 원소이므로 \(H_0\) 는 \(\iint \psi^2 = 0\) 와 동치 — 거의 모든 \((t, s)\) 에서 \(\psi = 0\).
7.2 직관: 검정의 의미
“회귀자 X 가 반응 Y 에 어떤 선형 효과도 주지 않는가?”
다변량 회귀의 \(H_0: \boldsymbol{\beta} = \mathbf{0}\) (전 회귀자 일괄 효과 없음) 의 함수 일반화. 유의하면 “X 가 Y 의 변동을 일부 설명한다” 는 증거.
이 검정은 적합 전에 사전 검증 또는 적합 후에 모형 정당화의 도구로 쓰인다. 유의하지 않으면 “이 모형 자체가 의미 없을 수 있음” 을 의미하므로, 도메인 지식으로 비선형 항이나 추가 회귀자를 검토하는 신호.
8 검정 통계량의 동기
8.1 적분 연산자의 도입
표본 가정: \((Y_i, X_i, \varepsilon_i)\) 는 \((Y, X, \varepsilon)\) 의 iid 복제, \(\{\varepsilon_i\}\) 는 \(\{X_i\}\) 와 독립, 모든 함수가 제곱적분.
세 연산자 정의:
\[ C(x) = E[\langle X, x \rangle X], \quad \Gamma(x) = E[\langle Y, x \rangle Y], \quad \Delta(x) = E[\langle X, x \rangle Y]. \]
| 연산자 | 의미 |
|---|---|
| \(C\) | \(X\) 의 공분산 연산자 — 자기 변동 |
| \(\Gamma\) | \(Y\) 의 공분산 연산자 — 자기 변동 |
| \(\Delta\) | \(X\)-\(Y\) 의 교차 공분산 연산자 — 두 함수 사이 변동 |
각각의 고유 분해:
\[ C(v_i) = \lambda_i v_i, \quad \Gamma(u_j) = \gamma_j u_j. \]
(여기서 \(\gamma_j\) 는 \(Y\) 의 고유값으로, 5.3 의 \(\boldsymbol{\gamma}\) 와는 다른 객체이다 — 표기 충돌 주의.)
8.2 핵심 관계식 (식 5.20)
\(\Psi\) 가 핵 \(\psi\) 의 적분 연산자일 때:
\[ \lambda_i \Psi(v_i) = \Delta(v_i). \tag{5.20} \]
8.3 식 (5.20) 의 유도 직관
모형 \(Y = \Psi(X) + \varepsilon\) 에서 양변에 \(\langle X, v_i \rangle\) 를 곱하고 기대값:
\[ E[\langle X, v_i \rangle Y] = E[\langle X, v_i \rangle \Psi(X)] + E[\langle X, v_i \rangle \varepsilon]. \]
좌변 = \(\Delta(v_i)\). 우변에서 \(X = \sum_j \xi_j v_j\) 와 \(\Psi(X) = \sum_j \xi_j \Psi(v_j)\) 사용, \(\varepsilon \perp X\) 로 둘째 항 = 0:
\[ \Delta(v_i) = \sum_j E[\xi_i \xi_j] \Psi(v_j) = \lambda_i \Psi(v_i). \]
8.4 직관: 핵 작용을 점수 공분산으로 변환
식 (5.20) 의 의미: 핵 ψ 가 X 의 한 PC 방향에 작용한 결과를 X-Y 의 교차 공분산으로 측정 가능.
\(\Psi(v_i)\) 는 추상적 함수이지만, \(\Delta(v_i) / \lambda_i\) 는 표본에서 직접 계산 가능 — 따라서 \(\Psi\) 의 정보가 X-Y 의 교차 공분산 구조에 모두 담긴다.
이 관계가 검정 통계량 구성의 핵심.
8.5 H_0 의 등가 조건
\(\Psi(X) = \sum_i \xi_i \Psi(v_i)\) 이고 (5.20) 에 의해 \(\Psi(v_i) = \Delta(v_i) / \lambda_i\) (\(\lambda_i > 0\) 인 i 에 대해). 따라서:
\[ \Psi(X) = 0 \iff \Delta(v_i) = 0 \text{ for all } i \text{ such that } \lambda_i > 0. \]
\(\{u_j\}\) 가 \(L^2(\mathcal{T})\) 의 기저이므로:
\[ \Delta(v_i) = 0 \iff \langle \Delta(v_i), u_j \rangle = 0 \text{ for all } j. \]
따라서 \(H_0\) 는 무한히 많은 조건의 결합:
\[ \langle \Delta(v_i), u_j \rangle = 0, \quad \forall i, j \geq 1. \]
8.6 절단 검정
무한 개의 조건을 검정할 수 없으므로 유한 부분 집합으로 절단:
\[ \langle \Delta(v_i), u_j \rangle = 0, \quad 1 \leq i \leq p, \ 1 \leq j \leq q. \tag{5.21} \]
여기서 \(p, q\) 는 \(X, Y\) 의 분산을 충분히 설명하는 차원.
8.7 직관: 절단의 정당화
\(\widehat{\Delta}(v_i) \approx N^{-1} \sum_n \langle X_n, v_i \rangle Y_n\) 는 \(Y_1, \ldots, Y_N\) 의 선형 결합. \(\{u_1, \ldots, u_q\}\) 의 span 이 \(\{Y_n\}\) 을 잘 근사하면, \(\widehat{\Delta}(v_i)\) 도 그 span 에 잘 표현된다.
따라서 \(\langle \Delta(v_i), u_j \rangle\) (\(j > q\)) 는 추정에서 거의 잡히지 않는 정보 — 절단해도 검정력 손실이 작다.
9 검정 통계량과 분포
9.1 통계량 정의 (식 5.22)
\[ \boxed{ \widehat{T}_N(p, q) = N \sum_{k=1}^{p} \sum_{j=1}^{q} \widehat{\lambda}_k^{-1} \widehat{\gamma}_j^{-1} \langle \widehat{\Delta}(\widehat{v}_k), \widehat{u}_j \rangle^2. } \]
여기서 표본 연산자:
\[ \widehat{C}(x) = \frac{1}{N} \sum_{n=1}^{N} \langle X_n, x \rangle X_n, \quad \widehat{\Gamma}(x) = \frac{1}{N} \sum_{n=1}^{N} \langle Y_n, x \rangle Y_n, \quad \widehat{\Delta}(x) = \frac{1}{N} \sum_{n=1}^{N} \langle X_n, x \rangle Y_n. \]
\(\widehat{\lambda}_k, \widehat{v}_k\) — \(\widehat{C}\) 의 고유값/고유함수. \(\widehat{\gamma}_j, \widehat{u}_j\) — \(\widehat{\Gamma}\) 의 고유값/고유함수.
9.2 점근 분포
\(H_0\) 가 참이면:
\[ \widehat{T}_N(p, q) \xrightarrow{d} \chi^2_{pq}. \]
자유도 = \(p \times q\) (점수 쌍의 개수).
9.3 직관: 통계량의 형태 해석
식 (5.22) 의 각 항을 분해:
\[ \widehat{\lambda}_k^{-1} \widehat{\gamma}_j^{-1} \langle \widehat{\Delta}(\widehat{v}_k), \widehat{u}_j \rangle^2. \]
- \(\langle \widehat{\Delta}(\widehat{v}_k), \widehat{u}_j \rangle\) — 표본에서 계산한 X 의 k번째 PC 점수와 Y 의 j번째 PC 점수의 평균 곱 (식 5.6.1 의 단계 3 참조). \(H_0\) 하에서 두 점수가 독립이면 0 에 수렴.
- \(\widehat{\lambda}_k \widehat{\gamma}_j\) 로 정규화 — 큰 분산을 가진 PC 의 점수가 자연히 큰 절댓값을 가지므로, 이를 표준화하여 PC 사이 비교 가능.
- \(N\) 곱 — CLT 의 표준 스케일링.
- 제곱 합 — pq 개의 (점근적으로 독립) 표준 정규 변수의 제곱 합.
표준 정규 변수의 제곱합이 카이제곱 분포 — 통계학의 기본 정리.
9.4 비유: 다채널 누화 검사
전화 시스템에 \(p\) 개 입력 채널과 \(q\) 개 출력 채널이 있다. “어떤 입력도 어떤 출력에 누화되지 않는가?” 를 검정하려면 \(p \times q\) 개의 입출력 쌍 모두에서 누화 강도를 측정·합산.
한 쌍이라도 강하게 누화되면 합이 커지고 귀무가설(완전 차폐) 이 기각. 함수 회귀의 효과 없음 검정도 같은 구조 — pq 개의 PC 쌍에서 정규화된 점수 공분산을 합산한다.
10 알고리즘 5.6.1
차원 선택: 스크리 도표 또는 누적 분산비로 \(p\) (\(X\) 의 EFPC 수), \(q\) (\(Y\) 의 EFPC 수) 선택.
중심화: \(X_n^c, Y_n^c\) 로 평균 차감 (5.5 와 동일).
점수 계산: \(\langle X_n, \widehat{v}_k \rangle\) (\(k = 1, \ldots, p\)) 와 \(\langle Y_n, \widehat{u}_j \rangle\) (\(j = 1, \ldots, q\)). 표준 FPC 소프트웨어의 출력.
검정 통계량 계산:
\[ \langle \widehat{\Delta}(\widehat{v}_k), \widehat{u}_j \rangle = \frac{1}{N} \sum_{n=1}^{N} \langle X_n, \widehat{v}_k \rangle \langle Y_n, \widehat{u}_j \rangle, \]
를 모든 \((k, j)\) 쌍에 대해 계산. 식 (5.22) 에 대입.
결정: \(\widehat{T}_N(p, q) > \chi^2_{pq}(\alpha)\) 면 \(H_0\) 기각.
10.1 R 구현 예시
# 가상 데이터로 효과 없음 검정 시연
library(fda)
# 1. X, Y 의 fd 객체와 EFPC 가 이미 계산되어 있다고 가정
# X_fd, Y_fd, X_pca (nharm = p), Y_pca (nharm = q)
# 점수 행렬 추출
xi_scores <- X_pca$scores # N x p
zeta_scores <- Y_pca$scores # N x q
N <- nrow(xi_scores)
p <- ncol(xi_scores)
q <- ncol(zeta_scores)
# 고유값
lambda_X <- X_pca$values[1:p]
gamma_Y <- Y_pca$values[1:q]
# 점수 공분산 (표본 평균 곱)
score_cov <- t(xi_scores) %*% zeta_scores / N # p x q
# 검정 통계량
T_stat <- N * sum((score_cov^2) / outer(lambda_X, gamma_Y))
# p-value: pq 자유도 카이제곱
df <- p * q
p_value <- pchisq(T_stat, df = df, lower.tail = FALSE)
cat("Test statistic:", round(T_stat, 4), "\n")
cat("Degrees of freedom:", df, "\n")
cat("p-value:", round(p_value, 6), "\n")
if (p_value < 0.05) {
cat("Reject H0: X has significant linear effect on Y\n")
} else {
cat("Fail to reject H0: no evidence of linear effect\n")
}10.2 직관: 검정과 추정의 통합
식 (5.22) 의 통계량은 5.5 의 핵 추정량 (5.19) 와 같은 객체 — \(\widehat{\sigma}_{kj} = \langle \widehat{\Delta}(\widehat{v}_k), \widehat{u}_j \rangle\) 를 사용한다. 즉 검정에 필요한 모든 양은 추정 단계에서 이미 계산되어 있다.
따라서 5.5 로 핵을 추정한 후 5.6 의 검정으로 자연스럽게 넘어간다 — 추가 계산 거의 없이 검정 가능.
11 p, q 선택의 실무 가이드
11.1 너무 작으면
검정력 손실. 진짜 효과가 후순위 PC 에 있으면 (예: 첫 번째 PC 가 평균 수준이고 진짜 신호는 두 번째 PC 에 있는 경우) 검출 불가.
11.2 너무 크면
자유도 증가로 임계값 증가 → 검정력 손실. 또한 작은 \(\widehat{\lambda}_k\) 가 분모에 등장하여 통계량이 불안정.
11.3 권장 절차
- CPV 임계값 시작: \(X, Y\) 각각 85% (또는 90%) 분산 설명 시점.
- 민감도 분석: \(p, q\) 를 \(\pm 1\) 변화시키며 결과 안정성 확인.
- 표본 크기 고려: \(N\) 이 작으면 보수적으로 선택 (\(p, q < 5\) 권장).
- 도메인 지식: 진짜 효과가 후순위 PC 에 있을 가능성이 있으면 추가 PC 포함.
11.4 비유: 카메라의 분해능
해상도가 낮은 카메라(작은 p, q)는 빠르고 견고하지만 세부를 놓친다. 해상도가 높은 카메라(큰 p, q)는 세부를 잡지만 잡음에도 민감. 데이터의 본질적 구조에 맞는 해상도 를 선택하는 것이 핵심 — 너무 낮지도, 너무 높지도 않게.
12 검정의 한계와 보완
12.1 한계 1: 선형 효과만 검출
이 검정은 선형 모형 (5.10) 하에서 의 효과 검출. \(X\) 와 \(Y\) 사이에 비선형 관계가 있어도 선형 부분이 0 이면 \(H_0\) 가 참이 아닐 수 있음에도 기각하지 못할 수 있다.
해결: 비선형 효과는 5.7 의 산점도 진단 또는 Ch.6 의 함수 GLM 으로 검사.
12.2 한계 2: iid 가정
오차 함수 \(\varepsilon_i\) 가 iid 가우스. 시간 시리즈 함수 데이터(Ch.8) 같은 종속 데이터에서는 점근 분포가 달라진다 (장기 공분산 기반의 변형 통계량 필요).
12.3 한계 3: 절단 차원의 영향
p, q 선택이 결과에 영향. 민감도 분석 권장 (위 가이드 참조).
12.4 보완 도구
| 상황 | 도구 |
|---|---|
| 비선형성 의심 | 5.7 산점도 진단 |
| 시간 종속성 | Ch.8 함수 시계열 검정 |
| 강건성 필요 | 부트스트랩 또는 순열 검정 (fosr.perm) |
| 다중 회귀자 | 각 회귀자별 검정 + 다중 비교 보정 |
13 두 절의 통합 시각
13.1 한 줄 요약
함수-on-함수 회귀의 핵 ψ(t,s) 는 X 와 Y 의 EFPC 텐서 곱으로 분해되며, 분해 계수가 점수 공분산 / X 의 고유값의 단순 비율 (식 5.17) 이다. 이 분해 framework 에서 효과 없음 검정 H₀: ψ=0 이 자연스럽게 도출 — 점수 공분산 제곱의 정규화된 합이 χ²_{pq} 분포를 따른다 (식 5.22).
13.2 5.3~5.4 와의 비교
| 측면 | 5.3~5.4 (양방향 기저) | 5.5~5.6 (FPCA 기반) |
|---|---|---|
| 기저 | 결정적 (B-spline 등) | 데이터 기반 (EFPC) |
| 모수 수 | \(G = M_t \times M_s\) 큰 수 | \(p \times q\) 작은 수 |
| 정칙화 | 라플라시안 벌점 (연속) | EFPC 절단 (이산) |
| 자동화 | pffr (REML) |
pca.fd + 행렬 곱 |
| 검정 | (별도 도구 필요) | 자연스러운 χ² 검정 따라옴 |
| 강점 | 일반적, 자동화 | 데이터 적응적, 검정 통합 |
| 약점 | 모수 폭발 | EFPC 가 Y 와 무관할 수 있음 |
두 접근은 보완적이며 실무에서는 함께 사용 — pffr 로 추정한 후 5.6 의 카이제곱 검정으로 사후 검증.
13.3 Chapter 5 후속 절과의 연결
| 후속 절 | 5.5~5.6 의 도구를 어떻게 확장하는가 |
|---|---|
| 5.7 선형성 진단 | EFPC 점수 산점도 — 5.5 의 분해가 진단 도구로 변환 |
| 5.8 확장과 참고문헌 | Scheipl et al. (2015) mixed model, Yao et al. (2005) 희소 데이터 |
| Ch.6 함수 GLM | EFPC 분해 + 링크 함수로 비정규 반응 일반화 |
| Ch.8 함수 시계열 | FAR(1) 의 추정 연산자 \(\Phi = C_1 C^{-1}\) — 5.5 의 framework 응용 |
| Ch.12 추론 | 평균 함수 검정·신뢰 밴드 — 5.6 의 카이제곱 framework 일반화 |
5.5~5.6 의 토대 — EFPC 분해 + 점수 공분산 + 카이제곱 검정 — 이 FDA 의 추론 framework 의 표준이며, 후속 챕터들이 모두 이 위에서 추가 도구를 쌓는다.
14 관련 주제
선행 지식
- FDA 1.0 — 개요
- FDA 1.3~1.4 — 주성분 함수(EFPC)와 BOA 주식 수익률
- FDA 3.1~3.2 — L² 공간과 확률 함수, Karhunen-Loève 전개
- FDA 3.3 — 선형 변환과 공분산 연산자
- FDA 4.5~4.6 — 거칠기 벌점 추정과 FPCA 회귀
- FDA 5.0 — 함수 반응 모형 개관
- FDA 5.1~5.2 — 함수-on-스칼라 회귀
- FDA 5.3~5.4 — 함수-on-함수 회귀와 refund 통합 구현
후속 주제
관련 개념
- PCA 회귀 (PCR) — FPCA 회귀의 다변량 원조
- 카이제곱 검정 — 점근 분포의 표준 도구
- 공분산 연산자와 스펙트럼 분해 — 5.5 분해의 토대
- Hotelling’s T² 검정 — 다변량 영가설 검정의 함수 일반화 근거