FDA 11.3~11.4 — 가우스 함수와 극한 정리, 함수 주성분

특성 범함수·Hilbert CLT/LLN·KL 전개의 최적성·Wiener·Brownian bridge 의 닫힌 형태 EFPC

Kokoszka & Reimherr (2017) Ch.11 의 후반 두 절을 상세히 다룬다. 11.3 절은 특성 범함수의 정의, 가우스 확률 함수의 특성 범함수 형태 (Definition 11.3.2), “모든 1 차원 사영이 정규” 라는 등가 조건 (Theorem 11.3.1), Hilbert 공간 중심극한정리 (Theorem 11.3.2) 와 큰수의 법칙 (Theorem 11.3.3) 을 다룬다. 11.4 절은 임의의 정규직교 시스템 중 KL EFPC 가 기대 잔차 제곱을 최소화함을 보이는 최적성 정리 (Theorem 11.4.1), KL 전개의 점수 비상관성·분산 분해 (Eq. 11.7-11.8), 가우스 함수에서의 점수 독립성 (Example 11.4.1), Wiener process 와 Brownian bridge 의 sin 기반 닫힌 형태 EFPC (Theorem 11.4.2) 와 그 증명 (ODE 환원), 그리고 지정 EFPC 와 고유값을 갖는 함수 데이터의 표준 시뮬레이션 식 (Eq. 11.10) 을 다룬다. 각 정의·정리 뒤에 직관적 비유와 R 시뮬레이션 코드를 병치하여 추상 개념을 구체화한다.

Statistics
Functional Data Analysis
저자

Kwangmin Kim

공개

2026년 05월 07일

1 이 절의 위치와 목적

11.1~11.2 절이 거리 공간 확률 원소와 Hilbert 공간 기댓값·공분산 연산자의 토대를 세웠다. 11.3~11.4 는 그 위에 가우스 분포함수 주성분 (KL 전개) 이라는 FDA 의 두 핵심 도구를 올린다.

두 절의 역할
  • 11.3: 특성 범함수로 가우스 함수를 정의하고, “모든 1 차원 사영이 정규” 라는 등가 조건을 통해 함수 가우스성 검증을 1 차원 정규성 검증으로 환원. Hilbert CLT/LLN 으로 표본 평균의 점근 분포를 제공.
  • 11.4: 정규직교 시스템 중 KL EFPC 가 기대 잔차 제곱을 최소화함을 증명. Wiener process 와 Brownian bridge 의 닫힌 형태 EFPC 가 sin 함수임을 ODE 환원으로 도출.

1.1 왜 이 두 절이 함께 묶이는가

가우스 함수와 KL 전개가 깊이 연결된다:

  1. 가우스 함수의 분포가 평균 + 공분산 연산자로 완전 결정 — Definition 11.3.2 의 특성 범함수.
  2. 공분산 연산자의 고유함수가 KL 의 EFPC — Theorem 11.4.1.
  3. 가우스 함수의 KL 점수가 독립 정규 — Example 11.4.1.

이 세 결과가 결합되어 가우스 함수의 시뮬레이션·검정·차원 축소가 모두 EFPC 를 통해 이루어짐 — FDA 표준 도구의 핵심.

1.2 비유: 무한차원 종 분포의 건축

스칼라 가우스 = 평균 + 분산 두 모수. 함수 가우스 = 평균 함수 + 공분산 연산자 두 모수.

차이: 함수 공분산 연산자가 무한차원 분산 행렬 처럼 작동 — KL 분해로 무수히 많은 직교 방향과 그 분산 (\(\lambda_j\)) 을 동시에 결정. 가우스 = 모든 1 차원 사영이 정규 = 무한차원 종 분포.

1.3 학습 목표

이 포스트를 마치면 독자는:

  1. 특성 범함수 의 정의와 가우스 함수의 특성 범함수 형태.
  2. Theorem 11.3.1: 가우스성을 1 차원 사영의 정규성으로 검증하는 방법.
  3. Hilbert CLT/LLN 의 진술과 응용 영역 (BOA 누적 수익률, 신뢰 대역).
  4. KL 최적성 정리 의 증명 (Rayleigh-Ritz 환원).
  5. Wiener·Brownian bridge 의 sin 기반 EFPC 와 ODE 환원 증명.
  6. 함수 데이터 시뮬레이션 식 (Eq. 11.10) 과 패키지 구현.

이 6 개가 Ch.12 (표본 추론), Ch.7 (PACE), Ch.8 (FAR(1)) 의 점근 결과를 읽고 검증할 수 있는 최종 도구.


2 가우스 함수와 극한 정리 (11.3)

2.1 특성 범함수의 정의

Definition 11.3.1 — Characteristic Functional

separable Hilbert 공간 \(\mathcal{H}\) 의 random function \(X\) 에 대해:

\[ \mathcal{H} \ni y \mapsto \varphi_X(y) = E\exp\{i \langle y, X \rangle\}. \]

2.2 직관: 스칼라 특성 함수의 자연스러운 일반화

스칼라 random variable \(X\) 의 특성 함수 \(\varphi(t) = E e^{itX}\) — Fourier 변환과 동일한 형태로 확률 분포를 unique 하게 결정.

함수의 경우 1 차원 인덱스 \(t \in \mathbb{R}\) 대신 무한차원 인덱스 \(y \in \mathcal{H}\) 사용. 그 외 형태는 동일.

2.3 Riesz 와의 연결

\(\langle y, X \rangle\) 가 스칼라 random variable — 그 분포의 특성 함수가 \(t = 1\) 에서 평가된 값이 정확히 \(\varphi_X(y)\).

함수의 특성 범함수 = 모든 1 차원 사영의 특성 함수의 모음. 이 한 줄이 Theorem 11.3.1 의 근간.

2.4 비유: 모든 각도에서 본 그림자의 종합

3D 입체를 모든 각도로 비추어 그림자를 모으면 입체가 결정된다. 함수 분포도 마찬가지 — 모든 방향 \(y\) 의 1 차원 사영 분포 를 모으면 함수 분포가 결정 (특성 범함수의 일대일 대응).

2.5 가우스 함수의 정의

Definition 11.3.2 — Gaussian Random Function

random function \(X\) 가 다음 형태의 특성 범함수를 가지면 Gaussian:

\[ \varphi_X(y) = \exp\Bigl\{i \langle \mu, y \rangle - \tfrac{1}{2} \langle C(y), y \rangle\Bigr\}, \]

여기서 \(\mu \in \mathcal{H}\), \(C\) 는 공분산 연산자.

2.6 다변량 정규의 일반화

다변량 정규 (\(X \sim N(\mu, \Sigma)\)) 의 특성 함수:

\[ \varphi_X(t) = \exp\bigl\{i t^\top \mu - \tfrac{1}{2} t^\top \Sigma t\bigr\}, \quad t \in \mathbb{R}^d. \]

함수 가우스 = 정확히 같은 형태에서 \(t \to y\), \(\Sigma \to C\) 의 무한차원 일반화.

2.7 가우스 함수의 자동 보장

Definition 11.3.2 의 형태로부터:

  • \(E\|X\|^2 < \infty\) (square integrable, Laha & Roghatgi 1979 Section 7.6).
  • \(E X = \mu\), \(X\) 의 공분산 연산자 = \(C\).
  • 임의의 \(y \in \mathcal{H}\) 에 대해 \(\langle y, X \rangle \sim N(\langle y, \mu \rangle, \langle C(y), y \rangle)\).

두 모수 (\(\mu, C\)) 만으로 분포 완전 결정 — 다변량 정규의 직접 일반화.

2.8 Theorem 11.3.1 — 가우스의 등가 조건

가우스성의 1 차원 환원

random function \(X\) 가 가우스 (\(E X = 0\)) ⟺ 임의의 \(y \in \mathcal{H}\) 에 대해 \(\langle y, X \rangle\) 가 평균 0 의 정규 random variable.

2.9 직관: “모든 1 차원 사영이 정규” = “함수 자체가 가우스”

다변량 정규의 정의 (\(a^\top X\) 가 항상 정규) 의 직접 함수 일반화. 이 한 정리가:

  • 검증을 1 차원으로 환원: 함수의 가우스성을 검증하려면 모든 \(y\) 방향 사영의 정규성만 확인.
  • 시뮬레이션의 자동 정당화: 표준 정규 변수의 선형 결합으로 함수 가우스를 구성 가능.
  • 점수 독립성의 자동 도출: KL 점수 \(\xi_j\) 가 비상관 + 가우스 → 독립.

2.10 비유: 만화경의 모든 회전이 같은 무늬

가우스 함수 = “만화경을 어느 각도로 돌려도 모두 정규 분포”. 비-가우스 = 각도마다 무늬가 달라 통일된 묘사 불가능.

이 등가성이 가우스의 강력함의 본질 — 한 1 차원 검증 (예: \(\int X(t) dt\) 의 정규성) 이 모든 1 차원에서 정규성 검증과 동치.

2.11 시뮬레이션: 함수 가우스의 1 차원 사영

# Wiener process 시뮬레이션 (가우스 함수의 대표적 예)
set.seed(1)
N <- 1000
T <- 100
times <- seq(0, 1, length.out = T)
X <- matrix(0, N, T)
for (i in seq_len(N)) {
  X[i, ] <- cumsum(rnorm(T, sd = 1/sqrt(T)))
}
# 임의 방향 y 의 1 차원 사영: <X, y> = sum(X * y) / T
# y_1: 상수 함수 1
proj1 <- rowMeans(X)
# y_2: sin(pi t)
proj2 <- rowMeans(X * sin(pi * times))
# y_3: t * (1 - t)
proj3 <- rowMeans(X * (times * (1 - times)))
# 모든 사영이 정규 분포 → Q-Q plot 으로 확인
par(mfrow = c(1, 3))
qqnorm(proj1, main = "<X, 1>"); qqline(proj1, col = "red")
qqnorm(proj2, main = "<X, sin(pi t)>"); qqline(proj2, col = "red")
qqnorm(proj3, main = "<X, t(1-t)>"); qqline(proj3, col = "red")

세 사영 모두 정규 직선과 일치 → Wiener process 의 가우스성 시각적 검증.

2.12 Hilbert 공간 CLT (Theorem 11.3.2)

함수 중심극한정리

\(X_i\) 가 iid square integrable, \(E X_i = \mu\), 공분산 연산자 \(C\) 일 때:

\[ N^{-1/2} \sum_{i=1}^N (X_i - \mu) \xrightarrow{d} Z, \]

여기서 \(Z\) 는 평균 0, 공분산 연산자 \(C\) 의 가우스 함수.

2.13 직관: 스칼라 CLT 의 직접 일반화

스칼라 CLT: \(\sqrt{N}(\bar{X}_N - \mu) \xrightarrow{d} N(0, \sigma^2)\). 분산 \(\sigma^2\) 가 한계 분포의 모수.

함수 CLT: \(\sqrt{N}(\bar{X}_N - \mu) \xrightarrow{d} Z\), \(Z\) 의 분포가 공분산 연산자 \(C\) 로 완전 결정. 한계 분포가 가우스 함수.

증명의 핵심: Theorem 11.1.3 의 절단 기법. 유한차원 (KL 절단 후 첫 \(J\) 점수) 에서 다변량 CLT 적용 → 절단 차원을 키워 함수 분포로 확장.

2.14 Hilbert CLT 의 응용 영역

CLT 가 진입하는 곳
  • Ch.12: 표본 평균의 점근 정규성. \(\sqrt{N}(\bar{X}_N - \mu) \xrightarrow{d} Z\) → 신뢰 대역 구축.
  • BOA 일중 누적 수익률: 일별 누적 곡선이 거의 가우스에 가까움 → CLT 응용.
  • Ch.7: PACE 추정량의 점근 분포 — Slutsky + CLT 결합.
  • Ch.8: FAR(1) 의 추정량 — weak dependence CLT 로 일반화.
  • 가설 검정: \(\|\bar{X}_N - \mu_0\|^2 \xrightarrow{d} \|Z\|^2 = \sum \lambda_j N_j^2\) — chi-square 형태의 검정 통계량.

2.15 비유: 무한차원 종 분포의 건축

스칼라 CLT = 단일 기둥의 종 분포. 함수 CLT = 무수히 많은 기둥들 (각 \(t\) 의 평균) 의 동시 종 분포. 각 기둥마다 다른 분산 (\(\lambda_j\)) 을 갖지만 전체적으로 통합된 가우스 곡선.

2.16 Hilbert 공간 LLN (Theorem 11.3.3)

Hilbert 공간 큰수의 법칙

\(X_i\) 가 iid integrable (\(E\|X_i\| < \infty\)), \(E X_i = \mu\) 이면:

\[ N^{-1} \sum_{i=1}^N X_i \xrightarrow{a.s.} \mu. \]

거의 확실한 수렴 (almost sure) — 가장 강력한 수렴 모드. 표본 평균의 일치성 증명의 출발점.

2.17 iid 가정의 완화

약한 의존성으로의 일반화

CLT 와 LLN 모두 iid 가정을 weak dependence 로 완화 가능:

  • Ch.8 (functional time series): FAR(1) 와 같은 약한 의존성 모형에 같은 결과 적용.
  • 장기 공분산 함수 (LRCF): 의존성 하의 점근 분산 추정.
  • Bosq 2000 / Hörmann-Kokoszka 2010: 표준 참고문헌.

핵심 조건: 의존성이 충분히 빨리 감소 (\(\alpha\)-mixing 또는 cumulant summability) → 같은 가우스 한계 분포.


3 함수 주성분 (11.4)

3.1 KL 최적성 정리

Theorem 11.4.1 — Optimality of FPC

\(X\) 가 square integrable, 공분산 연산자 \(C\) 의 고유값이 단조 감소 (\(\lambda_1 \geq \lambda_2 \geq \ldots > 0\)). 임의의 \(p \geq 1\) 에 대해 함수

\[ S(u_1, \ldots, u_p) = E\Bigl\| X - \sum_{k=1}^p \langle X, u_k \rangle u_k \Bigr\|^2 \tag{11.5} \]

이 정규직교 시스템 \((u_1, \ldots, u_p)\) 위에서 최소가 되는 곳은 정확히 \(C\) 의 고유함수 \((v_1, \ldots, v_p)\).

3.2 증명의 핵심 단계

정규직교성 활용:

\[ S(u_1, \ldots, u_p) = E\|X\|^2 - \sum_{k=1}^p E\langle X, u_k \rangle^2. \]

(11.1) 의 약적분 정의 + 공분산 연산자의 정의:

\[ E\langle X, u_k \rangle^2 = \langle E[\langle X, u_k \rangle X], u_k \rangle = \langle C(u_k), u_k \rangle. \]

따라서 \(S\) 의 최소화 ⟺ \(\sum_{k=1}^p \langle C(u_k), u_k \rangle\) 의 최대화.

3.3 Rayleigh-Ritz 환원

Theorem 10.4.5 (Rayleigh-Ritz):

  • \(\langle C(u_1), u_1 \rangle\) 의 최댓값은 \(\lambda_1\), \(u_1 = v_1\) 에서 달성 (부호 제외).
  • \(u_2 \perp u_1\) 조건에서 \(\langle C(u_2), u_2 \rangle\) 의 최댓값은 \(\lambda_2\), \(u_2 = v_2\) 에서 달성.
  • 반복 → 모든 \(u_k = v_k\) 에서 합이 최대.

3.4 직관: 왜 EFPC 가 “최적” 기저인가

함수 데이터를 \(p\) 개 함수의 선형 결합으로 근사할 때, 기대 잔차 제곱 의 최소가 EFPC. 다른 어떤 정규직교 시스템 (Fourier, Spline, Wavelet 등) 도 이 의미에서 EFPC 보다 못함.

핵심: EFPC 가 데이터의 분산 구조에 적응 — Fourier 등 결정적 기저는 분산 구조와 무관.

3.5 비유: 손전등의 가장 밝은 방향

3D 빛이 비추는 방향을 1 개 골라 가장 큰 강도를 얻고 싶을 때 — 가장 큰 분산을 가진 축 (PC1).

EFPC 가 정확히 같은 사고의 함수 일반화 — 무한차원 빛 (random function) 을 가장 잘 비추는 첫 \(p\) 개 방향.

3.6 KL 전개 (Eq. 11.6)

Karhunen-Loève Expansion

\(\mu = E X\), \(v_j\)\(C\) 의 고유함수 (단위 노름), \(\xi_j = \langle X - \mu, v_j \rangle\) 일 때:

\[ X - \mu = \sum_{j=1}^\infty \xi_j v_j, \tag{11.6} \]

또는 \(L^2\) 함수 형태:

\[ X(t) = \mu(t) + \sum_{j=1}^\infty \xi_j v_j(t). \]

3.7 점수의 성질 (Eq. 11.7)

KL 점수의 통계적 성질

(11.7) — 임의의 \(i \neq j\):

\[ E \xi_j = 0, \quad E \xi_j^2 = \lambda_j, \quad E[\xi_j \xi_i] = 0. \]

3.8 분산 분해 (Eq. 11.8)

함수 분산의 직교 분해

Parseval 등식 (10.4) 적용:

\[ E \|X - \mu\|^2 = \sum_{j=1}^\infty \lambda_j. \tag{11.8} \]

\(L^2\) 형태:

\[ E\int (X(t) - \mu(t))^2 dt = \sum_{j=1}^\infty \lambda_j. \]

3.9 직관: 분산을 직교 방향으로 무한 분해

공분산 연산자의 고유분해가 분산을 무한히 많은 직교 방향으로 분해:

  • \(\lambda_1\) — 가장 큰 분산 (PC1).
  • \(\lambda_2\) — 두 번째 (PC2).
  • \(\sum \lambda_j\) — 총 변동.

이 분해가 FDA 의 핵심:

  • 차원 축소: 첫 \(p\) 개 점수만 유지 → 분산 비율 \(\sum_{j=1}^p \lambda_j / \sum \lambda_j\).
  • 신호/잡음 분리: 큰 \(\lambda_j\) = 신호, 작은 \(\lambda_j\) = 잡음 가능성.
  • 분산 분석: 그룹 간 분산 차이를 EFPC 별로 비교.

3.10 비유: 음악의 하모닉 분해

소리 신호 = 모든 주파수 (하모닉) 의 합. 각 주파수의 에너지가 \(\lambda_j\). 일반적으로:

  • 저주파 (큰 \(\lambda_j\)) = 멜로디·전체 변동.
  • 고주파 (작은 \(\lambda_j\)) = 미세 디테일·잡음.

함수 데이터의 EFPC 분해도 같은 패턴 — 첫 몇 개의 EFPC 가 데이터의 큰 변동을 설명, 나머지는 잡음에 가까움.

3.11 Gaussian KL — 점수의 독립성 (Example 11.4.1)

가우스 함수의 KL 점수는 독립

\(X\) 가 가우스 함수 (\(E X = \mu\)) 이면:

\[ X(t) = \mu(t) + \sum_{j=1}^\infty \sqrt{\lambda_j} N_j v_j(t), \]

여기서 \(N_j \stackrel{iid}{\sim} N(0, 1)\).

3.12 증명의 핵심

  1. Theorem 11.3.1: \(\sum_{j=1}^d a_j \xi_j = \langle X - \mu, \sum_j a_j v_j \rangle\) 이 정규 (임의의 \(d, a_j\)). → \(\xi_j\) 가 jointly normal.
  2. (11.7): \(\xi_j\) 가 비상관.
  3. Joint normal + 비상관 → 독립 (\(\xi_j = \sqrt{\lambda_j} N_j\)).

3.13 직관: 가우스성이 비상관 → 독립을 보장

일반적으로 비상관 ≠ 독립 (스칼라 예: \(X \sim N(0, 1)\), \(Y = X^2\) — 비상관이지만 종속).

그러나 joint normal 인 경우에만 비상관 ⟺ 독립 — 가우스 함수의 KL 점수에서 정확히 이 등가성이 작동.

3.14 응용: 가우스 함수의 단순 시뮬레이션

# 지정 EFPC + 고유값으로 가우스 함수 시뮬레이션
set.seed(1)
N <- 100
T <- 50
times <- seq(0, 1, length.out = T)
# 평균 함수
mu <- sin(2 * pi * times)
# EFPC: Wiener 의 sin 기반
J <- 5
v <- matrix(0, J, T)
lambda <- numeric(J)
for (j in seq_len(J)) {
  v[j, ] <- sqrt(2) * sin((j - 0.5) * pi * times)
  lambda[j] <- 1 / ((j - 0.5)^2 * pi^2)
}
# 점수: 독립 정규
N_scores <- matrix(rnorm(N * J), N, J)
xi <- sweep(N_scores, 2, sqrt(lambda), `*`)
# 함수 데이터 생성: X(t) = mu(t) + sum xi_j v_j(t)
X <- t(replicate(N, mu)) + xi %*% v
# 시각화
matplot(times, t(X[1:20, ]), type = "l", col = "gray",
        xlab = "t", ylab = "X(t)",
        main = "Gaussian functions via KL with Wiener-like FPC")
lines(times, mu, col = "red", lwd = 2)

20 개의 가우스 함수가 빨간 평균 함수 주위에서 자연스럽게 흔들림 — 무한차원 정규 분포의 시뮬레이션.


4 Wiener Process 와 Brownian Bridge (11.4.1)

4.1 정의

Definition 11.4.1

Wiener process \(\{W(t), t \in [0, 1]\}\):

  • \(W(0) = 0\) a.s.
  • \(0 \leq s < t \leq 1\) 에 대해 \(W(t) - W(s) \sim N(0, t - s)\).
  • \(0 \leq t_0 < t_1 < \ldots < t_k \leq 1\) 에 대해 \(W(t_j) - W(t_{j-1})\) 가 독립.

Brownian bridge:

\[ B(t) = W(t) - t W(1), \quad t \in [0, 1]. \]

4.2 직관: 두 과정의 차이

  • Wiener (Brownian motion): 시작 \(W(0) = 0\), 끝 \(W(1)\) 자유. 누적 백색 잡음 — 시간이 지남에 따라 분산 증가.
  • Brownian bridge: 시작 \(B(0) = 0\), 끝 \(B(1) = 0\) 강제. Wiener 의 양 끝을 0 으로 묶음.

4.3 비유: 자유 산책 vs 정해진 약속

  • Wiener = 길거리에서 무작위로 걷는 사람 — 시작점만 정해짐.
  • Brownian bridge = 양 끝의 약속 시간이 정해진 산책 — 시작과 끝이 정해진 무작위 곡선.

4.4 Proposition 11.4.1 — 공분산 함수

두 과정의 공분산

\[ c_W(t, s) = \min(t, s), \]

\[ c_B(t, s) = \min(t, s) - ts. \]

4.5 직관: \(\min(t, s)\) 의 의미

Wiener 의 공분산 \(c_W(t, s) = \min(t, s)\):

  • \(t = s\) 이면 \(c_W(t, t) = t\) — 시점 \(t\) 까지의 누적 분산.
  • \(t < s\) 이면 \(c_W(t, s) = t\) — 두 시점이 공유하는 시간 (\([0, t]\)) 의 분산.

이는 독립 증분 가정의 직접 결과: \(W(t)\)\(W(s) - W(t)\) 가 독립 → 공분산이 공유 구간으로 결정.

4.6 Theorem 11.4.2 — 닫힌 형태 EFPC

Wiener · Bridge 의 EFPC 와 고유값

Wiener process:

\[ v_j(t) = \sqrt{2} \sin\bigl((j - \tfrac{1}{2}) \pi t\bigr), \quad \lambda_j = \frac{1}{(j - \tfrac{1}{2})^2 \pi^2}. \]

Brownian bridge:

\[ v_j(t) = \sqrt{2} \sin(\pi j t), \quad \lambda_j = \frac{1}{j^2 \pi^2}. \]

4.7 증명의 핵심 — ODE 환원

Wiener 의 경우 적분 방정식:

\[ \int_0^1 \min(s, t) v(s) \, ds = \lambda v(t), \]

이를 \(t\) 별로 나눠 쓰면:

\[ \int_0^t s \cdot v(s) \, ds + t \int_t^1 v(s) \, ds = \lambda v(t). \]

4.8 첫 번째 미분

\[ \int_t^1 v(s) \, ds = \lambda v'(t). \tag{11.9} \]

4.9 두 번째 미분

\[ -v(t) = \lambda v''(t). \]

이는 \(v''(t) + (1/\lambda) v(t) = 0\) — 단순 2 차 ODE. 일반해:

\[ v(t) = A \sin\bigl(t / \sqrt{\lambda}\bigr) + B \cos\bigl(t / \sqrt{\lambda}\bigr). \]

4.10 경계 조건

  • \(\int_0^0 = 0\)\(v(0) = 0\)\(B = 0\).
  • (11.9) 에 \(t = 1\) 대입 → \(v'(1) = 0\)\(\cos(1/\sqrt{\lambda}) = 0\).

4.11 고유값의 결정

\(\cos(1/\sqrt{\lambda}) = 0\)\(1/\sqrt{\lambda} = -\pi/2 + j\pi\), \(j \geq 1\)\(\lambda_j = 1/((j - 1/2)^2 \pi^2)\).

대응 고유함수: \(A \sin(\pi (j - 1/2) t)\). 정규화 조건 \(\int v_j^2 \, dt = 1\)\(A = \sqrt{2}\).

4.12 직관: 진동의 모드와의 일치

ODE \(-v(t) = \lambda v''(t)\) 가 정확히 양 끝이 고정된 줄의 진동 방정식 — 음악의 하모닉.

  • \(j = 1\): 가장 낮은 모드 (가장 큰 \(\lambda\), 가장 큰 분산).
  • \(j = 2, 3, \ldots\): 더 높은 진동 (작은 \(\lambda\)).

EFPC 와 푸리에 기저의 깊은 연결 — Wiener process 의 자연 분해가 sin 기반 (이산 푸리에 사인 변환).

4.13 비유: 줄의 자연 진동 모드

기타 줄을 튕기면 무한히 많은 사인 모드 의 합으로 진동 — 첫 모드가 기본음, 이후가 하모닉.

Wiener process 의 KL 분해가 정확히 이 진동 분해와 일치 — random function 도 “자연스럽게 진동” 하는 모드들의 합.

4.14 코드: Wiener EFPC 시각화

times <- seq(0, 1, length.out = 200)
J <- 4
par(mfrow = c(2, 2))
for (j in seq_len(J)) {
  v_j <- sqrt(2) * sin((j - 0.5) * pi * times)
  lambda_j <- 1 / ((j - 0.5)^2 * pi^2)
  plot(times, v_j, type = "l", lwd = 2,
       main = sprintf("v_%d, lambda_%d = %.4f", j, j, lambda_j),
       xlab = "t", ylab = sprintf("v_%d(t)", j))
  abline(h = 0, lty = 2)
}

각 EFPC 가 점진적으로 더 높은 진동을 보임 — 첫 EFPC 가 가장 부드러운 변동, 후속 EFPC 가 더 미세한 변동.

4.15 Corollary 11.4.1 — KL 전개의 닫힌 형태

Wiener · Bridge 의 KL 전개

\(N_j \sim N(0, 1)\) 독립.

Wiener process:

\[ W(t) = \sum_{j=1}^\infty \frac{\sqrt{2}}{(j - \tfrac{1}{2}) \pi} N_j \sin\bigl((j - \tfrac{1}{2}) \pi t\bigr). \]

Brownian bridge:

\[ B(t) = \sum_{j=1}^\infty \frac{\sqrt{2}}{j \pi} N_j \sin(j \pi t). \]

4.16 시뮬레이션 응용

이 두 식이 함수 시뮬레이션의 표준 방법:

  1. 절단 차수 \(J\) 결정 (예: \(J = 50, 100\)).
  2. 독립 표준 정규 \(N_1, \ldots, N_J\) 생성.
  3. 위 식의 부분 합으로 함수 생성.
set.seed(1)
times <- seq(0, 1, length.out = 200)
J <- 50
N_samples <- 5
par(mfrow = c(1, 2))
# Wiener
W <- matrix(0, N_samples, length(times))
for (n in seq_len(N_samples)) {
  Nj <- rnorm(J)
  for (j in seq_len(J)) {
    W[n, ] <- W[n, ] + sqrt(2) / ((j - 0.5) * pi) * Nj[j] * sin((j - 0.5) * pi * times)
  }
}
matplot(times, t(W), type = "l", main = "Wiener process (KL truncation)",
        xlab = "t", ylab = "W(t)")
# Brownian bridge
B <- matrix(0, N_samples, length(times))
for (n in seq_len(N_samples)) {
  Nj <- rnorm(J)
  for (j in seq_len(J)) {
    B[n, ] <- B[n, ] + sqrt(2) / (j * pi) * Nj[j] * sin(j * pi * times)
  }
}
matplot(times, t(B), type = "l", main = "Brownian bridge (KL truncation)",
        xlab = "t", ylab = "B(t)")

오른쪽 (bridge) 의 양 끝이 0 에 고정됨 — Wiener 와 시각적 차이.


5 임의 EFPC 데이터의 시뮬레이션 (Eq. 11.10)

5.1 시뮬레이션 식

지정 EFPC + 고유값을 갖는 함수 데이터

\(a_j\) 가 실수, \(Z_{jn}\) 이 iid 평균 0 분산 1 random variable, \(e_j\) 가 정규직교 함수일 때:

\[ X_n(t) = \sum_{j=1}^p a_j Z_{jn} e_j(t). \tag{11.10} \]

5.2 공분산 연산자의 도출

\(X(t) = \sum_j a_j Z_j e_j(t)\) 의 공분산 함수:

\[ E[X(t) X(s)] = \sum_{j=1}^p a_j^2 e_j(t) e_j(s). \]

공분산 연산자:

\[ C(x)(t) = \int E[X(t) X(s)] x(s) \, ds = \sum_{j=1}^p a_j^2 \langle e_j, x \rangle e_j(t). \]

5.3 결과

EFPC = \(e_j\), 고유값 = \(a_j^2\). 즉 임의의 정규직교 시스템과 임의의 비음 가중치를 EFPC 와 고유값으로 직접 지정 가능.

5.4 직관: KL 의 역방향 — 디자인 도구

KL 전개가 함수 → EFPC + 고유값의 분해라면, (11.10) 은 EFPC + 고유값 → 함수 의 합성. FDA 시뮬레이션의 표준:

  1. 원하는 데이터의 분산 구조 (\(a_j^2\)) 와 함수 형태 (\(e_j\)) 를 미리 디자인.
  2. 독립 random variable \(Z_{jn}\) 으로 표본 생성.
  3. 각종 점근 결과 (Ch.12), PACE (Ch.7), FAR(1) (Ch.8) 의 검증에 사용.

5.5 비유: 옷의 디자인 vs 분석

KL = 옷을 분석해 부분품 (천, 단추, 색) 으로 분해. (11.10) = 부분품을 모아 옷을 디자인. 두 방향 모두 패션의 핵심 작업 — FDA 의 핵심 도구.

5.6 패키지 구현

R 의 주요 패키지가 (11.10) 을 표준 시뮬레이션 방식으로 사용:

표준 함수 시뮬레이션 패키지
패키지 함수 EFPC 지정
fda fdata, Data2fd 사용자 정의 basis
refund pfr, pffr FPCA 자동
fdapace MakeFPCAResults sparse 시뮬레이션

각 패키지의 시뮬레이션 함수가 내부적으로 (11.10) 형태로 함수 데이터 생성 — Wiener/Brownian bridge 외 임의 공분산 구조 가능.


6 절 종합과 연결

6.1 11.3 → 11.4 의 흐름

특성 범함수 (11.3.1) — 함수 분포의 unique 결정
     ↓
Gaussian 정의 (11.3.2) — μ + C 두 모수만으로 분포 결정
     ↓
Theorem 11.3.1 — 1 차원 사영의 정규성 ⟺ 함수 가우스
     ↓
Hilbert CLT (11.3.2) — 표본 평균의 가우스 한계
     ↓
KL 최적성 (11.4.1) — EFPC 가 잔차 제곱 최소화
     ↓
KL 전개 + 점수 비상관 (11.6, 11.7)
     ↓
Gaussian KL — 점수 독립 (11.4.1)
     ↓
Wiener · Bridge 의 닫힌 형태 EFPC (11.4.2)
     ↓
임의 EFPC 시뮬레이션 (11.10)

6.2 응용으로의 연결

  • Ch.1 BOA 누적 수익률: 일별 누적 곡선이 거의 Wiener-like → KL 분해로 시각화.
  • Ch.7 PACE: 희소 데이터에서 EFPC 추정 — KL 점수의 조건부 기댓값.
  • Ch.8 FAR(1): 자기회귀 연산자가 공분산 연산자의 함수 → KL 분해로 추정 단순화.
  • Ch.12 표본 추론: 표본 EFPC \(\hat{v}_j\) 의 일치성·점근 정규성 → CLT + 연속 사상 결합.
  • 시뮬레이션 모든 곳: (11.10) 형태로 함수 데이터 생성 → 점근 결과 검증.

6.3 핵심 점검표

이 포스트를 마치면 답할 수 있어야 할 질문
  1. 함수 가우스 분포가 두 모수 (\(\mu, C\)) 만으로 결정되는 이유? → 특성 범함수 (Definition 11.3.2).
  2. 함수의 가우스성을 검증하려면? → 임의 1 차원 사영의 정규성만 확인 (Theorem 11.3.1).
  3. 표본 평균의 점근 분포는? → Hilbert CLT 로 가우스 함수 한계 (Theorem 11.3.2).
  4. EFPC 가 다른 정규직교 기저보다 “최적” 인 이유? → 기대 잔차 제곱 최소 (Theorem 11.4.1).
  5. KL 점수가 독립인 충분 조건은? → 함수 가우스성 (Example 11.4.1).
  6. Wiener process 의 EFPC 가 sin 기반인 이유? → 공분산 적분 방정식의 ODE 환원 (Theorem 11.4.2).
  7. 함수 데이터를 임의 공분산 구조로 시뮬레이션하려면? → (11.10) 식 적용.

이 7 개 질문의 답이 모두 나오면 11.3·11.4 의 핵심을 이해한 것 — Ch.12 의 표본 평균·공분산·EFPC 의 일치성과 점근 정규성으로 자연스럽게 진입.


7 참고문헌

  • Kokoszka, P., & Reimherr, M. (2017). Introduction to Functional Data Analysis. Chapman & Hall/CRC. Sections 11.3, 11.4 (pp.239-245).
  • Bosq, D. (2000). Linear Processes in Function Spaces. Springer. Theorem 2.7 — Hilbert 공간 CLT.
  • Laha, R. G., & Roghatgi, V. K. (1979). Probability Theory. Wiley. Section 7.6, Proposition 7.6.5 — Theorem 11.3.1 의 증명.
  • Hörmann, S., & Kokoszka, P. (2010). Weakly dependent functional data. Annals of Statistics, 38(3), 1845-1884. — iid 가정의 weak dependence 일반화.
  • Billingsley, P. (1968). Convergence of Probability Measures. Wiley. — Theorem 11.1.3 의 절단 기법 (CLT 증명에 사용).

Subscribe

Enjoy this blog? Get notified of new posts by email: