1 이 절의 위치와 목적
11.1~11.2 절이 거리 공간 확률 원소와 Hilbert 공간 기댓값·공분산 연산자의 토대를 세웠다. 11.3~11.4 는 그 위에 가우스 분포 와 함수 주성분 (KL 전개) 이라는 FDA 의 두 핵심 도구를 올린다.
- 11.3: 특성 범함수로 가우스 함수를 정의하고, “모든 1 차원 사영이 정규” 라는 등가 조건을 통해 함수 가우스성 검증을 1 차원 정규성 검증으로 환원. Hilbert CLT/LLN 으로 표본 평균의 점근 분포를 제공.
- 11.4: 정규직교 시스템 중 KL EFPC 가 기대 잔차 제곱을 최소화함을 증명. Wiener process 와 Brownian bridge 의 닫힌 형태 EFPC 가 sin 함수임을 ODE 환원으로 도출.
1.1 왜 이 두 절이 함께 묶이는가
가우스 함수와 KL 전개가 깊이 연결된다:
- 가우스 함수의 분포가 평균 + 공분산 연산자로 완전 결정 — Definition 11.3.2 의 특성 범함수.
- 공분산 연산자의 고유함수가 KL 의 EFPC — Theorem 11.4.1.
- 가우스 함수의 KL 점수가 독립 정규 — Example 11.4.1.
이 세 결과가 결합되어 가우스 함수의 시뮬레이션·검정·차원 축소가 모두 EFPC 를 통해 이루어짐 — FDA 표준 도구의 핵심.
1.2 비유: 무한차원 종 분포의 건축
스칼라 가우스 = 평균 + 분산 두 모수. 함수 가우스 = 평균 함수 + 공분산 연산자 두 모수.
차이: 함수 공분산 연산자가 무한차원 분산 행렬 처럼 작동 — KL 분해로 무수히 많은 직교 방향과 그 분산 (\(\lambda_j\)) 을 동시에 결정. 가우스 = 모든 1 차원 사영이 정규 = 무한차원 종 분포.
1.3 학습 목표
이 포스트를 마치면 독자는:
- 특성 범함수 의 정의와 가우스 함수의 특성 범함수 형태.
- Theorem 11.3.1: 가우스성을 1 차원 사영의 정규성으로 검증하는 방법.
- Hilbert CLT/LLN 의 진술과 응용 영역 (BOA 누적 수익률, 신뢰 대역).
- KL 최적성 정리 의 증명 (Rayleigh-Ritz 환원).
- Wiener·Brownian bridge 의 sin 기반 EFPC 와 ODE 환원 증명.
- 함수 데이터 시뮬레이션 식 (Eq. 11.10) 과 패키지 구현.
이 6 개가 Ch.12 (표본 추론), Ch.7 (PACE), Ch.8 (FAR(1)) 의 점근 결과를 읽고 검증할 수 있는 최종 도구.
2 가우스 함수와 극한 정리 (11.3)
2.1 특성 범함수의 정의
separable Hilbert 공간 \(\mathcal{H}\) 의 random function \(X\) 에 대해:
\[ \mathcal{H} \ni y \mapsto \varphi_X(y) = E\exp\{i \langle y, X \rangle\}. \]
2.2 직관: 스칼라 특성 함수의 자연스러운 일반화
스칼라 random variable \(X\) 의 특성 함수 \(\varphi(t) = E e^{itX}\) — Fourier 변환과 동일한 형태로 확률 분포를 unique 하게 결정.
함수의 경우 1 차원 인덱스 \(t \in \mathbb{R}\) 대신 무한차원 인덱스 \(y \in \mathcal{H}\) 사용. 그 외 형태는 동일.
2.3 Riesz 와의 연결
\(\langle y, X \rangle\) 가 스칼라 random variable — 그 분포의 특성 함수가 \(t = 1\) 에서 평가된 값이 정확히 \(\varphi_X(y)\).
즉 함수의 특성 범함수 = 모든 1 차원 사영의 특성 함수의 모음. 이 한 줄이 Theorem 11.3.1 의 근간.
2.4 비유: 모든 각도에서 본 그림자의 종합
3D 입체를 모든 각도로 비추어 그림자를 모으면 입체가 결정된다. 함수 분포도 마찬가지 — 모든 방향 \(y\) 의 1 차원 사영 분포 를 모으면 함수 분포가 결정 (특성 범함수의 일대일 대응).
2.5 가우스 함수의 정의
random function \(X\) 가 다음 형태의 특성 범함수를 가지면 Gaussian:
\[ \varphi_X(y) = \exp\Bigl\{i \langle \mu, y \rangle - \tfrac{1}{2} \langle C(y), y \rangle\Bigr\}, \]
여기서 \(\mu \in \mathcal{H}\), \(C\) 는 공분산 연산자.
2.6 다변량 정규의 일반화
다변량 정규 (\(X \sim N(\mu, \Sigma)\)) 의 특성 함수:
\[ \varphi_X(t) = \exp\bigl\{i t^\top \mu - \tfrac{1}{2} t^\top \Sigma t\bigr\}, \quad t \in \mathbb{R}^d. \]
함수 가우스 = 정확히 같은 형태에서 \(t \to y\), \(\Sigma \to C\) 의 무한차원 일반화.
2.7 가우스 함수의 자동 보장
Definition 11.3.2 의 형태로부터:
- \(E\|X\|^2 < \infty\) (square integrable, Laha & Roghatgi 1979 Section 7.6).
- \(E X = \mu\), \(X\) 의 공분산 연산자 = \(C\).
- 임의의 \(y \in \mathcal{H}\) 에 대해 \(\langle y, X \rangle \sim N(\langle y, \mu \rangle, \langle C(y), y \rangle)\).
즉 두 모수 (\(\mu, C\)) 만으로 분포 완전 결정 — 다변량 정규의 직접 일반화.
2.8 Theorem 11.3.1 — 가우스의 등가 조건
random function \(X\) 가 가우스 (\(E X = 0\)) ⟺ 임의의 \(y \in \mathcal{H}\) 에 대해 \(\langle y, X \rangle\) 가 평균 0 의 정규 random variable.
2.9 직관: “모든 1 차원 사영이 정규” = “함수 자체가 가우스”
다변량 정규의 정의 (\(a^\top X\) 가 항상 정규) 의 직접 함수 일반화. 이 한 정리가:
- 검증을 1 차원으로 환원: 함수의 가우스성을 검증하려면 모든 \(y\) 방향 사영의 정규성만 확인.
- 시뮬레이션의 자동 정당화: 표준 정규 변수의 선형 결합으로 함수 가우스를 구성 가능.
- 점수 독립성의 자동 도출: KL 점수 \(\xi_j\) 가 비상관 + 가우스 → 독립.
2.10 비유: 만화경의 모든 회전이 같은 무늬
가우스 함수 = “만화경을 어느 각도로 돌려도 모두 정규 분포”. 비-가우스 = 각도마다 무늬가 달라 통일된 묘사 불가능.
이 등가성이 가우스의 강력함의 본질 — 한 1 차원 검증 (예: \(\int X(t) dt\) 의 정규성) 이 모든 1 차원에서 정규성 검증과 동치.
2.11 시뮬레이션: 함수 가우스의 1 차원 사영
# Wiener process 시뮬레이션 (가우스 함수의 대표적 예)
set.seed(1)
N <- 1000
T <- 100
times <- seq(0, 1, length.out = T)
X <- matrix(0, N, T)
for (i in seq_len(N)) {
X[i, ] <- cumsum(rnorm(T, sd = 1/sqrt(T)))
}
# 임의 방향 y 의 1 차원 사영: <X, y> = sum(X * y) / T
# y_1: 상수 함수 1
proj1 <- rowMeans(X)
# y_2: sin(pi t)
proj2 <- rowMeans(X * sin(pi * times))
# y_3: t * (1 - t)
proj3 <- rowMeans(X * (times * (1 - times)))
# 모든 사영이 정규 분포 → Q-Q plot 으로 확인
par(mfrow = c(1, 3))
qqnorm(proj1, main = "<X, 1>"); qqline(proj1, col = "red")
qqnorm(proj2, main = "<X, sin(pi t)>"); qqline(proj2, col = "red")
qqnorm(proj3, main = "<X, t(1-t)>"); qqline(proj3, col = "red")세 사영 모두 정규 직선과 일치 → Wiener process 의 가우스성 시각적 검증.
2.12 Hilbert 공간 CLT (Theorem 11.3.2)
\(X_i\) 가 iid square integrable, \(E X_i = \mu\), 공분산 연산자 \(C\) 일 때:
\[ N^{-1/2} \sum_{i=1}^N (X_i - \mu) \xrightarrow{d} Z, \]
여기서 \(Z\) 는 평균 0, 공분산 연산자 \(C\) 의 가우스 함수.
2.13 직관: 스칼라 CLT 의 직접 일반화
스칼라 CLT: \(\sqrt{N}(\bar{X}_N - \mu) \xrightarrow{d} N(0, \sigma^2)\). 분산 \(\sigma^2\) 가 한계 분포의 모수.
함수 CLT: \(\sqrt{N}(\bar{X}_N - \mu) \xrightarrow{d} Z\), \(Z\) 의 분포가 공분산 연산자 \(C\) 로 완전 결정. 한계 분포가 가우스 함수.
증명의 핵심: Theorem 11.1.3 의 절단 기법. 유한차원 (KL 절단 후 첫 \(J\) 점수) 에서 다변량 CLT 적용 → 절단 차원을 키워 함수 분포로 확장.
2.14 Hilbert CLT 의 응용 영역
- Ch.12: 표본 평균의 점근 정규성. \(\sqrt{N}(\bar{X}_N - \mu) \xrightarrow{d} Z\) → 신뢰 대역 구축.
- BOA 일중 누적 수익률: 일별 누적 곡선이 거의 가우스에 가까움 → CLT 응용.
- Ch.7: PACE 추정량의 점근 분포 — Slutsky + CLT 결합.
- Ch.8: FAR(1) 의 추정량 — weak dependence CLT 로 일반화.
- 가설 검정: \(\|\bar{X}_N - \mu_0\|^2 \xrightarrow{d} \|Z\|^2 = \sum \lambda_j N_j^2\) — chi-square 형태의 검정 통계량.
2.15 비유: 무한차원 종 분포의 건축
스칼라 CLT = 단일 기둥의 종 분포. 함수 CLT = 무수히 많은 기둥들 (각 \(t\) 의 평균) 의 동시 종 분포. 각 기둥마다 다른 분산 (\(\lambda_j\)) 을 갖지만 전체적으로 통합된 가우스 곡선.
2.16 Hilbert 공간 LLN (Theorem 11.3.3)
\(X_i\) 가 iid integrable (\(E\|X_i\| < \infty\)), \(E X_i = \mu\) 이면:
\[ N^{-1} \sum_{i=1}^N X_i \xrightarrow{a.s.} \mu. \]
거의 확실한 수렴 (almost sure) — 가장 강력한 수렴 모드. 표본 평균의 일치성 증명의 출발점.
2.17 iid 가정의 완화
CLT 와 LLN 모두 iid 가정을 weak dependence 로 완화 가능:
- Ch.8 (functional time series): FAR(1) 와 같은 약한 의존성 모형에 같은 결과 적용.
- 장기 공분산 함수 (LRCF): 의존성 하의 점근 분산 추정.
- Bosq 2000 / Hörmann-Kokoszka 2010: 표준 참고문헌.
핵심 조건: 의존성이 충분히 빨리 감소 (\(\alpha\)-mixing 또는 cumulant summability) → 같은 가우스 한계 분포.
3 함수 주성분 (11.4)
3.1 KL 최적성 정리
\(X\) 가 square integrable, 공분산 연산자 \(C\) 의 고유값이 단조 감소 (\(\lambda_1 \geq \lambda_2 \geq \ldots > 0\)). 임의의 \(p \geq 1\) 에 대해 함수
\[ S(u_1, \ldots, u_p) = E\Bigl\| X - \sum_{k=1}^p \langle X, u_k \rangle u_k \Bigr\|^2 \tag{11.5} \]
이 정규직교 시스템 \((u_1, \ldots, u_p)\) 위에서 최소가 되는 곳은 정확히 \(C\) 의 고유함수 \((v_1, \ldots, v_p)\).
3.2 증명의 핵심 단계
정규직교성 활용:
\[ S(u_1, \ldots, u_p) = E\|X\|^2 - \sum_{k=1}^p E\langle X, u_k \rangle^2. \]
(11.1) 의 약적분 정의 + 공분산 연산자의 정의:
\[ E\langle X, u_k \rangle^2 = \langle E[\langle X, u_k \rangle X], u_k \rangle = \langle C(u_k), u_k \rangle. \]
따라서 \(S\) 의 최소화 ⟺ \(\sum_{k=1}^p \langle C(u_k), u_k \rangle\) 의 최대화.
3.3 Rayleigh-Ritz 환원
Theorem 10.4.5 (Rayleigh-Ritz):
- \(\langle C(u_1), u_1 \rangle\) 의 최댓값은 \(\lambda_1\), \(u_1 = v_1\) 에서 달성 (부호 제외).
- \(u_2 \perp u_1\) 조건에서 \(\langle C(u_2), u_2 \rangle\) 의 최댓값은 \(\lambda_2\), \(u_2 = v_2\) 에서 달성.
- 반복 → 모든 \(u_k = v_k\) 에서 합이 최대.
3.4 직관: 왜 EFPC 가 “최적” 기저인가
함수 데이터를 \(p\) 개 함수의 선형 결합으로 근사할 때, 기대 잔차 제곱 의 최소가 EFPC. 다른 어떤 정규직교 시스템 (Fourier, Spline, Wavelet 등) 도 이 의미에서 EFPC 보다 못함.
핵심: EFPC 가 데이터의 분산 구조에 적응 — Fourier 등 결정적 기저는 분산 구조와 무관.
3.5 비유: 손전등의 가장 밝은 방향
3D 빛이 비추는 방향을 1 개 골라 가장 큰 강도를 얻고 싶을 때 — 가장 큰 분산을 가진 축 (PC1).
EFPC 가 정확히 같은 사고의 함수 일반화 — 무한차원 빛 (random function) 을 가장 잘 비추는 첫 \(p\) 개 방향.
3.6 KL 전개 (Eq. 11.6)
\(\mu = E X\), \(v_j\) 가 \(C\) 의 고유함수 (단위 노름), \(\xi_j = \langle X - \mu, v_j \rangle\) 일 때:
\[ X - \mu = \sum_{j=1}^\infty \xi_j v_j, \tag{11.6} \]
또는 \(L^2\) 함수 형태:
\[ X(t) = \mu(t) + \sum_{j=1}^\infty \xi_j v_j(t). \]
3.7 점수의 성질 (Eq. 11.7)
(11.7) — 임의의 \(i \neq j\):
\[ E \xi_j = 0, \quad E \xi_j^2 = \lambda_j, \quad E[\xi_j \xi_i] = 0. \]
3.8 분산 분해 (Eq. 11.8)
Parseval 등식 (10.4) 적용:
\[ E \|X - \mu\|^2 = \sum_{j=1}^\infty \lambda_j. \tag{11.8} \]
\(L^2\) 형태:
\[ E\int (X(t) - \mu(t))^2 dt = \sum_{j=1}^\infty \lambda_j. \]
3.9 직관: 분산을 직교 방향으로 무한 분해
공분산 연산자의 고유분해가 분산을 무한히 많은 직교 방향으로 분해:
- \(\lambda_1\) — 가장 큰 분산 (PC1).
- \(\lambda_2\) — 두 번째 (PC2).
- \(\sum \lambda_j\) — 총 변동.
이 분해가 FDA 의 핵심:
- 차원 축소: 첫 \(p\) 개 점수만 유지 → 분산 비율 \(\sum_{j=1}^p \lambda_j / \sum \lambda_j\).
- 신호/잡음 분리: 큰 \(\lambda_j\) = 신호, 작은 \(\lambda_j\) = 잡음 가능성.
- 분산 분석: 그룹 간 분산 차이를 EFPC 별로 비교.
3.10 비유: 음악의 하모닉 분해
소리 신호 = 모든 주파수 (하모닉) 의 합. 각 주파수의 에너지가 \(\lambda_j\). 일반적으로:
- 저주파 (큰 \(\lambda_j\)) = 멜로디·전체 변동.
- 고주파 (작은 \(\lambda_j\)) = 미세 디테일·잡음.
함수 데이터의 EFPC 분해도 같은 패턴 — 첫 몇 개의 EFPC 가 데이터의 큰 변동을 설명, 나머지는 잡음에 가까움.
3.11 Gaussian KL — 점수의 독립성 (Example 11.4.1)
\(X\) 가 가우스 함수 (\(E X = \mu\)) 이면:
\[ X(t) = \mu(t) + \sum_{j=1}^\infty \sqrt{\lambda_j} N_j v_j(t), \]
여기서 \(N_j \stackrel{iid}{\sim} N(0, 1)\).
3.12 증명의 핵심
- Theorem 11.3.1: \(\sum_{j=1}^d a_j \xi_j = \langle X - \mu, \sum_j a_j v_j \rangle\) 이 정규 (임의의 \(d, a_j\)). → \(\xi_j\) 가 jointly normal.
- (11.7): \(\xi_j\) 가 비상관.
- Joint normal + 비상관 → 독립 (\(\xi_j = \sqrt{\lambda_j} N_j\)).
3.13 직관: 가우스성이 비상관 → 독립을 보장
일반적으로 비상관 ≠ 독립 (스칼라 예: \(X \sim N(0, 1)\), \(Y = X^2\) — 비상관이지만 종속).
그러나 joint normal 인 경우에만 비상관 ⟺ 독립 — 가우스 함수의 KL 점수에서 정확히 이 등가성이 작동.
3.14 응용: 가우스 함수의 단순 시뮬레이션
# 지정 EFPC + 고유값으로 가우스 함수 시뮬레이션
set.seed(1)
N <- 100
T <- 50
times <- seq(0, 1, length.out = T)
# 평균 함수
mu <- sin(2 * pi * times)
# EFPC: Wiener 의 sin 기반
J <- 5
v <- matrix(0, J, T)
lambda <- numeric(J)
for (j in seq_len(J)) {
v[j, ] <- sqrt(2) * sin((j - 0.5) * pi * times)
lambda[j] <- 1 / ((j - 0.5)^2 * pi^2)
}
# 점수: 독립 정규
N_scores <- matrix(rnorm(N * J), N, J)
xi <- sweep(N_scores, 2, sqrt(lambda), `*`)
# 함수 데이터 생성: X(t) = mu(t) + sum xi_j v_j(t)
X <- t(replicate(N, mu)) + xi %*% v
# 시각화
matplot(times, t(X[1:20, ]), type = "l", col = "gray",
xlab = "t", ylab = "X(t)",
main = "Gaussian functions via KL with Wiener-like FPC")
lines(times, mu, col = "red", lwd = 2)20 개의 가우스 함수가 빨간 평균 함수 주위에서 자연스럽게 흔들림 — 무한차원 정규 분포의 시뮬레이션.
4 Wiener Process 와 Brownian Bridge (11.4.1)
4.1 정의
Wiener process \(\{W(t), t \in [0, 1]\}\):
- \(W(0) = 0\) a.s.
- \(0 \leq s < t \leq 1\) 에 대해 \(W(t) - W(s) \sim N(0, t - s)\).
- \(0 \leq t_0 < t_1 < \ldots < t_k \leq 1\) 에 대해 \(W(t_j) - W(t_{j-1})\) 가 독립.
Brownian bridge:
\[ B(t) = W(t) - t W(1), \quad t \in [0, 1]. \]
4.2 직관: 두 과정의 차이
- Wiener (Brownian motion): 시작 \(W(0) = 0\), 끝 \(W(1)\) 자유. 누적 백색 잡음 — 시간이 지남에 따라 분산 증가.
- Brownian bridge: 시작 \(B(0) = 0\), 끝 \(B(1) = 0\) 강제. Wiener 의 양 끝을 0 으로 묶음.
4.3 비유: 자유 산책 vs 정해진 약속
- Wiener = 길거리에서 무작위로 걷는 사람 — 시작점만 정해짐.
- Brownian bridge = 양 끝의 약속 시간이 정해진 산책 — 시작과 끝이 정해진 무작위 곡선.
4.4 Proposition 11.4.1 — 공분산 함수
\[ c_W(t, s) = \min(t, s), \]
\[ c_B(t, s) = \min(t, s) - ts. \]
4.5 직관: \(\min(t, s)\) 의 의미
Wiener 의 공분산 \(c_W(t, s) = \min(t, s)\):
- \(t = s\) 이면 \(c_W(t, t) = t\) — 시점 \(t\) 까지의 누적 분산.
- \(t < s\) 이면 \(c_W(t, s) = t\) — 두 시점이 공유하는 시간 (\([0, t]\)) 의 분산.
이는 독립 증분 가정의 직접 결과: \(W(t)\) 와 \(W(s) - W(t)\) 가 독립 → 공분산이 공유 구간으로 결정.
4.6 Theorem 11.4.2 — 닫힌 형태 EFPC
Wiener process:
\[ v_j(t) = \sqrt{2} \sin\bigl((j - \tfrac{1}{2}) \pi t\bigr), \quad \lambda_j = \frac{1}{(j - \tfrac{1}{2})^2 \pi^2}. \]
Brownian bridge:
\[ v_j(t) = \sqrt{2} \sin(\pi j t), \quad \lambda_j = \frac{1}{j^2 \pi^2}. \]
4.7 증명의 핵심 — ODE 환원
Wiener 의 경우 적분 방정식:
\[ \int_0^1 \min(s, t) v(s) \, ds = \lambda v(t), \]
이를 \(t\) 별로 나눠 쓰면:
\[ \int_0^t s \cdot v(s) \, ds + t \int_t^1 v(s) \, ds = \lambda v(t). \]
4.8 첫 번째 미분
\[ \int_t^1 v(s) \, ds = \lambda v'(t). \tag{11.9} \]
4.9 두 번째 미분
\[ -v(t) = \lambda v''(t). \]
이는 \(v''(t) + (1/\lambda) v(t) = 0\) — 단순 2 차 ODE. 일반해:
\[ v(t) = A \sin\bigl(t / \sqrt{\lambda}\bigr) + B \cos\bigl(t / \sqrt{\lambda}\bigr). \]
4.10 경계 조건
- \(\int_0^0 = 0\) → \(v(0) = 0\) → \(B = 0\).
- (11.9) 에 \(t = 1\) 대입 → \(v'(1) = 0\) → \(\cos(1/\sqrt{\lambda}) = 0\).
4.11 고유값의 결정
\(\cos(1/\sqrt{\lambda}) = 0\) → \(1/\sqrt{\lambda} = -\pi/2 + j\pi\), \(j \geq 1\) → \(\lambda_j = 1/((j - 1/2)^2 \pi^2)\).
대응 고유함수: \(A \sin(\pi (j - 1/2) t)\). 정규화 조건 \(\int v_j^2 \, dt = 1\) → \(A = \sqrt{2}\).
4.12 직관: 진동의 모드와의 일치
ODE \(-v(t) = \lambda v''(t)\) 가 정확히 양 끝이 고정된 줄의 진동 방정식 — 음악의 하모닉.
- \(j = 1\): 가장 낮은 모드 (가장 큰 \(\lambda\), 가장 큰 분산).
- \(j = 2, 3, \ldots\): 더 높은 진동 (작은 \(\lambda\)).
EFPC 와 푸리에 기저의 깊은 연결 — Wiener process 의 자연 분해가 sin 기반 (이산 푸리에 사인 변환).
4.13 비유: 줄의 자연 진동 모드
기타 줄을 튕기면 무한히 많은 사인 모드 의 합으로 진동 — 첫 모드가 기본음, 이후가 하모닉.
Wiener process 의 KL 분해가 정확히 이 진동 분해와 일치 — random function 도 “자연스럽게 진동” 하는 모드들의 합.
4.14 코드: Wiener EFPC 시각화
times <- seq(0, 1, length.out = 200)
J <- 4
par(mfrow = c(2, 2))
for (j in seq_len(J)) {
v_j <- sqrt(2) * sin((j - 0.5) * pi * times)
lambda_j <- 1 / ((j - 0.5)^2 * pi^2)
plot(times, v_j, type = "l", lwd = 2,
main = sprintf("v_%d, lambda_%d = %.4f", j, j, lambda_j),
xlab = "t", ylab = sprintf("v_%d(t)", j))
abline(h = 0, lty = 2)
}각 EFPC 가 점진적으로 더 높은 진동을 보임 — 첫 EFPC 가 가장 부드러운 변동, 후속 EFPC 가 더 미세한 변동.
4.15 Corollary 11.4.1 — KL 전개의 닫힌 형태
\(N_j \sim N(0, 1)\) 독립.
Wiener process:
\[ W(t) = \sum_{j=1}^\infty \frac{\sqrt{2}}{(j - \tfrac{1}{2}) \pi} N_j \sin\bigl((j - \tfrac{1}{2}) \pi t\bigr). \]
Brownian bridge:
\[ B(t) = \sum_{j=1}^\infty \frac{\sqrt{2}}{j \pi} N_j \sin(j \pi t). \]
4.16 시뮬레이션 응용
이 두 식이 함수 시뮬레이션의 표준 방법:
- 절단 차수 \(J\) 결정 (예: \(J = 50, 100\)).
- 독립 표준 정규 \(N_1, \ldots, N_J\) 생성.
- 위 식의 부분 합으로 함수 생성.
set.seed(1)
times <- seq(0, 1, length.out = 200)
J <- 50
N_samples <- 5
par(mfrow = c(1, 2))
# Wiener
W <- matrix(0, N_samples, length(times))
for (n in seq_len(N_samples)) {
Nj <- rnorm(J)
for (j in seq_len(J)) {
W[n, ] <- W[n, ] + sqrt(2) / ((j - 0.5) * pi) * Nj[j] * sin((j - 0.5) * pi * times)
}
}
matplot(times, t(W), type = "l", main = "Wiener process (KL truncation)",
xlab = "t", ylab = "W(t)")
# Brownian bridge
B <- matrix(0, N_samples, length(times))
for (n in seq_len(N_samples)) {
Nj <- rnorm(J)
for (j in seq_len(J)) {
B[n, ] <- B[n, ] + sqrt(2) / (j * pi) * Nj[j] * sin(j * pi * times)
}
}
matplot(times, t(B), type = "l", main = "Brownian bridge (KL truncation)",
xlab = "t", ylab = "B(t)")오른쪽 (bridge) 의 양 끝이 0 에 고정됨 — Wiener 와 시각적 차이.
5 임의 EFPC 데이터의 시뮬레이션 (Eq. 11.10)
5.1 시뮬레이션 식
\(a_j\) 가 실수, \(Z_{jn}\) 이 iid 평균 0 분산 1 random variable, \(e_j\) 가 정규직교 함수일 때:
\[ X_n(t) = \sum_{j=1}^p a_j Z_{jn} e_j(t). \tag{11.10} \]
5.2 공분산 연산자의 도출
\(X(t) = \sum_j a_j Z_j e_j(t)\) 의 공분산 함수:
\[ E[X(t) X(s)] = \sum_{j=1}^p a_j^2 e_j(t) e_j(s). \]
공분산 연산자:
\[ C(x)(t) = \int E[X(t) X(s)] x(s) \, ds = \sum_{j=1}^p a_j^2 \langle e_j, x \rangle e_j(t). \]
5.3 결과
EFPC = \(e_j\), 고유값 = \(a_j^2\). 즉 임의의 정규직교 시스템과 임의의 비음 가중치를 EFPC 와 고유값으로 직접 지정 가능.
5.4 직관: KL 의 역방향 — 디자인 도구
KL 전개가 함수 → EFPC + 고유값의 분해라면, (11.10) 은 EFPC + 고유값 → 함수 의 합성. FDA 시뮬레이션의 표준:
- 원하는 데이터의 분산 구조 (\(a_j^2\)) 와 함수 형태 (\(e_j\)) 를 미리 디자인.
- 독립 random variable \(Z_{jn}\) 으로 표본 생성.
- 각종 점근 결과 (Ch.12), PACE (Ch.7), FAR(1) (Ch.8) 의 검증에 사용.
5.5 비유: 옷의 디자인 vs 분석
KL = 옷을 분석해 부분품 (천, 단추, 색) 으로 분해. (11.10) = 부분품을 모아 옷을 디자인. 두 방향 모두 패션의 핵심 작업 — FDA 의 핵심 도구.
5.6 패키지 구현
R 의 주요 패키지가 (11.10) 을 표준 시뮬레이션 방식으로 사용:
| 패키지 | 함수 | EFPC 지정 |
|---|---|---|
fda |
fdata, Data2fd |
사용자 정의 basis |
refund |
pfr, pffr |
FPCA 자동 |
fdapace |
MakeFPCAResults |
sparse 시뮬레이션 |
각 패키지의 시뮬레이션 함수가 내부적으로 (11.10) 형태로 함수 데이터 생성 — Wiener/Brownian bridge 외 임의 공분산 구조 가능.
6 절 종합과 연결
6.1 11.3 → 11.4 의 흐름
특성 범함수 (11.3.1) — 함수 분포의 unique 결정
↓
Gaussian 정의 (11.3.2) — μ + C 두 모수만으로 분포 결정
↓
Theorem 11.3.1 — 1 차원 사영의 정규성 ⟺ 함수 가우스
↓
Hilbert CLT (11.3.2) — 표본 평균의 가우스 한계
↓
KL 최적성 (11.4.1) — EFPC 가 잔차 제곱 최소화
↓
KL 전개 + 점수 비상관 (11.6, 11.7)
↓
Gaussian KL — 점수 독립 (11.4.1)
↓
Wiener · Bridge 의 닫힌 형태 EFPC (11.4.2)
↓
임의 EFPC 시뮬레이션 (11.10)
6.2 응용으로의 연결
- Ch.1 BOA 누적 수익률: 일별 누적 곡선이 거의 Wiener-like → KL 분해로 시각화.
- Ch.7 PACE: 희소 데이터에서 EFPC 추정 — KL 점수의 조건부 기댓값.
- Ch.8 FAR(1): 자기회귀 연산자가 공분산 연산자의 함수 → KL 분해로 추정 단순화.
- Ch.12 표본 추론: 표본 EFPC \(\hat{v}_j\) 의 일치성·점근 정규성 → CLT + 연속 사상 결합.
- 시뮬레이션 모든 곳: (11.10) 형태로 함수 데이터 생성 → 점근 결과 검증.
6.3 핵심 점검표
- 함수 가우스 분포가 두 모수 (\(\mu, C\)) 만으로 결정되는 이유? → 특성 범함수 (Definition 11.3.2).
- 함수의 가우스성을 검증하려면? → 임의 1 차원 사영의 정규성만 확인 (Theorem 11.3.1).
- 표본 평균의 점근 분포는? → Hilbert CLT 로 가우스 함수 한계 (Theorem 11.3.2).
- EFPC 가 다른 정규직교 기저보다 “최적” 인 이유? → 기대 잔차 제곱 최소 (Theorem 11.4.1).
- KL 점수가 독립인 충분 조건은? → 함수 가우스성 (Example 11.4.1).
- Wiener process 의 EFPC 가 sin 기반인 이유? → 공분산 적분 방정식의 ODE 환원 (Theorem 11.4.2).
- 함수 데이터를 임의 공분산 구조로 시뮬레이션하려면? → (11.10) 식 적용.
이 7 개 질문의 답이 모두 나오면 11.3·11.4 의 핵심을 이해한 것 — Ch.12 의 표본 평균·공분산·EFPC 의 일치성과 점근 정규성으로 자연스럽게 진입.
7 참고문헌
- Kokoszka, P., & Reimherr, M. (2017). Introduction to Functional Data Analysis. Chapman & Hall/CRC. Sections 11.3, 11.4 (pp.239-245).
- Bosq, D. (2000). Linear Processes in Function Spaces. Springer. Theorem 2.7 — Hilbert 공간 CLT.
- Laha, R. G., & Roghatgi, V. K. (1979). Probability Theory. Wiley. Section 7.6, Proposition 7.6.5 — Theorem 11.3.1 의 증명.
- Hörmann, S., & Kokoszka, P. (2010). Weakly dependent functional data. Annals of Statistics, 38(3), 1845-1884. — iid 가정의 weak dependence 일반화.
- Billingsley, P. (1968). Convergence of Probability Measures. Wiley. — Theorem 11.1.3 의 절단 기법 (CLT 증명에 사용).