FDA 11.0 — 확률 함수 (Random Functions) 개관

FDA 의 확률론적 토대: 거리 공간의 확률 원소·Hilbert 공간의 기댓값·공분산 연산자·가우스 함수·CLT·KL 최적성

Kokoszka & Reimherr (2017) Ch.11 의 핵심을 개관한다. Ch.10 이 정착시킨 Hilbert 공간 위에 확률 구조 를 얹는 장 — 거리 공간에서의 확률 원소와 약수렴·분포수렴·확률수렴·Slutsky 정리 (11.1), Hilbert 공간 값 확률 함수의 기댓값과 공분산 연산자가 symmetric·nonnegative·nuclear 임을 보이는 특성화 정리 (11.2), 특성 범함수로 정의되는 가우스 함수와 Hilbert 공간 CLT·LLN (11.3), KL 전개의 최적성 정리와 Wiener process·Brownian bridge 의 닫힌 형태 EFPC (11.4) — 까지 FDA 의 모든 표본 추론 (Ch.12) 이 의존하는 확률론적 framework 를 정착시킨다.

Statistics
Functional Data Analysis
저자

Kwangmin Kim

공개

2026년 05월 07일

1 이 장의 위치와 목적

Chapter 3 가 random function \(X \in L^2\) 와 KL 전개 \(X(t) = \mu(t) + \sum \xi_j v_j(t)\) 를 처음 소개했다. 그러나 그 정의의 확률론적 의미 — “측정 가능”, “기댓값이 존재한다”, “공분산 연산자가 잘 정의된다”, “\(N^{-1/2} \sum (X_i - \mu)\) 가 가우스 극한을 갖는다” — 는 모두 미뤄둔 상태였다. Chapter 11 이 그 미뤘던 토대를 정착시킨다.

Chapter 11 의 역할

Ch.10 이 Hilbert 공간 + 연산자 이론 을 다뤘다면, Ch.11 은 그 위에 확률 구조 를 얹는다. 거리 공간의 확률 원소, Hilbert 공간 값 확률 함수의 기댓값·공분산, 가우스 함수, 극한 정리 (CLT/LLN), KL 전개의 최적성 — 이 5 개가 Ch.12 (표본 추론) 의 모든 일치성·점근정규성 결과의 출발점.

1.1 학습 동기

왜 확률 구조가 별도로 필요한가

표본 평균 \(\bar{X}_N = N^{-1} \sum X_i\) 가 모평균 \(\mu\) 로 수렴한다고 말하려면:

  • \(X_i\) 가 어느 공간 위 가측 함수인지 정의해야 한다 → 확률 원소.
  • “수렴” 의 의미를 정의해야 한다 (점별? 확률? 분포?) → 수렴 모드.
  • 기댓값 \(\mu = E X\) 가 함수 공간에 실제로 존재함을 보여야 한다 → 약적분 가능성.
  • 분산 \(E \| \bar{X}_N - \mu \|^2\) 의 감소율을 따져야 한다 → 공분산 연산자.
  • 분포 수렴의 한계가 가우스임을 보장해야 한다 → Hilbert 공간 CLT.

이 5 단계가 모든 함수 데이터 추론의 출발점 — Ch.11 이 정확히 이 5 단계를 정착.

1.2 학습 목표

이 chapter 를 마치면 독자는:

  1. 확률 원소 (random element) 의 정의와 약수렴·확률수렴의 차이.
  2. Slutsky 정리·연속 사상 정리 의 Hilbert 공간 일반화.
  3. 약적분 가능성 과 기댓값 \(E X\) 의 존재.
  4. 공분산 연산자의 특성화: symmetric + nonnegative-definite + nuclear.
  5. 가우스 함수 의 특성 범함수와 Hilbert 공간 CLT/LLN.
  6. KL 전개의 최적성 과 Wiener process·Brownian bridge 의 닫힌 형태 EFPC.

이는 Ch.12 (sample inference)·Ch.8 (functional time series)·Ch.7 (sparse FDA) 의 모든 점근 결과의 공통 인프라.

1.3 비유: 무대와 배우

Ch.10 이 무대 (Hilbert 공간, 연산자, 텐서) 라면, Ch.11 은 그 무대 위 배우 (확률 함수, 기댓값, 공분산, 가우스 분포). Ch.12 가 그 배우들이 만드는 연극 (표본 평균의 일치성, 신뢰 대역, 가설 검정).

배우 정의가 빠지면 연극이 의미가 없다 — Ch.11 이 정확히 배우의 자격 (어떤 함수가 확률 함수가 되는지) 과 행동 양식 (어떻게 수렴하는지) 을 정의한다.

1.4 이 포스트의 흐름

11.1 거리 공간의 확률 원소 — 측정 가능성, 약/확률/분포 수렴, Slutsky
    ↓
11.2 Hilbert 공간의 기댓값과 공분산 — 약적분, 공분산 연산자의 3 조건
    ↓
11.3 가우스 함수와 극한 정리 — 특성 범함수, Hilbert CLT/LLN
    ↓
11.4 함수 주성분 — KL 전개의 최적성 정리, Wiener·Brownian bridge 의 EFPC
    ↓
11.5 Chapter 11 problems — 16 개 문제

5 개 절이 자연스러운 순서 — 측정 가능성 → 기댓값 → 분포 → 극한 → 응용 (FPC).


2 거리 공간의 확률 원소 (11.1)

2.1 측정 가능 사상

Random Element

확률 공간 \((\Omega, \mathfrak{O}, P)\) 와 거리 공간 \(\mathcal{S}\) 가 주어졌을 때, 사상 \(X: \Omega \to \mathcal{S}\) 가:

\[ X^{-1}(A) \in \mathfrak{O}, \quad \forall A \in \mathfrak{S} \text{ (Borel } \sigma\text{-대수)} \]

를 만족하면 \(X\)\(\mathcal{S}\) 에서의 확률 원소 라 한다.

  • \(\mathcal{S} = \mathbb{R}\) 이면 random variable.
  • \(\mathcal{S} = \mathbb{R}^d\) 이면 random vector.
  • \(\mathcal{S}\) 가 함수 공간이면 random function.

2.2 직관: 측정 가능성의 의미

\(X^{-1}(A)\) 가 사건이라는 말 = “\(X(\omega) \in A\) 라는 사건의 확률을 잴 수 있다”. 즉 \(\mathcal{S}\) 안의 임의의 Borel 집합 \(A\) 에 대해 \(P(X \in A)\) 가 항상 정의되는 사상만 확률 원소가 된다.

함수의 경우: “\(X\)\(L^2\) 의 어떤 ball 안에 들어가는 사건” 의 확률을 잴 수 있어야 한다 — 이것이 함수 공간 위 추론의 시작점.

2.3 비유: 측정 가능 = 카메라 셔터

확률 공간 \(\Omega\) 가 무대 뒤편이고, \(X\) 가 무대 위 모습을 찍는 카메라. 카메라가 모든 Borel 집합에 대해 사건을 만들 수 있어야 “그 모습이 어떤 영역 안에 있을 확률” 을 따질 수 있다. 측정 불가능한 사상은 “어떤 영역” 자체를 정의할 수 없는 고장난 카메라.

2.4 분포의 정의

\(X\)\(\mathcal{S}\) 에서의 확률 원소이면, 다음 측도 \(\mu\)\(\mathcal{S}\) 위에 정의된다:

\[ \mu(A) = P(X^{-1}(A)) = P(X \in A). \]

\(\mu\)\(X\)분포 (distribution) 라 부른다. 모든 후속 정의 (수렴, 가우스 등) 가 이 \(\mu\) 를 통한 표현에 의존한다.

2.5 약수렴 (Definition 11.1.1)

Weak Convergence

\(\{\mu_n\}, \mu\) 가 거리 공간 \(\mathcal{S}\) 위 확률 측도일 때:

\[ \mu_n \xrightarrow{w} \mu \iff \int_{\mathcal{S}} f \, d\mu_n \to \int_{\mathcal{S}} f \, d\mu, \quad \forall f \in C_b(\mathcal{S}) \]

여기서 \(C_b(\mathcal{S})\) 는 유계 연속 실함수 전체. 즉 모든 유계 연속 함수에 대한 적분이 수렴.

2.6 직관: 약수렴이 자연스러운 이유

스칼라 \(X_n \stackrel{d}{\to} X\) 는 보통 CDF 의 점별 수렴 (\(F_n(t) \to F(t)\), 연속점) 으로 정의한다. 그러나 함수 공간에서는 CDF 라는 개념이 없다 (다차원 분포의 경계가 너무 복잡).

대신 “모든 매끄러운 측정 함수에 대해 평균이 수렴한다” 는 등가 조건 (Theorem 11.1.1) 을 채택. 이것이 거리 공간 일반에 자연스럽게 일반화된다 — 함수 데이터 점근 이론의 표준 정의.

2.7 비유: 도자기 가게의 매상

가게가 \(X_n\) 분포를 따르는 도자기를 진열할 때 매상의 수렴을 보고 싶다. 어떤 가격 함수 \(f\) 든 (유계 연속) “기대 매상 \(E_{\mu_n} f\)\(E_\mu f\) 로 가까워진다” 면 분포 자체가 가까워진 것 — 가격표마다 확인하지 말고 모든 매끄러운 가격표에 대해 동시에 확인.

2.8 분포수렴 vs 확률수렴

두 수렴 모드의 정의
  • Convergence in distribution (\(X_n \xrightarrow{d} X\)): \(\mu_n \xrightarrow{w} \mu\).
  • Convergence in probability (\(X_n \xrightarrow{P} X\)): \(P(d(X_n, X) > \epsilon) \to 0, \forall \epsilon > 0\).

확률수렴 ⇒ 분포수렴 (역은 일반적으로 거짓).

2.9 직관: 두 수렴의 차이

  • 분포수렴: 분포 (확률 측도) 끼리 가까워진다\(X_n\)\(X\) 가 같은 표본 공간에 정의될 필요 없음.
  • 확률수렴: 표본 자체가 가까워진다 — 같은 \(\omega\) 에 대해 \(X_n(\omega) \approx X(\omega)\).

비유: 분포수렴 = “두 도시의 평균 키 분포가 가까워짐”, 확률수렴 = “같은 사람의 키가 시간이 지남에 따라 어떤 값에 가까워짐”.

함수 데이터에서는 표본 평균의 일치성 = 확률수렴, 점근 분포 = 분포수렴 — 두 개념을 분리해서 명확히 다뤄야 한다.

2.10 핵심 정리 4 개

11.1 의 4 개 무기
  1. Theorem 11.1.2: \(X_n \xrightarrow{d} X\) + \(d(X_n, Y_n) \xrightarrow{P} 0 \Rightarrow Y_n \xrightarrow{d} X\).
  2. Theorem 11.1.3: 절단 변수 \(X_n(u)\) 가 각 \(u\) 에서 \(X(u)\) 로 분포수렴하고, \(X(u) \xrightarrow{d} X\) (\(u \to \infty\)) 면 + 잔차 통제 → \(X_n \xrightarrow{d} X\).
  3. Theorem 11.1.4 (Continuous Mapping): \(h\) 가 연속 (불연속 점이 측도 0) 이면 \(X_n \xrightarrow{d} X \Rightarrow h(X_n) \xrightarrow{d} h(X)\).
  4. Theorem 11.1.5 (Slutsky): \(X_n \xrightarrow{d} X\) + \(Y_n \xrightarrow{P} a \Rightarrow (X_n, Y_n) \xrightarrow{d} (X, a)\).

2.11 직관: 이 4 개 정리가 왜 핵심 무기인가

Slutsky = “확률수렴하는 잡음은 분포수렴 결과에 영향을 안 준다”. 표본 평균이 분포수렴하고 표본 분산이 모분산으로 확률수렴하면, 둘을 결합한 통계량 (예: t 통계량) 의 분포수렴이 자동으로 보장된다.

연속 사상 = “분포수렴은 연속 변환을 견딘다”. 함수 추정량 \(\hat{X}_N\) 의 분포수렴이 정해지면 임의의 연속 함수 \(h\) (예: \(h(X) = \int X^2\)) 의 분포수렴도 자동.

Theorem 11.1.3 = “유한차원 절단 + 잔차 통제 = 무한차원 분포수렴”. 함수 공간의 모든 분포수렴 증명이 사실상 이 절단 기법을 따른다.

2.12 비유: 톱니바퀴와 동력 전달

이 4 개 정리가 톱니바퀴 — 한 점근 결과를 다른 점근 결과로 자동 변환. 표본 평균의 분포수렴 (입력) → Slutsky 와 연속 사상으로 → t 통계량·F 통계량·신뢰 대역 (출력). 톱니바퀴가 없으면 매번 처음부터 증명해야 하지만, 갖춰지면 한 결과를 다양한 통계량에 재활용.


3 Hilbert 공간의 기댓값과 공분산 (11.2)

이 절부터는 \(X\) 가 separable Hilbert 공간 \(\mathcal{H}\) 의 값을 갖는다고 가정.

3.1 적분 가능성의 두 의미

Definition 11.2.1 — 적분 가능성
  • Strongly integrable: \(E \|X\| < \infty\).
  • Weakly integrable: 임의의 \(y \in \mathcal{H}\) 에 대해 \(E |\langle X, y \rangle| < \infty\) 이고, 다음을 만족하는 유일한 \(e \in \mathcal{H}\) 존재:

\[ E[\langle X, y \rangle] = \langle e, y \rangle, \quad \forall y \in \mathcal{H}. \]

이때 \(E X := e\)\(X\)기댓값 이라 한다.

3.2 직관: 약적분이 자연스러운 이유

스칼라 기댓값 = “관측값에 가중치 (확률) 를 곱한 합”. 함수 기댓값을 같은 방식으로 정의하려면 “함수 + 확률 가중치 + 합 = 함수” 라는 무한차원 합을 정의해야 한다 — 매끄럽지 않다.

대신 각 방향 \(y\) 로 사영한 다음 그 위에서 스칼라 기댓값을 취한다 (\(\langle X, y \rangle\)). 그 결과를 모은 것이 곧 어떤 함수 \(e\) 의 사영이라면, 그 \(e\) 를 기댓값으로 정의 — 이것이 약적분.

비유: 입체 도형의 무게중심을 직접 계산하는 대신 각 평면으로의 그림자 의 무게중심을 모두 구하면 자동으로 입체의 무게중심이 결정됨.

3.3 Riesz 와의 연결

Riesz 표현 정리 (Theorem 10.2.3): Hilbert 공간 위 임의의 연속 선형 범함수 \(L: \mathcal{H} \to \mathbb{R}\)\(L(y) = \langle e, y \rangle\) 형태 — 유일한 \(e\) 존재.

Definition 11.2.1 의 약적분이 정확히 이 Riesz 의 기계 적용 — \(L(y) = E[\langle X, y \rangle]\) 가 연속 선형이면 자동으로 \(e = E X\) 존재.

3.4 Theorem 11.2.1 — 두 가지 핵심 성질

기댓값의 contraction 과 commutativity

\(X\) 가 적분 가능이면:

  • Contraction: \(\|E X\| \leq E \|X\|\).
  • Linear operator commutativity: 임의의 유계 선형 연산자 \(L\) 에 대해 \(E[L(X)] = L(E X)\).

직관: contraction = “분산이 있으면 기댓값의 노름이 절대 노름의 평균을 넘지 않는다” — 평균이 극단을 부드럽게 한다는 자명한 사실. Commutativity = “선형 연산자는 기댓값과 순서 교환 가능” — 함수 회귀, FPCA, 적분 변환 등 모든 선형 연산이 기댓값 안팎으로 자유롭게 이동.

3.5 공분산 연산자의 정의

Definition 11.2.2 — Covariance Operator

\(X\) 가 square integrable (\(E \|X\|^2 < \infty\)) 이면 공분산 연산자 \(C: \mathcal{H} \to \mathcal{H}\):

\[ C(y) = E\bigl[\langle X - E X, y \rangle (X - E X)\bigr], \quad y \in \mathcal{H}. \]

\(\mathcal{H} = L^2\) 이면 적분 핵 형태:

\[ C(y)(t) = \int c(t, s) y(s) \, ds, \quad c(t, s) = E[(X(t) - \mu(t))(X(s) - \mu(s))]. \]

3.6 직관: 다변량 공분산의 일반화

다변량 (\(\mathcal{H} = \mathbb{R}^d\)) 의 경우 \(C(y) = \Sigma y\) — 공분산 행렬 곱하기. 함수 공간에서도 똑같이 “\(y\) 방향으로 사영한 다음 \(X\) 와 곱한 기댓값” 이 공분산 연산자.

핵심: \(C\)\(y\)\(X\) 의 동시 변동 (\(y\) 방향에서 \(X\) 가 얼마나 흔들리는가) 을 측정. 이것이 공분산 함수 \(c(t, s)\) 와 똑같은 정보 — 표현만 다름.

3.7 Theorem 11.2.2 — 공분산 연산자의 특성화

Hilbert 공간의 공분산 연산자

\(C: \mathcal{H} \to \mathcal{H}\) 가 어떤 square integrable \(X\) 의 공분산 연산자 ⟺ 다음 3 조건:

  1. Symmetric: \(\langle C(y), z \rangle = \langle y, C(z) \rangle\).
  2. Nonnegative-definite: \(\langle C(y), y \rangle \geq 0\).
  3. Nuclear (trace class): \(\sum_{j=1}^\infty \lambda_j < \infty\).

3.8 직관: 왜 nuclear 가 필요한가

스펙트럼 정리 (Theorem 10.4.5) 가 \(C(x) = \sum_j \lambda_j \langle x, v_j \rangle v_j\) 분해를 준다. 이때:

\[ E \|X - \mu\|^2 = \sum_{j=1}^\infty E \langle X - \mu, v_j \rangle^2 = \sum_{j=1}^\infty \lambda_j. \]

\(X\) 가 square integrable (\(E \|X\|^2 < \infty\)) ⟺ 고유값의 합이 유한 = nuclear.

비유: 음악의 푸리에 분해 — 각 주파수의 에너지 (고유값) 가 무한히 모이면 전체 에너지가 발산. 함수가 \(L^2\) 안에 들어가려면 고유값이 충분히 빨리 감소 해야 한다.

3.9 비유: 측정 가능한 무한 자원

\(\sum \lambda_j < \infty\) 가 “측정 가능한 무한 의 핵심 조건”. 무한히 많은 방향 \(v_j\) 가 있어도 그 영향력 (분산 \(\lambda_j\)) 의 총합이 유한하면 — 안전하게 다룰 수 있는 무한차원.

이 조건이 깨지면: 무한차원 표준 가우스 (모든 \(\lambda_j = 1\)) 가 등장해 \(E \|X\|^2 = \infty\) — Hilbert 공간 안의 확률 원소가 아님.


4 가우스 함수와 극한 정리 (11.3)

4.1 특성 범함수

Definition 11.3.1 — Characteristic Functional

\(X\) 가 separable Hilbert 공간 \(\mathcal{H}\) 의 확률 함수일 때:

\[ \varphi_X(y) = E\exp\{i \langle y, X \rangle\}, \quad y \in \mathcal{H}. \]

스칼라의 특성 함수 \(\varphi(t) = E e^{itX}\)자연스러운 일반화 — 무한차원 인덱스 \(y\) 에 대해 정의.

4.2 가우스 함수의 정의

Definition 11.3.2 — Gaussian Random Function

\(X\) 가 다음 형태의 특성 범함수를 가지면 Gaussian:

\[ \varphi_X(y) = \exp\Bigl\{ i \langle \mu, y \rangle - \tfrac{1}{2} \langle C(y), y \rangle \Bigr\}, \]

여기서 \(\mu \in \mathcal{H}\), \(C\) 는 공분산 연산자.

등가 조건 (Theorem 11.3.1): \(X\) 가 가우스 ⟺ 임의의 \(y \in \mathcal{H}\) 에 대해 \(\langle y, X \rangle\) 가 정규 분포.

4.3 직관: 다변량 정규의 무한차원 일반화

다변량 정규 (\(X \sim N(\mu, \Sigma)\)) 의 정의: 임의의 선형 결합 \(a^T X\) 가 정규. Theorem 11.3.1 이 정확히 이 정의의 함수 공간 일반화 — 모든 1 차원 사영이 정규함수 자체가 가우스.

이로써:

  • 함수 분포의 검증이 1 차원 정규성 검증으로 환원.
  • 가우스 함수의 분포가 평균 함수 \(\mu\) + 공분산 함수 \(c(t, s)\) 의 두 모수만으로 완전 결정.
  • 점수 \(\xi_j = \langle X - \mu, v_j \rangle\) 가 자동으로 독립 정규 \(N(0, \lambda_j)\) — KL 전개의 가장 강력한 결과.

4.4 비유: 만화경의 모든 회전

가우스 함수 = 모든 1 차원 사영이 정규 분포인 함수. 비유: 만화경을 어느 각도로 돌려봐도 같은 종류의 무늬 (정규) — 한 각도 (1 차원 사영) 만 보면 다른 각도도 자동으로 결정.

비-가우스의 경우는 각도마다 무늬가 달라 각각 별도의 분포를 가짐 — 통일된 묘사 불가능.

4.5 Hilbert 공간 CLT (Theorem 11.3.2)

Functional Central Limit Theorem

\(X_i\) 가 iid square integrable, \(E X_i = \mu\), 공분산 연산자 \(C\) 일 때:

\[ N^{-1/2} \sum_{i=1}^N (X_i - \mu) \xrightarrow{d} Z, \]

여기서 \(Z\) 는 평균 0, 공분산 연산자 \(C\) 의 가우스 함수.

4.6 직관: 모든 함수 추론의 출발점

이 한 줄이 Ch.12 의 모든 점근 결과 의 출발점:

  • 표본 평균의 분포수렴: \(\sqrt{N}(\bar{X}_N - \mu) \xrightarrow{d} Z\).
  • 신뢰 대역: \(Z\) 의 분포로부터 quantile 계산.
  • 가설 검정: \(\|\bar{X}_N - \mu_0\|^2\) 의 분포가 \(\sum \lambda_j N_j^2\) (chi-square 가중합) 로 수렴.
  • BOA 누적 수익률 (Ch.1) 의 평균 검정 → 이 CLT 적용.

4.7 비유: 무한차원 종 분포의 건축

스칼라 CLT = “표본 평균이 정규 종 분포로 수렴”. 함수 CLT = “표본 함수 평균이 무한차원 종 분포 (가우스 함수) 로 수렴”.

건축 비유: 단일 기둥 (스칼라) 의 종 분포 ⟶ 무수히 많은 기둥들 (함수) 의 종합 종 분포. 각 기둥마다 공분산 연산자 \(C\) 가 다른 기둥과의 결합 강도를 결정.

4.8 LLN (Theorem 11.3.3)

\(X_i\) 가 iid integrable, \(E X_i = \mu\) 이면:

\[ N^{-1} \sum_{i=1}^N X_i \xrightarrow{a.s.} \mu. \]

표본 평균의 거의 확실한 수렴 — Ch.12 의 표본 평균 일치성 증명의 시작점.

iid 가정의 완화

CLT 와 LLN 모두 iid 가정을 약하게 의존성 (weak dependence) 으로 대체 가능. Ch.8 (functional time series) 가 정확히 이 일반화를 다룸 — FAR(1) 모형, 장기 공분산 함수 등.


5 함수 주성분 (11.4)

5.1 KL 전개의 최적성 정리

Theorem 11.4.1 — Optimality of FPC

\(X\) 가 square integrable, 공분산 연산자 \(C\) 의 고유값이 단조 감소 (\(\lambda_1 \geq \lambda_2 \geq \ldots\)). 임의의 \(p \geq 1\) 에 대해:

\[ S(u_1, \ldots, u_p) = E\Bigl\| X - \sum_{k=1}^p \langle X, u_k \rangle u_k \Bigr\|^2 \]

가 최소가 되는 정규직교 시스템 \((u_1, \ldots, u_p)\) 가 정확히 \(C\) 의 고유함수 \((v_1, \ldots, v_p)\).

5.2 직관: 왜 EFPC 가 “최적” 기저인가

함수 데이터를 \(p\) 개 함수의 선형 결합으로 근사할 때, 기대 잔차 제곱 을 최소화하는 기저가 EFPC. 다른 어떤 정규직교 시스템 (Fourier, Spline 등) 도 이 의미에서 EFPC 보다 못함.

증명의 직관: \(S(u_1, \ldots, u_p) = E\|X\|^2 - \sum_{k=1}^p \langle C(u_k), u_k \rangle\). 두 번째 항을 최대화 → Rayleigh-Ritz (Theorem 10.4.5) → 고유값 \(\lambda_1, \ldots, \lambda_p\) 의 합이 최대 → 고유함수에서 달성.

5.3 비유: 손전등의 가장 밝은 방향

3 차원에서 빛이 비추는 방향을 1 개 골라 가장 큰 강도를 얻고 싶을 때 — 가장 큰 분산을 가진 축 (PC1). EFPC 가 정확히 같은 사고의 함수 일반화 — 무한차원 빛 (랜덤 함수) 을 가장 잘 비추는 첫 \(p\) 개 방향.

5.4 KL 전개 (Eq. 11.6)

Karhunen-Loève Expansion

\(\mu = E X\), \(v_j\)\(C\) 의 고유함수, \(\xi_j = \langle X - \mu, v_j \rangle\) 일 때:

\[ X = \mu + \sum_{j=1}^\infty \xi_j v_j, \quad X(t) = \mu(t) + \sum_{j=1}^\infty \xi_j v_j(t). \]

점수 \(\xi_j\) 의 성질:

  • \(E \xi_j = 0\), \(E \xi_j^2 = \lambda_j\), \(E[\xi_j \xi_i] = 0\) (\(i \neq j\)).
  • \(E \|X - \mu\|^2 = \sum_{j=1}^\infty \lambda_j\) (분산 분해).

5.5 직관: 분산의 직교 분해

공분산 함수의 고유분해가 분산을 무한히 많은 직교 방향으로 분해:

  • \(\lambda_1\) — 가장 큰 분산을 갖는 첫 방향 (PC1).
  • \(\lambda_2\) — 두 번째 큰 분산 (PC2).
  • \(\sum \lambda_j = E\|X - \mu\|^2\) — 총 변동.

이 분해가 FDA 의 핵심 도구 — 차원 축소 (앞 \(p\) 개만 유지), 분산 비율, 신호/잡음 분리 등.

5.6 Gaussian KL — 점수의 독립성

Example 11.4.1 — 가우스 KL

\(X\) 가 가우스이면:

\[ X(t) = \mu(t) + \sum_{j=1}^\infty \sqrt{\lambda_j} N_j v_j(t), \]

여기서 \(N_j \sim N(0, 1)\) 독립.

직관: 가우스 함수의 점수는 비상관 (Eq. 11.7) + 가우스 (Theorem 11.3.1) → 독립. 이 한 줄이 가우스 함수의 시뮬레이션·검정·정규성 가정 모두를 단순화.

5.7 Wiener Process 와 Brownian Bridge

Definition 11.4.1
  • Wiener process \(\{W(t), t \in [0, 1]\}\): \(W(0) = 0\), \(W(t) - W(s) \sim N(0, t - s)\), 독립 증분.
  • Brownian bridge \(B(t) = W(t) - t W(1)\), \(t \in [0, 1]\).

공분산 함수 (Proposition 11.4.1):

  • Wiener: \(c_W(t, s) = \min(t, s)\).
  • Bridge: \(c_B(t, s) = \min(t, s) - ts\).

5.8 Theorem 11.4.2 — 닫힌 형태 EFPC

Wiener · Bridge 의 EFPC

Wiener process:

\[ v_j(t) = \sqrt{2} \sin\bigl((j - \tfrac{1}{2}) \pi t\bigr), \quad \lambda_j = \frac{1}{(j - \tfrac{1}{2})^2 \pi^2}. \]

Brownian bridge:

\[ v_j(t) = \sqrt{2} \sin(\pi j t), \quad \lambda_j = \frac{1}{j^2 \pi^2}. \]

5.9 직관: 미분 방정식으로의 환원

증명 핵심: \(\int \min(s, t) v(s) \, ds = \lambda v(t)\) 를 두 번 미분 → \(-v(t) = \lambda v''(t)\).

이는 단순한 2 차 ODE — 일반해 \(v(t) = A \sin(t/\sqrt{\lambda}) + B \cos(t/\sqrt{\lambda})\). 경계 조건 (\(v(0) = 0\), \(v'(1) = 0\)) 으로 \(B = 0\)\(\lambda\) 의 가산 무한 값 결정.

비유: 고유함수 = 진동의 모드 — 양 끝이 고정된 줄의 진동 모드와 정확히 같은 수학 (sin 의 정수배). EFPC 와 푸리에 기저의 깊은 연결.

5.10 Corollary 11.4.1 — KL 전개의 닫힌 형태

Wiener·Bridge 의 KL 전개

Wiener:

\[ W(t) = \sum_{j=1}^\infty \frac{\sqrt{2}}{(j - \tfrac{1}{2}) \pi} N_j \sin\bigl((j - \tfrac{1}{2}) \pi t\bigr). \]

Brownian bridge:

\[ B(t) = \sum_{j=1}^\infty \frac{\sqrt{2}}{j \pi} N_j \sin(j \pi t). \]

\(N_j \sim N(0, 1)\) 독립.

이 두 표현이 함수 시뮬레이션의 표준 방식 — 절단 (\(j = 1, \ldots, J\)) 으로 임의의 정확도로 Wiener process 와 Brownian bridge 를 생성.

5.11 FPC 시뮬레이션 식 (Eq. 11.10)

지정된 EFPC \(e_j\) 와 고유값 \(\lambda_j = a_j^2\) 를 갖는 함수 데이터의 시뮬레이션:

\[ X_n(t) = \sum_{j=1}^p a_j Z_{jn} e_j(t), \]

여기서 \(Z_{jn}\) 가 iid 평균 0, 분산 1 인 변수.

이 식이 R 의 fda, refund, fdapace 패키지의 FDA 시뮬레이션 표준 방법 — 임의의 공분산 구조 (지정 EFPC + 고유값) 를 갖는 함수 표본 생성.


6 Chapter 11 problems (11.5)

총 16 문제 — Slutsky 의 R 결과 도출 (11.1), 분포수렴의 boundedness in probability (11.2), 연속 함수와 확률수렴의 결합 (11.3~11.4), 무한 가중 합의 분포수렴 (11.5), strong/weak integrability 동치 (11.6), 다변량 ↔︎ 함수 공분산 일치 (11.7), 공분산 함수의 HS 노름 한계 (11.8), 비공분산이지만 정의는 만족하는 연산자 (11.9), HS 공분산 핵의 nonneg 정의성 (11.10~11.11), 특성 범함수의 성질 (11.12), 무한차원에서 특성 범함수 점별 수렴이 분포 수렴을 imply 하지 않는 반례 (11.13), 가우스에 유계 연산자 적용 → 가우스 (11.14), KL 점수 성질 검증 (11.15), Wiener·Bridge 공분산 함수 증명 (11.16).

이 문제들이 Ch.11 의 정의와 정리를 직접 손으로 다뤄보는 연습 — 별도 풀이 포스트 (11-5-chapter11-problems.qmd) 에서 자세히 다룸 (예정).


7 핵심 요약

Chapter 11 의 4 개 핵심
  1. 확률 원소 = 측정 가능 사상. 약수렴·확률수렴·분포수렴이 거리 공간에서 정의되며, Slutsky·연속 사상·Theorem 11.1.3 이 점근 통계의 4 개 무기.
  2. 약적분과 기댓값. Riesz 표현 정리로 \(E X\) 의 존재가 자동 보장. Contraction + commutativity 가 모든 선형 통계의 기댓값 처리를 단순화.
  3. 공분산 연산자의 특성화: symmetric + nonnegative-definite + nuclear (\(\sum \lambda_j < \infty\)). Square integrable 함수의 자연스러운 결과.
  4. 가우스 + KL 최적성 + Wiener/Bridge 닫힌 형태. Hilbert 공간 CLT 가 모든 함수 추론의 출발점, KL 의 EFPC 최적성이 차원 축소의 정당화, Wiener/Bridge 의 sin 기반 EFPC 가 함수 시뮬레이션의 표준.

7.1 Ch.10 → Ch.11 → Ch.12 의 흐름

Ch.10 — Hilbert 공간 + 연산자 + 텐서
   (수학적 토대, 결정적 framework)
       ↓
Ch.11 — 확률 함수 + 기댓값 + 공분산 + 가우스 + CLT/KL
   (확률론적 framework, 점근 무기)
       ↓
Ch.12 — 표본 평균·공분산의 일치성 + EFPC 의 수렴 + 신뢰 대역
   (표본 추론, BOA 누적 수익률 적용)

Ch.12 의 모든 결과가 Ch.11 의 다섯 도구 (확률 원소, 약적분, 공분산 연산자 특성화, 가우스 함수, CLT/LLN) 의 직접 응용 — 이 인프라가 없으면 함수 데이터 추론이 정의되지 않는다.

7.2 응용으로의 연결

  • Ch.4~6 (회귀·GLM): 추정량의 점근 정규성 → Ch.11 의 Hilbert CLT 에 의존.
  • Ch.7 (sparse FDA): PACE 의 점근 분포 → Ch.11 의 CLT + Slutsky 적용.
  • Ch.8 (functional time series): FAR(1) 의 추정량 분포 → Ch.11 의 CLT 를 weak dependence 로 일반화.
  • Ch.9 (spatial FDA): 함수 크리깅의 BLUP → Ch.11 의 공분산 연산자 framework.
  • Ch.12 (sample inference): 평균·공분산·EFPC 의 일치성과 수렴 속도 → Ch.11 의 모든 도구 직접 사용.

이 연결이 Ch.11 이 응용 chapter 들의 공통 토대 임을 보여준다 — 따로 다루지만 모든 곳에서 호출.


8 참고문헌

  • Kokoszka, P., & Reimherr, M. (2017). Introduction to Functional Data Analysis. Chapman & Hall/CRC. Ch.11.
  • Billingsley, P. (1968). Convergence of Probability Measures. Wiley. — 약수렴 이론의 표준.
  • Bosq, D. (2000). Linear Processes in Function Spaces. Springer. — Hilbert 공간 CLT, FAR(1) 토대.
  • Laha, R. G., & Roghatgi, V. K. (1979). Probability Theory. Wiley. — 특성 범함수, 가우스 함수 (Section 7.6).
  • Rudin, W. (1987). Real and Complex Analysis. McGraw-Hill. — 측도론 사전 지식.

Subscribe

Enjoy this blog? Get notified of new posts by email: