1 12장의 자리 — 왜 책의 마지막이 “추론”인가
Ch.1~9 가 “어떻게 함수 데이터를 표현·회귀·예측·확장하는가” 의 방법론이었다면, Ch.10~11 은 그 기법들이 작동하는 공간 (Hilbert space) 과 확률 원소 (random element) 의 수학적 토대를 정리했다. 12장은 그 위에 마지막 한 층을 얹는다 — iid 확률 함수 표본이 주어졌을 때, 표본으로부터 모수를 추정한 결과의 통계적 신뢰성을 어떻게 정량화하는가.
다변량 통계의 대응 흐름과 비교하면 자리잡기가 쉽다.
| 다변량 (\(\mathbb{R}^p\)) | 함수 (\(L^2\)) | 12장의 결과 |
|---|---|---|
| \(\bar X = N^{-1}\sum X_i\) | \(\hat\mu(t) = N^{-1}\sum X_i(t)\) | \(\mathbb{E}\|\hat\mu - \mu\|^2 = O(N^{-1})\) |
| 표본 공분산 행렬 \(S\) | 표본 공분산 연산자 \(\hat C\) | \(\mathbb{E}\|\hat C - C\|_S^2 = O(N^{-1})\) |
| 고유벡터·고유값 | 추정 EFPC \(\hat v_j\), \(\hat\lambda_j\) | \(\|\hat v_j - v_j\| = O_P(N^{-1/2})\) |
| 다변량 CLT | 함수 CLT | \(\sqrt N (\hat\mu - \mu) \Rightarrow Z\) (가우스 원소) |
| 신뢰 타원 | 동시 신뢰 대역 | \(\mu(t)\) 에 대한 함수 전 구간 동시 커버 |
직관적으로는 “유한차원에서 잘 작동하던 추론 인프라가 무한차원에서도 같은 \(N^{-1/2}\) 속도로 살아남는다” 는 사실의 확인이다. 단, 어떻게 살아남는지 의 기술적 디테일 — 어느 노름에서, 어느 가정 하에, 어떤 부호 보정으로 — 가 12장의 본 내용이다.
2 표본 평균의 일치성
\(X_1, \dots, X_N\) 이 \(\mathbb{E}\|X\|^2 < \infty\) 인 iid 확률 함수일 때 표본 평균 \[ \hat\mu(t) = \frac{1}{N}\sum_{i=1}^N X_i(t) \] 은 비편향이며, 다음 평균제곱 수렴이 성립한다. \[ \mathbb{E}\|\hat\mu - \mu\|^2 = \frac{1}{N}\,\mathbb{E}\|X - \mu\|^2 = O(N^{-1}). \]
근거 (한 줄 증명): \(\hat\mu - \mu = N^{-1}\sum (X_i - \mu)\) 의 \(L^2\) 노름 제곱을 전개하고 iid 가정으로 교차항이 0 이 됨을 쓰면 분산이 \(N\) 으로 나누어져 떨어진다. 다변량 표본 평균의 분산이 \(N^{-1}\) 로 줄어드는 것과 정확히 같은 구조다.
직관: 곡선 한 개의 평균에서 벗어나는 정도 (\(\|X-\mu\|^2\)) 가 유한하기만 하면 (= 모집단의 변동성이 통제되기만 하면), 표본을 모을수록 평균 곡선의 추정 오차는 \(1/N\) 속도로 줄어든다. 점별 평균이 아니라 함수 전체의 \(L^2\) 노름 에서 보장된다는 점이 핵심이다 — 어떤 시점 \(t\) 에서도 동시에 잘 추정되는 강한 결과다.
유한차원과의 차이: 다변량에서는 \(\|\bar X - \mu\|_2^2\) (유클리드 노름) 였지만, 함수에서는 \(\int (\hat\mu(t) - \mu(t))^2 dt\) 가 된다. 노름의 정의만 바뀌었을 뿐 결과의 형태는 동일하다.
3 표본 공분산 연산자의 Hilbert-Schmidt 일치성
\(\mathbb{E}\|X\|^4 < \infty\) 일 때 표본 공분산 연산자 \[ \hat C(y) = \frac{1}{N}\sum_{i=1}^N \langle X_i - \hat\mu,\, y\rangle (X_i - \hat\mu) \] 는 Hilbert-Schmidt 노름에서 다음을 만족한다. \[ \mathbb{E}\|\hat C - C\|_S^2 \le \frac{1}{N}\mathbb{E}\|X\|^4. \]
왜 HS 노름인가: 공분산 연산자는 적분 핵 \(c(t,s)\) 로 표현되며, HS 노름은 핵의 \(L^2(T \times T)\) 노름과 동등하다. \[ \|\hat C - C\|_S^2 = \int\!\int (\hat c(t,s) - c(t,s))^2\,dt\,ds. \] 즉 이변량 함수로서의 공분산 핵 전체가 \(N^{-1/2}\) 속도로 추정된다 는 직관적 의미를 가진다. HS 노름은 함수 데이터의 공분산을 다룰 때 가장 자연스러운 거리 척도다 — 연산자 노름은 너무 약하고 (top eigenvalue 만 봄), 점별 거리는 너무 강하다.
4 차 모멘트 조건의 의미: \(\mathbb{E}\|X\|^4 < \infty\) 는 곡선의 변동성이 두꺼운 꼬리 (heavy tail) 를 갖지 않음을 보장한다. 이 조건이 깨지면 (예: 어떤 곡선이 매우 큰 \(L^2\) 노름을 가질 확률이 작지만 0 이 아니면) 공분산 추정이 불안정해진다. 다변량에서 표본 공분산 행렬의 일치성이 \(\mathbb{E}\|X\|^4 < \infty\) 를 요구하는 것과 동일한 구조다.
4 EFPC 와 추정 고유값의 수렴
고유값이 단순하다는 가정 \(\lambda_1 > \lambda_2 > \cdots > \lambda_p > \lambda_{p+1} \ge 0\) 하에서, 추정 고유값 \(\hat\lambda_j\) 와 부호 보정된 추정 고유함수 \(\hat c_j \hat v_j\) (\(\hat c_j = \mathrm{sign}\langle \hat v_j, v_j\rangle\)) 는 다음을 만족한다.
\[ |\hat\lambda_j - \lambda_j| = O_P(N^{-1/2}), \qquad \|\hat c_j \hat v_j - v_j\| = O_P(N^{-1/2}). \]
부호 보정이 왜 필요한가: 고유함수는 부호가 결정되지 않는다 — \(v_j\) 가 고유함수면 \(-v_j\) 도 같은 고유값에 대응하는 고유함수다. 따라서 추정 시점마다 \(\hat v_j\) 의 부호가 뒤집힐 수 있고, 보정 없이 \(\|\hat v_j - v_j\|\) 를 측정하면 일치성이 깨진다. 부호 보정은 “관측된 추정량 \(\hat v_j\) 가 \(v_j\) 와 같은 방향을 가리키도록 부호를 맞춘 후” 거리를 잰다는 기술적 트릭이다.
고유값 단순성 가정의 역할: 만약 \(\lambda_2 = \lambda_3\) 처럼 중복 고유값이 있으면, 그 고유값에 대응하는 고유함수는 2 차원 부분공간 안에서만 결정된다 (특정 기저는 임의). 이 경우 개별 \(\hat v_j\) 의 일치성은 깨지고, 대신 부분공간 (projection) 의 일치성만 보장된다. 실무에서 단순성 가정은 거의 항상 성립한다고 간주하지만, 이론적으로는 명시해야 할 조건이다.
\(N^{-1/2}\) 속도의 의미: \(\hat\mu, \hat C, \hat v_j, \hat\lambda_j\) 가 모두 모수적 수렴 속도 \(N^{-1/2}\) 로 수렴한다는 사실은 실무적으로 매우 중요하다. 이는 함수 데이터 추론이 유한차원 모수 추정과 같은 신뢰도 로 신뢰구간·검정을 구성할 수 있음을 보장한다. 비모수 회귀가 차원의 저주로 \(N^{-2/(4+d)}\) 같은 느린 속도를 가지는 것과 대조적이다.
5 점근 정규성 — 함수 중심극한정리
\(X_1,\dots,X_N\) 이 \(\mathbb{E}\|X\|^2 < \infty\), \(\mathbb{E}X = \mu\), 공분산 연산자 \(C\) 인 iid 확률 함수일 때 \[ \sqrt{N}\,(\hat\mu - \mu) \;\Rightarrow\; Z, \] 여기서 \(Z\) 는 \(L^2\) 의 가우스 확률 원소로 \(\mathbb{E}Z = 0\), 공분산 연산자 \(C\) 를 가진다.
왜 가우스 원소인가: 유한차원 CLT 에서 \(\sqrt N(\bar X - \mu) \Rightarrow N(0, \Sigma)\) 였던 것이 무한차원에서는 \(L^2\) 위의 가우스 측도로 대체된다. 가우스 원소 \(Z\) 는 모든 유한차원 사영 \(\langle Z, y\rangle\) 가 정규분포를 따른다는 성질로 정의되며, 공분산 연산자 \(C\) 가 그 분포를 완전히 결정한다.
Karhunen-Loève 와의 연결: \(Z\) 는 \(C\) 의 고유분해를 통해 \[ Z(t) = \sum_{j=1}^\infty \sqrt{\lambda_j}\,\eta_j\,v_j(t), \quad \eta_j \overset{iid}{\sim} N(0,1) \] 로 표현된다. 무한합으로 보이지만, \(\sum \lambda_j < \infty\) (핵 연산자 조건) 가 보장하므로 \(L^2\) 에서 거의 확실히 수렴한다. 이 표현은 신뢰 대역 시뮬레이션 (Section 12.6) 에서 직접 사용된다.
연속 사상 정리 (Continuous Mapping Theorem): 함수 CLT 가 성립하면, 연속 함수 \(h: L^2 \to \mathbb{R}\) 에 대해 \[ \sqrt N \cdot h(\hat\mu) \;\Rightarrow\; h(Z). \] 예를 들어 \(h(\mu) = \int \mu(t)^2 dt\) 같은 범함수의 점근 분포를 자동으로 얻는다. 직관적으로는 “평균 곡선의 분포가 가우스니까, 평균 곡선의 임의 매끄러운 함수도 그 분포가 가우스의 변환으로 결정된다” 는 의미다.
6 평균 함수에 대한 가설 검정
가설 \(H_0: \mu = \mu_0\) 에 대해 함수 검정 통계량은 다양한 형태가 가능하다.
| 통계량 | 정의 | 점근 분포 |
|---|---|---|
| \(T_N^{(L^2)}\) | \(N\|\hat\mu - \mu_0\|^2 = N \int (\hat\mu(t)-\mu_0(t))^2 dt\) | \(\sum \lambda_j \chi_1^2\) (가중 카이제곱) |
| \(T_N^{(\mathrm{trunc})}\) | EFPC 첫 \(p\) 개 점수 기반 카이제곱 | \(\chi_p^2\) |
가중 카이제곱이 왜 등장하는가: \(L^2\) 노름 검정 통계량은 함수 CLT 에 의해 \(\|Z\|^2 = \sum_j \lambda_j \eta_j^2\) 의 분포를 따른다 (\(\eta_j \overset{iid}{\sim} N(0,1)\)). 이는 무한 가중 합의 카이제곱 — 직접 계산이 어렵고, 임계값을 얻으려면 \(\hat\lambda_j\) 추정 후 시뮬레이션 (Monte Carlo) 으로 분포의 분위수를 계산해야 한다.
절단 (truncation) 검정의 실용성: \(\hat\mu\) 를 첫 \(p\) 개 EFPC 로 사영하여 점수 벡터 \(\hat\xi = (\hat\xi_1,\dots,\hat\xi_p)^\top\) 를 구하고, \(T_N^{(\mathrm{trunc})} = N \hat\xi^\top \hat\Lambda^{-1}_p \hat\xi\) 형태로 만들면 표준 카이제곱 \(\chi_p^2\) 를 따른다. 임계값 계산이 단순하고, \(p\) 만 잘 고르면 검정력도 충분하다는 trade-off 다.
직관적 비교: 절단 검정은 “함수 차이의 처음 몇 방향만 본다” 는 한계가 있지만, 모수가 유한 (\(p\) 개) 으로 줄어 단순 카이제곱이 된다. \(L^2\) 검정은 “곡선 전체를 본다” 는 강점이 있지만, 무한 가중 카이제곱이라 임계값 계산이 비싸다. 일반적으로 \(p \ge 3 \sim 5\) 정도면 두 검정의 검정력 차이가 작다.
7 동시 신뢰 대역 (Simultaneous Confidence Band)
함수 추론에서 동시 (simultaneous) 신뢰 대역 은 평균 곡선 전 구간에 대한 동시 커버리지를 보장하는 함수 띠 \(L(t) \le \mu(t) \le U(t)\) 다 — “모든 \(t\) 에서 동시에 \(\mu(t)\) 가 띠 안에 있을 확률 \(\ge 1 - \alpha\)”.
점별 (pointwise): 각 \(t\) 마다 \(P(L(t) \le \mu(t) \le U(t)) \ge 1-\alpha\). 시점별로는 \(1-\alpha\) 커버하지만, 곡선 전 구간 동시 커버 확률은 훨씬 낮다 (다중 비교 문제와 같은 구조).
동시 (simultaneous): \(P(\forall t: L(t) \le \mu(t) \le U(t)) \ge 1-\alpha\). 이를 보장하려면 점별 띠보다 더 넓어야 한다.
구성 방법 — 함수 CLT 의 가우스 극한 \(Z\) 의 supremum 분포를 이용한다.
\[ P\!\left(\sup_{t \in T} \frac{|\hat\mu(t) - \mu(t)|}{\hat\sigma(t)/\sqrt N} \le q_{1-\alpha}\right) \approx 1 - \alpha \]
여기서 \(\hat\sigma(t) = \sqrt{\hat c(t,t)}\) 는 점별 표준편차의 추정량, \(q_{1-\alpha}\) 는 \(\sup_t |Z(t)/\sigma(t)|\) 의 \(1-\alpha\) 분위수다. \(q_{1-\alpha}\) 는 KL 전개를 통한 Monte Carlo 시뮬레이션으로 구한다.
직관: “함수 한 점에 대한 신뢰구간을 만들 때 표준 정규의 \(1.96\) 을 쓰듯, 함수 전 구간에 대해서는 가우스 과정 supremum 의 분위수를 쓴다.” 점별 \(1.96\) 대신 함수 supremum 의 분위수 (\(\approx 2.5 \sim 3.0\) 수준) 를 사용해 띠를 더 넓힌 것이다.
8 차원 결정 — CPV 와 스크리
EFPC 회귀·분류·예측 모두 첫 \(p\) 개 주성분만 사용한다. \(p\) 를 어떻게 정할까.
누적 분산 비율 (Cumulative Percentage of Variance, CPV): \[ \mathrm{CPV}(p) = \frac{\sum_{k=1}^p \hat\lambda_k}{\sum_{k=1}^\infty \hat\lambda_k}. \]
실무 규칙: CPV(p) \(\ge 0.85\) 또는 \(0.90\) 이 되는 가장 작은 \(p\).
직관: “공분산 연산자가 가진 총 변동량 중에서 첫 \(p\) 개 방향이 85% 를 설명할 정도면, 나머지 차원은 무시해도 분석에 큰 영향이 없다.” 다변량에서 PCA 의 누적 설명 분산과 동일한 논리.
스크리 도표 (Scree Plot): \(\hat\lambda_j\) 를 \(j\) 에 대한 막대그래프로 그려 “팔꿈치 (elbow) 지점” 을 찾는다. 고유값이 급격히 떨어지다가 평탄해지는 시점 직전이 적절한 \(p\).
두 방법의 trade-off:
| 기준 | 장점 | 단점 |
|---|---|---|
| CPV (85%) | 객관적·자동화 가능 | 임계값이 자의적, \(p\) 가 너무 커질 수 있음 |
| Scree | 시각적으로 직관적 | 팔꿈치가 명확하지 않으면 주관적 |
실무에서는 두 방법을 병행해 \(p\) 후보를 좁히고, 후속 분석 (회귀·검정) 의 안정성으로 최종 결정한다.
9 BOA 누적 일중 수익률 적용
12.8 절에서 Bank of America 주식의 분 단위 누적 로그 수익률 곡선 \(X_n(t)\) (\(n\): 거래일, \(t\): 일중 시각) 에 평균 함수 추론을 적용한다.
검정: \(H_0: \mu(t) = 0\) vs \(H_1: \mu(t) \neq 0\). EFPC 절단 카이제곱 검정이 강한 유의성을 보여 평균이 0 이 아님을 확인한다.
신뢰 대역: \(\hat\mu(t)\) 주위로 95% 동시 신뢰 대역을 그려 일중 평균 수익률 패턴 (예: 개장 직후·종료 직전의 변동) 을 시각화한다.
왜 BOA 인가: Ch.1 에서 처음 도입된 데이터로 책 전체에 통일성 있는 응용 흐름을 제공한다. Ch.1 에서는 평균 곡선만 그렸다면, Ch.12 에서는 그 평균 곡선의 추론 (검정·신뢰 대역) 을 완성한다 — 책의 처음과 끝이 같은 데이터로 이어진다.
10 함수 시계열로의 확장
iid 가정이 깨지는 함수 시계열 (Ch.8) 에서도 종속성이 충분히 빠르게 감소하면 (weakly dependent) 동일한 \(N^{-1/2}\) 수렴 속도가 성립한다. 단, 장기 공분산 함수 (long-run covariance, LRCF) \(C^{LR}(t,s) = \sum_h \gamma_h(t,s)\) 가 \(C\) 를 대체한다. LRCF 의 추정은 Bartlett·Parzen 등의 커널 가중 평균이 표준이며, Ch.8.5~8.6 에서 이미 다루었다.
직관: “독립 가정 하에서는 분산이 \(\mathrm{Var}(X)/N\) 으로 줄지만, 종속이 있으면 자기상관 합 (LRCF) 만큼 보정된 분산으로 나누어진다 — 다변량 시계열에서 HAC 추정량이 단순 분산을 대체하는 것과 같은 구조다.”
11 코드 예시
브라운 운동을 함수 모집단으로 사용해 표본 평균과 신뢰 대역을 구성한다. (R fda 패키지 기준)
11.1 Step 1: 시뮬레이션 — 표본 평균의 일치성 확인
# 브라운 운동 시뮬레이션 — 100 개 곡선, 각 곡선 100 시점
set.seed(123)
N <- 100
T_grid <- seq(0, 1, length.out = 100)
bm_sample <- t(replicate(N, {
cumsum(rnorm(length(T_grid), sd = sqrt(diff(c(0, T_grid))[1])))
}))
# bm_sample: N x length(T_grid) 행렬, 각 행이 한 곡선
# 표본 평균 곡선
mu_hat <- colMeans(bm_sample)
# 모집단 평균 = 0, 표본 평균이 0 근방에서 흔들리는지 확인
matplot(T_grid, t(bm_sample), type = "l", col = "gray80",
xlab = "t", ylab = "X(t)", main = "Brownian motion sample + sample mean")
lines(T_grid, mu_hat, col = "red", lwd = 2)
abline(h = 0, lty = 2)해석: 브라운 운동의 모평균은 0 이고, 표본 평균 곡선 (빨강) 이 점선 0 주위에서 \(1/\sqrt N \approx 0.1\) 정도의 변동으로 흔들린다. \(N\) 을 늘리면 진폭이 줄어드는 것을 확인할 수 있다 (일치성).
11.2 Step 2: 동시 신뢰 대역 구성
# 표본 공분산 함수 추정
X_centered <- scale(bm_sample, center = mu_hat, scale = FALSE)
C_hat <- crossprod(X_centered) / N # length(T_grid) x length(T_grid)
# 점별 표준편차
sigma_hat <- sqrt(diag(C_hat))
SE_hat <- sigma_hat / sqrt(N)
# 가우스 과정 supremum 분위수 — Monte Carlo
set.seed(42)
B <- 5000
sup_stats <- replicate(B, {
# KL 전개 기반 가우스 원소 시뮬레이션
eig <- eigen(C_hat, symmetric = TRUE)
lambda <- pmax(eig$values, 0)
V <- eig$vectors
z <- V %*% (sqrt(lambda) * rnorm(length(lambda)))
max(abs(z) / sigma_hat)
})
q_alpha <- quantile(sup_stats, 0.95)
# 동시 95% 신뢰 대역
lower <- mu_hat - q_alpha * SE_hat
upper <- mu_hat + q_alpha * SE_hat
plot(T_grid, mu_hat, type = "l", col = "red", lwd = 2,
ylim = range(c(lower, upper)),
xlab = "t", ylab = "mu(t)",
main = "Sample mean + 95% simultaneous confidence band")
polygon(c(T_grid, rev(T_grid)), c(lower, rev(upper)),
col = adjustcolor("blue", alpha = 0.2), border = NA)
abline(h = 0, lty = 2)해석: 브라운 운동의 참 평균 0 (점선) 이 거의 모든 \(t\) 에서 동시 95% 띠 안에 들어간다. 시뮬레이션을 여러 번 반복하면 약 95% 의 시도에서 점선이 띠 안에 머물러 동시 커버리지가 명목 수준에 근접함을 확인할 수 있다.
점별 띠와의 비교: \(q_{1-\alpha}\) 자리에 표준 정규 \(1.96\) 을 넣으면 점별 95% 띠가 된다. 점별 띠는 더 좁지만, 곡선 전 구간 동시 커버는 훨씬 낮다 (대략 50~70%) — 함수 검정·신뢰 대역에서 점별·동시 구분이 왜 중요한지 직접 확인할 수 있다.
11.3 Step 3: 평균 함수 검정
# H0: mu(t) = 0 vs H1: mu(t) != 0
# EFPC 절단 카이제곱 검정 (p = 5)
p <- 5
eig <- eigen(C_hat, symmetric = TRUE)
V_p <- eig$vectors[, 1:p]
lambda_p <- pmax(eig$values[1:p], 1e-10)
# 평균 곡선의 첫 p 개 EFPC 점수
xi_hat <- as.numeric(t(V_p) %*% mu_hat)
# 검정 통계량
T_stat <- N * sum(xi_hat^2 / lambda_p)
# p 값 (chi-squared with p df)
p_value <- 1 - pchisq(T_stat, df = p)
cat(sprintf("T = %.3f, df = %d, p-value = %.4f\n", T_stat, p, p_value))해석: 모평균이 정말 0 인 시뮬레이션이므로 \(H_0\) 를 기각하지 않을 것이 기대된다 (p-value 가 큼). 만약 모평균이 0 이 아닌 (예: 비대칭 드리프트가 있는) 데이터에 적용하면 p-value 가 작아져 검정의 검정력을 확인할 수 있다.
12 핵심 정리
| 결과 | 노름·거리 | 수렴 속도 | 핵심 가정 |
|---|---|---|---|
| 표본 평균 \(\hat\mu \to \mu\) | \(L^2\) | \(O(N^{-1/2})\) | \(\mathbb{E}\|X\|^2 < \infty\) |
| 표본 공분산 \(\hat C \to C\) | HS | \(O(N^{-1/2})\) | \(\mathbb{E}\|X\|^4 < \infty\) |
| EFPC \(\hat v_j \to v_j\) (부호 보정) | \(L^2\) | \(O_P(N^{-1/2})\) | 고유값 단순성 |
| 함수 CLT \(\sqrt N(\hat\mu - \mu) \Rightarrow Z\) | 약수렴 | — | \(\mathbb{E}\|X\|^2 < \infty\) |
| 평균 검정 (가중 카이제곱·절단) | — | — | iid + 위 모멘트 |
| 동시 신뢰 대역 | sup 노름 | — | 함수 CLT |
12장의 메시지를 한 문장으로 줄이면: “함수 데이터의 추론은 다변량 추론과 같은 모수적 속도 (\(N^{-1/2}\)) 로 작동하며, 적절한 노름·부호 보정·가중 분포만 갖추면 검정·신뢰 대역도 형식적으로 동일하다.”
13 응용 분야
| 분야 | 12장 결과의 활용 |
|---|---|
| 임상시험 (longitudinal) | 환자별 곡선 (혈당·혈압 추이) 의 평균 함수에 대한 동시 신뢰 대역으로 치료 효과 시각화 |
| 금융 (intraday returns) | BOA 사례처럼 일중 평균 수익률 검정·구간 추정 |
| 환경 (temperature curves) | 지역별 일별 기온 곡선의 평균 차이 검정 |
| RT-PCR 진단 | 정상 vs 비정상 증폭 곡선의 평균 비교, \(H_0\): “두 그룹의 평균 곡선이 같다” 검정 |
| 신경과학 (DTI, fMRI) | 뇌 영상 곡선의 그룹 간 차이 검정 + 다중 비교 보정 (점별 → 동시) |
특히 RT-PCR 응용에서는 Ch.12 의 동시 신뢰 대역 이 의사결정 임계값을 함수 전 구간에서 일관되게 정해 주는 도구가 된다 — 점별 임계값을 시점마다 따로 정하는 기존 방식의 다중 비교 문제를 해결한다.
14 관련 주제
선행 지식
- Ch.10 — 힐베르트 공간 이론 개관 (Hilbert·HS 연산자·스펙트럼 정리·텐서)
- Ch.3 — 함수 데이터의 수학적 프레임워크 (Overview)
- 3.1~3.2 — L² 공간과 확률 함수, Karhunen-Loève 전개
- 3.3 — 선형 변환과 공분산 연산자
연관 주제
- Ch.1 — 함수형 데이터 분석의 첫걸음 (Overview) — BOA 데이터의 첫 도입
- 1.1~1.2 — 기저 전개와 표본 평균·공분산
- Ch.8 — 함수 시계열 (FTS) 개관 — iid 가정이 깨지는 시계열 확장
- 8.5~8.6 — 장기 공분산 함수 (LRCF) 와 정상성 검정
후속 주제 (placeholder)
- Functional Bootstrap — 점근 분포 대신 resampling 으로 신뢰구간 구성
- Hotelling’s \(T^2\) 의 함수 확장 — 두 표본 평균 비교
- Simultaneous Confidence Bands — 본 글의 sup 노름 띠 심화
15 참고문헌
- Kokoszka, P., & Reimherr, M. (2017). Introduction to Functional Data Analysis, Ch.12. Chapman & Hall/CRC.
- Hsing, T., & Eubank, R. (2015). Theoretical Foundations of Functional Data Analysis — 추론 이론의 수학적 심화.
- Bosq, D. (2000). Linear Processes in Function Spaces — 함수 시계열 추론의 고전.