Kwangmin Kim - Ch.12 — 확률 표본으로부터의 추론 개관 (Inference from a Random Sample)

1 12장의 자리 — 왜 책의 마지막이 “추론”인가

Ch.1~9 가 “어떻게 함수 데이터를 표현·회귀·예측·확장하는가” 의 방법론이었다면, Ch.10~11 은 그 기법들이 작동하는 공간 (Hilbert space) 과 확률 원소 (random element) 의 수학적 토대를 정리했다. 12장은 그 위에 마지막 한 층을 얹는다 — iid 확률 함수 표본이 주어졌을 때, 표본으로부터 모수를 추정한 결과의 통계적 신뢰성을 어떻게 정량화하는가.

다변량 통계의 대응 흐름과 비교하면 자리잡기가 쉽다.

다변량 (\(\mathbb{R}^p\))	함수 (\(L^2\))	12장의 결과
\(\bar X = N^{-1}\sum X_i\)	\(\hat\mu(t) = N^{-1}\sum X_i(t)\)	\(\mathbb{E}\\|\hat\mu - \mu\\|^2 = O(N^{-1})\)
표본 공분산 행렬 \(S\)	표본 공분산 연산자 \(\hat C\)	\(\mathbb{E}\\|\hat C - C\\|_S^2 = O(N^{-1})\)
고유벡터·고유값	추정 EFPC \(\hat v_j\), \(\hat\lambda_j\)	\(\\|\hat v_j - v_j\\| = O_P(N^{-1/2})\)
다변량 CLT	함수 CLT	\(\sqrt N (\hat\mu - \mu) \Rightarrow Z\) (가우스 원소)
신뢰 타원	동시 신뢰 대역	\(\mu(t)\) 에 대한 함수 전 구간 동시 커버

직관적으로는 “유한차원에서 잘 작동하던 추론 인프라가 무한차원에서도 같은 \(N^{-1/2}\) 속도로 살아남는다” 는 사실의 확인이다. 단, 어떻게 살아남는지 의 기술적 디테일 — 어느 노름에서, 어느 가정 하에, 어떤 부호 보정으로 — 가 12장의 본 내용이다.

2 표본 평균의 일치성

정의·정리: 표본 평균의 \(L^2\)-일치성

\(X_1, \dots, X_N\) 이 \(\mathbb{E}\|X\|^2 < \infty\) 인 iid 확률 함수일 때 표본 평균 \[ \hat\mu(t) = \frac{1}{N}\sum_{i=1}^N X_i(t) \] 은 비편향이며, 다음 평균제곱 수렴이 성립한다. \[ \mathbb{E}\|\hat\mu - \mu\|^2 = \frac{1}{N}\,\mathbb{E}\|X - \mu\|^2 = O(N^{-1}). \]

근거 (한 줄 증명): \(\hat\mu - \mu = N^{-1}\sum (X_i - \mu)\) 의 \(L^2\) 노름 제곱을 전개하고 iid 가정으로 교차항이 0 이 됨을 쓰면 분산이 \(N\) 으로 나누어져 떨어진다. 다변량 표본 평균의 분산이 \(N^{-1}\) 로 줄어드는 것과 정확히 같은 구조다.

직관: 곡선 한 개의 평균에서 벗어나는 정도 (\(\|X-\mu\|^2\)) 가 유한하기만 하면 (= 모집단의 변동성이 통제되기만 하면), 표본을 모을수록 평균 곡선의 추정 오차는 \(1/N\) 속도로 줄어든다. 점별 평균이 아니라 함수 전체의 \(L^2\) 노름 에서 보장된다는 점이 핵심이다 — 어떤 시점 \(t\) 에서도 동시에 잘 추정되는 강한 결과다.

유한차원과의 차이: 다변량에서는 \(\|\bar X - \mu\|_2^2\) (유클리드 노름) 였지만, 함수에서는 \(\int (\hat\mu(t) - \mu(t))^2 dt\) 가 된다. 노름의 정의만 바뀌었을 뿐 결과의 형태는 동일하다.

3 표본 공분산 연산자의 Hilbert-Schmidt 일치성

정리: 공분산 연산자의 HS 노름 수렴

\(\mathbb{E}\|X\|^4 < \infty\) 일 때 표본 공분산 연산자 \[ \hat C(y) = \frac{1}{N}\sum_{i=1}^N \langle X_i - \hat\mu,\, y\rangle (X_i - \hat\mu) \] 는 Hilbert-Schmidt 노름에서 다음을 만족한다. \[ \mathbb{E}\|\hat C - C\|_S^2 \le \frac{1}{N}\mathbb{E}\|X\|^4. \]

왜 HS 노름인가: 공분산 연산자는 적분 핵 \(c(t,s)\) 로 표현되며, HS 노름은 핵의 \(L^2(T \times T)\) 노름과 동등하다. \[ \|\hat C - C\|_S^2 = \int\!\int (\hat c(t,s) - c(t,s))^2\,dt\,ds. \] 즉 이변량 함수로서의 공분산 핵 전체가 \(N^{-1/2}\) 속도로 추정된다 는 직관적 의미를 가진다. HS 노름은 함수 데이터의 공분산을 다룰 때 가장 자연스러운 거리 척도다 — 연산자 노름은 너무 약하고 (top eigenvalue 만 봄), 점별 거리는 너무 강하다.

4 차 모멘트 조건의 의미: \(\mathbb{E}\|X\|^4 < \infty\) 는 곡선의 변동성이 두꺼운 꼬리 (heavy tail) 를 갖지 않음을 보장한다. 이 조건이 깨지면 (예: 어떤 곡선이 매우 큰 \(L^2\) 노름을 가질 확률이 작지만 0 이 아니면) 공분산 추정이 불안정해진다. 다변량에서 표본 공분산 행렬의 일치성이 \(\mathbb{E}\|X\|^4 < \infty\) 를 요구하는 것과 동일한 구조다.

4 EFPC 와 추정 고유값의 수렴

정리: 추정 EFPC 의 부호 보정 일치성

고유값이 단순하다는 가정 \(\lambda_1 > \lambda_2 > \cdots > \lambda_p > \lambda_{p+1} \ge 0\) 하에서, 추정 고유값 \(\hat\lambda_j\) 와 부호 보정된 추정 고유함수 \(\hat c_j \hat v_j\) (\(\hat c_j = \mathrm{sign}\langle \hat v_j, v_j\rangle\)) 는 다음을 만족한다.

\[ |\hat\lambda_j - \lambda_j| = O_P(N^{-1/2}), \qquad \|\hat c_j \hat v_j - v_j\| = O_P(N^{-1/2}). \]

부호 보정이 왜 필요한가: 고유함수는 부호가 결정되지 않는다 — \(v_j\) 가 고유함수면 \(-v_j\) 도 같은 고유값에 대응하는 고유함수다. 따라서 추정 시점마다 \(\hat v_j\) 의 부호가 뒤집힐 수 있고, 보정 없이 \(\|\hat v_j - v_j\|\) 를 측정하면 일치성이 깨진다. 부호 보정은 “관측된 추정량 \(\hat v_j\) 가 \(v_j\) 와 같은 방향을 가리키도록 부호를 맞춘 후” 거리를 잰다는 기술적 트릭이다.

고유값 단순성 가정의 역할: 만약 \(\lambda_2 = \lambda_3\) 처럼 중복 고유값이 있으면, 그 고유값에 대응하는 고유함수는 2 차원 부분공간 안에서만 결정된다 (특정 기저는 임의). 이 경우 개별 \(\hat v_j\) 의 일치성은 깨지고, 대신 부분공간 (projection) 의 일치성만 보장된다. 실무에서 단순성 가정은 거의 항상 성립한다고 간주하지만, 이론적으로는 명시해야 할 조건이다.

\(N^{-1/2}\) 속도의 의미: \(\hat\mu, \hat C, \hat v_j, \hat\lambda_j\) 가 모두 모수적 수렴 속도 \(N^{-1/2}\) 로 수렴한다는 사실은 실무적으로 매우 중요하다. 이는 함수 데이터 추론이 유한차원 모수 추정과 같은 신뢰도 로 신뢰구간·검정을 구성할 수 있음을 보장한다. 비모수 회귀가 차원의 저주로 \(N^{-2/(4+d)}\) 같은 느린 속도를 가지는 것과 대조적이다.

5 점근 정규성 — 함수 중심극한정리

함수 CLT (Hilbert space CLT)

\(X_1,\dots,X_N\) 이 \(\mathbb{E}\|X\|^2 < \infty\), \(\mathbb{E}X = \mu\), 공분산 연산자 \(C\) 인 iid 확률 함수일 때 \[ \sqrt{N}\,(\hat\mu - \mu) \;\Rightarrow\; Z, \] 여기서 \(Z\) 는 \(L^2\) 의 가우스 확률 원소로 \(\mathbb{E}Z = 0\), 공분산 연산자 \(C\) 를 가진다.

왜 가우스 원소인가: 유한차원 CLT 에서 \(\sqrt N(\bar X - \mu) \Rightarrow N(0, \Sigma)\) 였던 것이 무한차원에서는 \(L^2\) 위의 가우스 측도로 대체된다. 가우스 원소 \(Z\) 는 모든 유한차원 사영 \(\langle Z, y\rangle\) 가 정규분포를 따른다는 성질로 정의되며, 공분산 연산자 \(C\) 가 그 분포를 완전히 결정한다.

Karhunen-Loève 와의 연결: \(Z\) 는 \(C\) 의 고유분해를 통해 \[ Z(t) = \sum_{j=1}^\infty \sqrt{\lambda_j}\,\eta_j\,v_j(t), \quad \eta_j \overset{iid}{\sim} N(0,1) \] 로 표현된다. 무한합으로 보이지만, \(\sum \lambda_j < \infty\) (핵 연산자 조건) 가 보장하므로 \(L^2\) 에서 거의 확실히 수렴한다. 이 표현은 신뢰 대역 시뮬레이션 (Section 12.6) 에서 직접 사용된다.

연속 사상 정리 (Continuous Mapping Theorem): 함수 CLT 가 성립하면, 연속 함수 \(h: L^2 \to \mathbb{R}\) 에 대해 \[ \sqrt N \cdot h(\hat\mu) \;\Rightarrow\; h(Z). \] 예를 들어 \(h(\mu) = \int \mu(t)^2 dt\) 같은 범함수의 점근 분포를 자동으로 얻는다. 직관적으로는 “평균 곡선의 분포가 가우스니까, 평균 곡선의 임의 매끄러운 함수도 그 분포가 가우스의 변환으로 결정된다” 는 의미다.

6 평균 함수에 대한 가설 검정

가설 \(H_0: \mu = \mu_0\) 에 대해 함수 검정 통계량은 다양한 형태가 가능하다.

통계량	정의	점근 분포
\(T_N^{(L^2)}\)	\(N\\|\hat\mu - \mu_0\\|^2 = N \int (\hat\mu(t)-\mu_0(t))^2 dt\)	\(\sum \lambda_j \chi_1^2\) (가중 카이제곱)
\(T_N^{(\mathrm{trunc})}\)	EFPC 첫 \(p\) 개 점수 기반 카이제곱	\(\chi_p^2\)

가중 카이제곱이 왜 등장하는가: \(L^2\) 노름 검정 통계량은 함수 CLT 에 의해 \(\|Z\|^2 = \sum_j \lambda_j \eta_j^2\) 의 분포를 따른다 (\(\eta_j \overset{iid}{\sim} N(0,1)\)). 이는 무한 가중 합의 카이제곱 — 직접 계산이 어렵고, 임계값을 얻으려면 \(\hat\lambda_j\) 추정 후 시뮬레이션 (Monte Carlo) 으로 분포의 분위수를 계산해야 한다.

절단 (truncation) 검정의 실용성: \(\hat\mu\) 를 첫 \(p\) 개 EFPC 로 사영하여 점수 벡터 \(\hat\xi = (\hat\xi_1,\dots,\hat\xi_p)^\top\) 를 구하고, \(T_N^{(\mathrm{trunc})} = N \hat\xi^\top \hat\Lambda^{-1}_p \hat\xi\) 형태로 만들면 표준 카이제곱 \(\chi_p^2\) 를 따른다. 임계값 계산이 단순하고, \(p\) 만 잘 고르면 검정력도 충분하다는 trade-off 다.

직관적 비교: 절단 검정은 “함수 차이의 처음 몇 방향만 본다” 는 한계가 있지만, 모수가 유한 (\(p\) 개) 으로 줄어 단순 카이제곱이 된다. \(L^2\) 검정은 “곡선 전체를 본다” 는 강점이 있지만, 무한 가중 카이제곱이라 임계값 계산이 비싸다. 일반적으로 \(p \ge 3 \sim 5\) 정도면 두 검정의 검정력 차이가 작다.

7 동시 신뢰 대역 (Simultaneous Confidence Band)

함수 추론에서 동시 (simultaneous) 신뢰 대역 은 평균 곡선 전 구간에 대한 동시 커버리지를 보장하는 함수 띠 \(L(t) \le \mu(t) \le U(t)\) 다 — “모든 \(t\) 에서 동시에 \(\mu(t)\) 가 띠 안에 있을 확률 \(\ge 1 - \alpha\)”.

점별 vs 동시 신뢰 대역의 차이

점별 (pointwise): 각 \(t\) 마다 \(P(L(t) \le \mu(t) \le U(t)) \ge 1-\alpha\). 시점별로는 \(1-\alpha\) 커버하지만, 곡선 전 구간 동시 커버 확률은 훨씬 낮다 (다중 비교 문제와 같은 구조).

동시 (simultaneous): \(P(\forall t: L(t) \le \mu(t) \le U(t)) \ge 1-\alpha\). 이를 보장하려면 점별 띠보다 더 넓어야 한다.

구성 방법 — 함수 CLT 의 가우스 극한 \(Z\) 의 supremum 분포를 이용한다.

\[ P\!\left(\sup_{t \in T} \frac{|\hat\mu(t) - \mu(t)|}{\hat\sigma(t)/\sqrt N} \le q_{1-\alpha}\right) \approx 1 - \alpha \]

여기서 \(\hat\sigma(t) = \sqrt{\hat c(t,t)}\) 는 점별 표준편차의 추정량, \(q_{1-\alpha}\) 는 \(\sup_t |Z(t)/\sigma(t)|\) 의 \(1-\alpha\) 분위수다. \(q_{1-\alpha}\) 는 KL 전개를 통한 Monte Carlo 시뮬레이션으로 구한다.

직관: “함수 한 점에 대한 신뢰구간을 만들 때 표준 정규의 \(1.96\) 을 쓰듯, 함수 전 구간에 대해서는 가우스 과정 supremum 의 분위수를 쓴다.” 점별 \(1.96\) 대신 함수 supremum 의 분위수 (\(\approx 2.5 \sim 3.0\) 수준) 를 사용해 띠를 더 넓힌 것이다.

8 차원 결정 — CPV 와 스크리

EFPC 회귀·분류·예측 모두 첫 \(p\) 개 주성분만 사용한다. \(p\) 를 어떻게 정할까.

누적 분산 비율 (Cumulative Percentage of Variance, CPV): \[ \mathrm{CPV}(p) = \frac{\sum_{k=1}^p \hat\lambda_k}{\sum_{k=1}^\infty \hat\lambda_k}. \]

실무 규칙: CPV(p) \(\ge 0.85\) 또는 \(0.90\) 이 되는 가장 작은 \(p\).

직관: “공분산 연산자가 가진 총 변동량 중에서 첫 \(p\) 개 방향이 85% 를 설명할 정도면, 나머지 차원은 무시해도 분석에 큰 영향이 없다.” 다변량에서 PCA 의 누적 설명 분산과 동일한 논리.

스크리 도표 (Scree Plot): \(\hat\lambda_j\) 를 \(j\) 에 대한 막대그래프로 그려 “팔꿈치 (elbow) 지점” 을 찾는다. 고유값이 급격히 떨어지다가 평탄해지는 시점 직전이 적절한 \(p\).

두 방법의 trade-off:

기준	장점	단점
CPV (85%)	객관적·자동화 가능	임계값이 자의적, \(p\) 가 너무 커질 수 있음
Scree	시각적으로 직관적	팔꿈치가 명확하지 않으면 주관적

실무에서는 두 방법을 병행해 \(p\) 후보를 좁히고, 후속 분석 (회귀·검정) 의 안정성으로 최종 결정한다.

9 BOA 누적 일중 수익률 적용

12.8 절에서 Bank of America 주식의 분 단위 누적 로그 수익률 곡선 \(X_n(t)\) (\(n\): 거래일, \(t\): 일중 시각) 에 평균 함수 추론을 적용한다.

검정: \(H_0: \mu(t) = 0\) vs \(H_1: \mu(t) \neq 0\). EFPC 절단 카이제곱 검정이 강한 유의성을 보여 평균이 0 이 아님을 확인한다.

신뢰 대역: \(\hat\mu(t)\) 주위로 95% 동시 신뢰 대역을 그려 일중 평균 수익률 패턴 (예: 개장 직후·종료 직전의 변동) 을 시각화한다.

왜 BOA 인가: Ch.1 에서 처음 도입된 데이터로 책 전체에 통일성 있는 응용 흐름을 제공한다. Ch.1 에서는 평균 곡선만 그렸다면, Ch.12 에서는 그 평균 곡선의 추론 (검정·신뢰 대역) 을 완성한다 — 책의 처음과 끝이 같은 데이터로 이어진다.

10 함수 시계열로의 확장

iid 가정이 깨지는 함수 시계열 (Ch.8) 에서도 종속성이 충분히 빠르게 감소하면 (weakly dependent) 동일한 \(N^{-1/2}\) 수렴 속도가 성립한다. 단, 장기 공분산 함수 (long-run covariance, LRCF) \(C^{LR}(t,s) = \sum_h \gamma_h(t,s)\) 가 \(C\) 를 대체한다. LRCF 의 추정은 Bartlett·Parzen 등의 커널 가중 평균이 표준이며, Ch.8.5~8.6 에서 이미 다루었다.

직관: “독립 가정 하에서는 분산이 \(\mathrm{Var}(X)/N\) 으로 줄지만, 종속이 있으면 자기상관 합 (LRCF) 만큼 보정된 분산으로 나누어진다 — 다변량 시계열에서 HAC 추정량이 단순 분산을 대체하는 것과 같은 구조다.”

11 코드 예시

브라운 운동을 함수 모집단으로 사용해 표본 평균과 신뢰 대역을 구성한다. (R fda 패키지 기준)

11.1 Step 1: 시뮬레이션 — 표본 평균의 일치성 확인

# 브라운 운동 시뮬레이션 — 100 개 곡선, 각 곡선 100 시점
set.seed(123)
N <- 100
T_grid <- seq(0, 1, length.out = 100)

bm_sample <- t(replicate(N, {
  cumsum(rnorm(length(T_grid), sd = sqrt(diff(c(0, T_grid))[1])))
}))
# bm_sample: N x length(T_grid) 행렬, 각 행이 한 곡선

# 표본 평균 곡선
mu_hat <- colMeans(bm_sample)

# 모집단 평균 = 0, 표본 평균이 0 근방에서 흔들리는지 확인
matplot(T_grid, t(bm_sample), type = "l", col = "gray80",
        xlab = "t", ylab = "X(t)", main = "Brownian motion sample + sample mean")
lines(T_grid, mu_hat, col = "red", lwd = 2)
abline(h = 0, lty = 2)

해석: 브라운 운동의 모평균은 0 이고, 표본 평균 곡선 (빨강) 이 점선 0 주위에서 \(1/\sqrt N \approx 0.1\) 정도의 변동으로 흔들린다. \(N\) 을 늘리면 진폭이 줄어드는 것을 확인할 수 있다 (일치성).

11.2 Step 2: 동시 신뢰 대역 구성

# 표본 공분산 함수 추정
X_centered <- scale(bm_sample, center = mu_hat, scale = FALSE)
C_hat <- crossprod(X_centered) / N  # length(T_grid) x length(T_grid)

# 점별 표준편차
sigma_hat <- sqrt(diag(C_hat))
SE_hat <- sigma_hat / sqrt(N)

# 가우스 과정 supremum 분위수 — Monte Carlo
set.seed(42)
B <- 5000
sup_stats <- replicate(B, {
  # KL 전개 기반 가우스 원소 시뮬레이션
  eig <- eigen(C_hat, symmetric = TRUE)
  lambda <- pmax(eig$values, 0)
  V <- eig$vectors
  z <- V %*% (sqrt(lambda) * rnorm(length(lambda)))
  max(abs(z) / sigma_hat)
})
q_alpha <- quantile(sup_stats, 0.95)

# 동시 95% 신뢰 대역
lower <- mu_hat - q_alpha * SE_hat
upper <- mu_hat + q_alpha * SE_hat

plot(T_grid, mu_hat, type = "l", col = "red", lwd = 2,
     ylim = range(c(lower, upper)),
     xlab = "t", ylab = "mu(t)",
     main = "Sample mean + 95% simultaneous confidence band")
polygon(c(T_grid, rev(T_grid)), c(lower, rev(upper)),
        col = adjustcolor("blue", alpha = 0.2), border = NA)
abline(h = 0, lty = 2)

해석: 브라운 운동의 참 평균 0 (점선) 이 거의 모든 \(t\) 에서 동시 95% 띠 안에 들어간다. 시뮬레이션을 여러 번 반복하면 약 95% 의 시도에서 점선이 띠 안에 머물러 동시 커버리지가 명목 수준에 근접함을 확인할 수 있다.

점별 띠와의 비교: \(q_{1-\alpha}\) 자리에 표준 정규 \(1.96\) 을 넣으면 점별 95% 띠가 된다. 점별 띠는 더 좁지만, 곡선 전 구간 동시 커버는 훨씬 낮다 (대략 50~70%) — 함수 검정·신뢰 대역에서 점별·동시 구분이 왜 중요한지 직접 확인할 수 있다.

11.3 Step 3: 평균 함수 검정

# H0: mu(t) = 0 vs H1: mu(t) != 0
# EFPC 절단 카이제곱 검정 (p = 5)

p <- 5
eig <- eigen(C_hat, symmetric = TRUE)
V_p <- eig$vectors[, 1:p]
lambda_p <- pmax(eig$values[1:p], 1e-10)

# 평균 곡선의 첫 p 개 EFPC 점수
xi_hat <- as.numeric(t(V_p) %*% mu_hat)

# 검정 통계량
T_stat <- N * sum(xi_hat^2 / lambda_p)

# p 값 (chi-squared with p df)
p_value <- 1 - pchisq(T_stat, df = p)

cat(sprintf("T = %.3f, df = %d, p-value = %.4f\n", T_stat, p, p_value))

해석: 모평균이 정말 0 인 시뮬레이션이므로 \(H_0\) 를 기각하지 않을 것이 기대된다 (p-value 가 큼). 만약 모평균이 0 이 아닌 (예: 비대칭 드리프트가 있는) 데이터에 적용하면 p-value 가 작아져 검정의 검정력을 확인할 수 있다.

12 핵심 정리

결과	노름·거리	수렴 속도	핵심 가정
표본 평균 \(\hat\mu \to \mu\)	\(L^2\)	\(O(N^{-1/2})\)	\(\mathbb{E}\\|X\\|^2 < \infty\)
표본 공분산 \(\hat C \to C\)	HS	\(O(N^{-1/2})\)	\(\mathbb{E}\\|X\\|^4 < \infty\)
EFPC \(\hat v_j \to v_j\) (부호 보정)	\(L^2\)	\(O_P(N^{-1/2})\)	고유값 단순성
함수 CLT \(\sqrt N(\hat\mu - \mu) \Rightarrow Z\)	약수렴	—	\(\mathbb{E}\\|X\\|^2 < \infty\)
평균 검정 (가중 카이제곱·절단)	—	—	iid + 위 모멘트
동시 신뢰 대역	sup 노름	—	함수 CLT

12장의 메시지를 한 문장으로 줄이면: “함수 데이터의 추론은 다변량 추론과 같은 모수적 속도 (\(N^{-1/2}\)) 로 작동하며, 적절한 노름·부호 보정·가중 분포만 갖추면 검정·신뢰 대역도 형식적으로 동일하다.”

13 응용 분야

분야	12장 결과의 활용
임상시험 (longitudinal)	환자별 곡선 (혈당·혈압 추이) 의 평균 함수에 대한 동시 신뢰 대역으로 치료 효과 시각화
금융 (intraday returns)	BOA 사례처럼 일중 평균 수익률 검정·구간 추정
환경 (temperature curves)	지역별 일별 기온 곡선의 평균 차이 검정
RT-PCR 진단	정상 vs 비정상 증폭 곡선의 평균 비교, \(H_0\): “두 그룹의 평균 곡선이 같다” 검정
신경과학 (DTI, fMRI)	뇌 영상 곡선의 그룹 간 차이 검정 + 다중 비교 보정 (점별 → 동시)

특히 RT-PCR 응용에서는 Ch.12 의 동시 신뢰 대역 이 의사결정 임계값을 함수 전 구간에서 일관되게 정해 주는 도구가 된다 — 점별 임계값을 시점마다 따로 정하는 기존 방식의 다중 비교 문제를 해결한다.

14 관련 주제

선행 지식

연관 주제

Ch.1 — 함수형 데이터 분석의 첫걸음 (Overview) — BOA 데이터의 첫 도입
1.1~1.2 — 기저 전개와 표본 평균·공분산
Ch.8 — 함수 시계열 (FTS) 개관 — iid 가정이 깨지는 시계열 확장
8.5~8.6 — 장기 공분산 함수 (LRCF) 와 정상성 검정

후속 주제 (placeholder)

Functional Bootstrap — 점근 분포 대신 resampling 으로 신뢰구간 구성
Hotelling’s \(T^2\) 의 함수 확장 — 두 표본 평균 비교
Simultaneous Confidence Bands — 본 글의 sup 노름 띠 심화

15 참고문헌

Kokoszka, P., & Reimherr, M. (2017). Introduction to Functional Data Analysis, Ch.12. Chapman & Hall/CRC.
Hsing, T., & Eubank, R. (2015). Theoretical Foundations of Functional Data Analysis — 추론 이론의 수학적 심화.
Bosq, D. (2000). Linear Processes in Function Spaces — 함수 시계열 추론의 고전.