1 이 장의 위치와 목적
Chapter 1~7 의 모든 함수 데이터 분석 도구는 iid 가정 하에 전개되었다 — 곡선 표본 \(X_1, X_2, \ldots, X_N\) 이 같은 분포에서 독립적으로 추출. 이 가정 덕에 표본 평균·공분산이 모집단의 좋은 추정량이고, FPCA·회귀·검정의 모든 점근 결과가 표준 형태.
그러나 시간 순서로 관측된 함수 수열 에서는 iid 가정이 본질적으로 깨진다.
- 일별 오염 곡선 — 어제의 오염이 오늘의 오염에 영향. 서로 독립 아님.
- 연도별 사망률 곡선 — 1970 년 사망률과 2010 년 사망률은 시간 추세로 연결.
- 분 단위 주가 곡선 — 어제의 종가가 오늘의 시가에 영향.
iid 가정이 깨지면:
- 표준오차가 부정확 — 양의 자기상관이면 분산이 과소평가.
- 요일·계절 효과 — 곡선의 분포가 시간에 따라 변할 수 있음 (비정상).
- 예측이 가능 — 과거의 곡선들에서 미래 곡선을 예측하는 새 도구 필요.
1.1 함수 시계열 (Functional Time Series, FTS) 의 정의
시간 순서로 관측된 함수 수열 \(\{X_n: n \in \mathbb{Z}\}\), 각 \(X_n \in L^2\).
iid 가 아닌 종속 구조를 가지며, 보통 한 곡선이 다음 곡선에 영향을 준다 (자기상관).
정상 (stationary) FTS: \(E[X_n(t)] = \mu(t)\) 와 \(\gamma_h(t, s) = \text{Cov}(X_n(t), X_{n+h}(s))\) 가 \(n\) 에 의존하지 않는 경우.
1.2 직관: 시계열 분석의 함수 일반화
FTS 는 스칼라 시계열 분석의 함수 일반화 — 모든 핵심 개념이 함수 차원으로 확장.
| 스칼라 시계열 | 함수 시계열 |
|---|---|
| \(X_n \in \mathbb{R}\) | \(X_n(t) \in L^2\) |
| AR(1): \(X_n = \varphi X_{n-1} + \varepsilon_n\) | FAR(1): \(X_n = \Phi(X_{n-1}) + \varepsilon_n\) |
| 자기공분산 \(\gamma_h\) (스칼라) | 자기공분산 \(\gamma_h(t, s)\) (이변량 함수) |
| 정상성 (\(\mu, \gamma_h\) 시간 무관) | 정상성 (\(\mu(t), \gamma_h(t, s)\) 시간 무관) |
| LRV \(\sigma^2 = \sum \gamma_h\) | LRCF \(\sigma(t, s) = \sum \gamma_h(t, s)\) |
| 표본 평균 분산 \(\sigma^2/N\) | 표본 평균 곡선 공분산 \(\sigma(t, s)/N\) |
스칼라 도구의 모든 직관 + 함수 차원의 추가 어려움 (무한차원, 적분, KL 분해).
1.3 비유: 음악과 영화의 시간 순서
- 스칼라 시계열 = 음악의 음표 수열 (각 시점에 하나의 음).
- 함수 시계열 = 영화의 프레임 수열 (각 시점에 하나의 영상 프레임 = 무한차원 함수).
영화의 프레임 수열도 음악의 음표 수열과 같은 시계열 구조 (이전 프레임이 다음 프레임에 영향) — 단지 각 시점의 객체가 더 풍부.
1.4 이 포스트의 흐름
8.1 스칼라 시계열 기초 — AR(1), 자기상관, 정상성
↓
8.2 FAR(1) 모형 — 함수 자기회귀 X_n = Φ(X_{n-1}) + ε_n 와 pseudo-inverse 추정
↓
8.3 Hyndman-Ullah 예측 — KL 절단 + 단변량 점수 시계열 예측
↓
8.4 다변량 예측 — 점수 벡터의 VAR 모형
↓
8.5 장기 공분산 함수 (LRCF) — 종속 데이터의 표준오차
↓
8.6 정상성 검정 — partial sum + Brownian bridge
↓
8.7 FAR(1) 의 R 구현 — fda 패키지로 시뮬레이션·추정
↓
8.8 FAR(1) 존재 조건 — ‖Φ‖ < 1 (Theorem 8.8.1)
8.2 의 FAR(1) 가 가장 핵심적인 모형, 8.5 의 LRCF 가 모든 추론의 토대, 8.6 의 정상성 검정이 실무 적용의 첫 단계.
2 스칼라 시계열의 핵심 개념
2.1 AR(1) 모형
가장 단순하면서 가장 흔한 시계열 모형:
\[ X_n - \mu = \varphi(X_{n-1} - \mu) + \varepsilon_n, \]
여기서 \(\{\varepsilon_n\}\) 은 백색 잡음 (\(E\varepsilon_n = 0\), \(\text{Var}[\varepsilon_n] = \sigma^2\), \(\text{Cov}(\varepsilon_n, \varepsilon_{n+h}) = 0\) for \(h \neq 0\)).
2.2 정상성 조건
시계열 모형 \(\{X_n\}\) 이 정상 이면 \(E[X_n]\) 와 \(\text{Cov}(X_n, X_{n+h})\) 가 \(n\) 에 의존하지 않음.
AR(1) 의 경우: \(|\varphi| < 1\) 이어야 정상 해 존재.
2.3 자기공분산 함수
정상 모형에서:
\[ \gamma_h = \text{Cov}(X_n, X_{n+h}), \quad h = 0, 1, 2, \ldots \]
음의 lag 는 대칭으로 자동 결정 (\(\gamma_{-h} = \gamma_h\)).
자기상관:
\[ \rho_h = \gamma_h / \gamma_0. \]
표본 자기상관 함수 (ACF) 가 시계열 분석의 가장 흔한 진단 도구.
2.4 직관: AR(1) 의 두 종류 행동
- \(0 < \varphi < 1\) — 양의 지속성 (positive persistence). 양의 값이 다음 시점에도 양의 경향. 매끄러운 진행.
- \(-1 < \varphi < 0\) — 부호 교대. 양 → 음 → 양 진동.
- \(\varphi = 1\) — random walk (랜덤 워크). 정상 아님 — 표류 (drift) 발생.
함수 시계열에서도 같은 패턴 — Φ 의 “강도” 가 곡선 수열의 매끄러움/진동 결정.
2.5 비유: 일상의 자기상관
오늘의 기온이 어제의 기온과 비슷 (양의 자기상관, \(\varphi > 0\)). 오늘의 주가 변화가 어제의 변화와 무관 (백색 잡음, \(\varphi = 0\)). 오늘의 광고 클릭이 어제 클릭한 사람들에게 다음 광고가 안 나가게 만들면 음의 자기상관 (\(\varphi < 0\)).
스칼라 시계열의 모든 직관이 함수 시계열로 확장 — 단지 각 시점의 객체가 곡선.
3 FAR(1) — 함수 자기회귀 모형
3.1 모형 정의
\(L^2\) 의 평균 0 함수 수열 \(\{X_n: -\infty < n < \infty\}\) 가 다음을 만족하면 FAR(1):
\[ X_n = \Phi(X_{n-1}) + \varepsilon_n, \]
여기서:
- \(\Phi: L^2 \to L^2\) — 함수를 함수로 변환하는 선형 연산자.
- \(\{\varepsilon_n\}\) — iid 평균 0 함수 잡음.
- 응용에서 \(\Phi\) 가 적분 연산자: \(\Phi(x)(t) = \int \varphi(t, s) x(s) \, ds\).
- 즉 \(X_n(t) = \int \varphi(t, s) X_{n-1}(s) \, ds + \varepsilon_n(t)\).
3.2 스칼라 AR(1) 과의 비교
| 측면 | 스칼라 AR(1) | FAR(1) |
|---|---|---|
| \(X_n\) | 스칼라 | 함수 |
| 회귀계수 | 스칼라 \(\varphi\) | 연산자 \(\Phi\) (또는 핵 \(\varphi(t, s)\)) |
| 자기공분산 | 스칼라 \(\gamma_h\) | 이변량 함수 \(\gamma_h(t, s)\) |
| 정상성 조건 | \(|\varphi| < 1\) | \(\|\Phi\| < 1\) (또는 \(\|\Phi^j\| < 1\)) |
3.3 직관: 핵 φ(t, s) 의 의미
\(\varphi(t, s)\) 는 “전 시점의 시간 \(s\) 의 값이 현 시점의 시간 \(t\) 의 값에 주는 영향력”. 함수-on-함수 회귀 (Ch.5.3) 의 핵 \(\psi(t, s)\) 와 같은 구조이지만, 회귀자와 반응이 같은 곡선의 다른 시점.
3.4 비유: 시계열의 메아리
스피커 시스템의 임펄스 응답 — 한 순간의 입력이 후속 시점의 출력에 어떻게 메아리치는가. FAR(1) 의 핵 \(\varphi(t, s)\) 도 비슷 — 어제의 곡선의 한 시점이 오늘의 곡선의 한 시점에 어떻게 메아리.
이는 함수 시계열의 본성 — 각 시점이 함수이지만, 시간 의존성이 곡선 사이의 관계로 표현.
4 FAR(1) 의 추정
4.1 스칼라 직관에서 출발
스칼라 AR(1) 의 추정: \(\widehat{\varphi} = \widehat{\gamma}_1 / \widehat{\gamma}_0\). 이는 lag-1 자기공분산 / lag-0 분산.
4.2 함수 일반화
함수 자기공분산 연산자:
\[ C(x) = E[\langle X_n, x \rangle X_n] \quad (\text{lag-0, 즉 통상의 공분산}), \]
\[ C_1(x) = E[\langle X_n, x \rangle X_{n+1}] \quad (\text{lag-1}). \]
(8.1) 의 양변에 \(\langle X_{n-1}, x \rangle\) 를 곱하고 기댓값 → \(C_1 = \Phi C\) (식 8.2). 따라서:
\[ \Phi = C_1 C^{-1}. \]
4.3 핵심 어려움: \(C^{-1}\) 가 \(L^2\) 전체에 정의되지 않음
스펙트럼 분해 \(C(x) = \sum_j \lambda_j \langle x, v_j \rangle v_j\) 로:
\[ C^{-1}(y) = \sum_j \lambda_j^{-1} \langle y, v_j \rangle v_j. \]
이 합이 수렴하려면 \(\sum_j \lambda_j^{-2} \langle y, v_j \rangle^2 < \infty\) — 모든 \(y\) 에 대해 성립 안 함 (작은 \(\lambda_j\) 가 \(\lambda_j^{-2}\) 를 폭발시킴).
4.4 Pseudo-Inverse \(C_p^+\)
해결책: 첫 \(p\) 개 PC 만 사용 (절단):
\[ C_p^+(y) = \sum_{j=1}^p \lambda_j^{-1} \langle y, v_j \rangle v_j. \]
이는 \(L^2\) 전체에 정의되지만 진짜 역은 아님 (Problem 8.4) — pseudo-inverse.
4.5 핵 추정량 (식 8.5)
\(\Phi \approx C_1 C_p^+\) 와 KL 분해를 사용하여:
\[ \widehat{\varphi}_p(t, s) = \frac{1}{N-1} \sum_{k=1}^{N-1} \sum_{i, j = 1}^{p} \widehat{\lambda}_j^{-1} \langle X_k, \widehat{v}_j \rangle \langle X_{k+1}, \widehat{v}_i \rangle \widehat{v}_j(s) \widehat{v}_i(t). \]
4.6 직관: 모든 핵심 양은 PCA 의 출력
추정량 (8.5) 의 모든 양 — \(\widehat{\lambda}_j\) (고유값), \(\widehat{v}_j\) (EFPC), \(\langle X_k, \widehat{v}_j \rangle\) (점수) — 가 표준 함수 PCA 의 출력. R 의 pca.fd 함수만으로 핵 추정 가능.
4.7 \(p\) 의 균형
- 작은 \(p\) — 안정적이지만 미세 패턴 놓침.
- 큰 \(p\) — 작은 \(\widehat{\lambda}_j\) 가 추정량을 폭발 (분모로 들어가 \(\widehat{\lambda}_j^{-1}\) 큼).
CPV (누적 분산 비율) 85~95% 가 표준 선택.
4.8 비유: 음악의 메아리 추정
여러 콘서트의 (입력 음악, 출력 메아리) 쌍에서 콘서트장의 음향 특성을 역추정. 가장 두드러진 음향 모드 (PC) 만 추정하고 미세한 모드는 무시 — 안정적이지만 충실.
5 Hyndman-Ullah 예측 방법
5.1 동기
FAR(1) 모형의 추정 + 예측이 정상 가정 + 강한 모형 가정에 의존. 더 일반적이고 자동화된 예측 방법 이 필요.
5.2 핵심 아이디어
- 관측 함수 \(X_1, \ldots, X_N\) 의 KL 절단 표현: \[ X_n^{(J)}(t) = \widehat{\mu}(t) + \sum_{j=1}^J \widehat{\xi}_{n, j} \widehat{v}_j(t). \]
- 각 점수 시계열 \(\widehat{\xi}_{1, j}, \ldots, \widehat{\xi}_{N, j}\) 를 단변량 시계열 예측 (ARIMA 등) 으로 미래 점수 \(\widehat{\xi}_{N+h | N, j}\) 예측.
- 미래 곡선 재구성: \[ X_{N+h | N}^{(J)}(t) = \widehat{\mu}(t) + \sum_{j=1}^J \widehat{\xi}_{N+h | N, j} \widehat{v}_j(t). \]
5.3 직관: 차원 축소 후 단변량 예측
함수 시계열 예측의 본질적 어려움은 무한차원. KL 절단으로 \(J\) 차원 단변량 시계열로 환원 후 표준 예측 도구 사용.
이는 Hyndman-Ullah 방법의 매력 — 모든 단변량 시계열 예측 도구 (ARIMA, exponential smoothing 등) 가 자동으로 사용 가능.
5.4 응용: 미국 사망률 곡선
연간 사망률 곡선 \(\ln m_n(t)\) (\(t\) = 나이, \(n\) = 연도). \(\widehat{v}_1(t)\) 가 양 (의학 발전으로 사망률 전체 감소), 1960~2010 의 점수 \(\widehat{\xi}_{n, 1}\) 가 명확한 하향 추세 → 미래 사망률 감소 예측.
5.5 직관: PC 점수의 시간 추세가 핵심
각 PC 의 점수 시계열이 다른 시간 패턴 보임:
- PC1 점수 — 의학 진보 추세 (장기 하향).
- PC2 점수 — 단기 변동 (주기적).
- PC3 점수 — 노이즈 (자기상관 약함).
각 점수의 시계열을 따로 예측 → 함수 예측에 합성. 차원별 분리된 분석 이 차원의 저주를 우회.
5.6 비유: 다채널 음악의 시계열 예측
5 채널 음악의 미래 흐름 예측 = 각 채널의 시계열을 따로 예측 후 합성. 채널 사이의 의존성을 무시하지만 (단순화), 단일 시계열 도구로 자동 처리 가능.
Hyndman-Ullah 의 PC 별 단변량 예측도 같은 사고 — PC 사이 결합을 무시하는 단순화 가 자동화의 대가.
6 다변량 예측 (8.4)
6.1 동기
Hyndman-Ullah 방법은 PC 점수들을 독립적으로 예측. 점수 사이 cross-covariance 를 활용하면 더 정확한 예측 가능.
6.2 다변량 알고리즘
- KL 절단 차원 \(J\) 선택, 점수 벡터 형성: \[ \boldsymbol{\Xi}_n^{(J)} = (\widehat{\xi}_{n, 1}, \ldots, \widehat{\xi}_{n, J})^T. \]
- 다변량 시계열 예측 기법 (VAR — Vector Autoregression 등) 으로 \(\boldsymbol{\Xi}_{N+h}^{(J)}\) 예측.
- 식 (8.6) 으로 함수 예측 재구성.
6.3 Hyndman-Ullah vs 다변량 예측
| 측면 | Hyndman-Ullah | 다변량 |
|---|---|---|
| 점수 처리 | 각 PC 별 독립 단변량 예측 | 모든 PC 동시 다변량 예측 |
| 변동성 | 단순 (각 PC 별로) | 더 안정적 (PC 사이 정보 활용) |
| 구현 | ARIMA 등 | VAR (vars 패키지) |
| 응용 | ftsa::fdm |
ftsa::farforecast |
6.4 직관: 정보 활용의 균형
Hyndman-Ullah 가 단순하고 견고하지만 PC 사이 cross-covariance 정보 를 잃음. 다변량 방법이 그 정보를 활용하여 더 효율적이지만, 추정 모수 수가 더 많음 (VAR 의 추가 모수).
표본이 충분히 크면 다변량이 더 좋고, 작으면 Hyndman-Ullah 가 더 안정적. 상황 의존.
7 장기 공분산 함수 (LRCF, 8.5)
7.1 동기
iid 표본의 표본 평균 분산: \(\text{Var}[\bar{X}_N] = \sigma^2 / N\).
종속 표본 (시계열) 의 경우 분산이 다름:
\[ \text{Var}[\bar{X}_N] = N^{-2} \sum_{n, m} \text{Cov}(X_n, X_m). \]
정상성 + 큰 \(N\) 의 점근에서:
\[ N \cdot \text{Var}[\bar{X}_N] \to \sigma^2 = \sum_{h = -\infty}^\infty \gamma_h \quad (\text{LRV: Long-Run Variance}). \]
7.2 함수 시계열의 LRCF
함수 일반화:
\[ \sigma(t, s) = \sum_{h = -\infty}^\infty \gamma_h(t, s) \quad (\text{식 8.12}), \]
여기서 \(\gamma_h(t, s) = \text{Cov}(X_n(t), X_{n+h}(s))\).
7.3 표본 평균의 점근 분포
iid 의 CLT 와 비교:
| 상황 | CLT |
|---|---|
| iid | \(\sqrt{N}(\bar{X}_N - \mu) \to N(0, \gamma_0)\) — lag-0 공분산 |
| 정상 시계열 | \(\sqrt{N}(\bar{X}_N - \mu) \to N(0, \sigma)\) — LRCF |
확률 변수의 분포가 LRCF 로 변경 — 시계열 추론의 모든 표준오차가 LRCF 기반.
7.4 직관: 종속이 분산을 변화시키는 이유
- 양의 자기상관 — 인접 시점이 비슷한 값. 표본 평균에 같은 정보가 반복 → 유효 표본 크기 감소 → 분산 증가.
- 음의 자기상관 — 인접 시점이 반대 부호. 평균에서 자동 상쇄 → 유효 표본 크기 증가 → 분산 감소.
- 무자기상관 (iid) — 표준 결과.
7.5 LRCF 추정 (식 8.16)
표본 LRCF:
\[ \widehat{\sigma}(t, s) = \widehat{\gamma}_0(t, s) + \sum_{h=1}^{N-1} K\left(\frac{h}{q}\right) \{\widehat{\gamma}_h(t, s) + \widehat{\gamma}_h(s, t)\}, \]
여기서 \(K\) 는 lag window (예: Bartlett window \(K(x) = 1 - |x|\)), \(q\) 는 bandwidth.
7.6 직관: Lag window 가 무한합을 절단
이론적 LRCF 는 무한합. \(K\) 가 큰 \(|h|\) 의 자기공분산을 0 으로 — 자연스러운 절단.
Bandwidth \(q\) 의 균형:
- 작은 \(q\) — 적은 lag 만 사용. 안정적이지만 \(\sigma\) 의 일부만 추정.
- 큰 \(q\) — 많은 lag 사용. 더 완전하지만 잡음 큼.
규칙: \(q / N \to 0\) 와 \(q \to \infty\).
7.7 비유: 메아리의 누적
극장의 메아리를 측정할 때, 얼마나 많은 메아리 (lag) 까지 누적할지 가 결정. 가까운 메아리만 (작은 \(q\)) 안정적이지만 일부만 측정. 멀리까지 (큰 \(q\)) 완전하지만 약한 메아리는 잡음과 구별 어려움.
LRCF 추정의 \(q\) 도 같은 균형 — 신호와 잡음의 트레이드오프.
8 정상성 검정 (8.6)
8.1 동기
함수 시계열의 모든 표준 분석 (FAR 추정, Hyndman-Ullah, LRCF 추정) 이 정상성 가정. 데이터가 정상인지 검증 이 필수 첫 단계.
8.2 검정 문제
\[ H_0: X_i(t) = \mu(t) + \eta_i(t), \]
\(\{\eta_i\}\) 가 strictly stationary, \(\mu\) 는 시간 무관 평균.
대립 가설:
- \(H_{A, 1}\) (change point): 어떤 시점 \(k^*\) 에서 평균이 \(\mu(t) + \delta(t)\) 로 변경.
- \(H_{A, 2}\) (random walk): \(X_i(t) = \mu(t) + \sum_{\ell=1}^i u_\ell(t)\) — 누적적 비정상.
8.3 검정 통계량 — Partial Sum 기반
부분합 과정:
\[ S_N(x, t) = N^{-1/2} \sum_{i=1}^{[Nx]} X_i(t), \quad 0 \leq x \leq 1. \]
CUSUM 형태:
\[ U_N(x) = S_N(x) - x S_N(1). \]
\(H_0\) 하 \(U_N\) 이 평균 0 으로 수렴 (Brownian bridge 형태).
8.4 검정 통계량 (Monte Carlo 형태)
\[ \widehat{T}_N = \int_0^1 \|U_N(x)\|^2 \, dx. \]
\(H_0\) 하 점근 분포가 \(T = \sum_j \lambda_j \int B_j^2(x) \, dx\) — Brownian bridge 의 제곱적분의 가중 합.
8.5 Pivotal 검정 통계량
각 \(\widehat{\lambda}_j\) 로 정규화하면 분포가 \(H_0\) 하 표준화:
\[ \widehat{T}_N^0(d) = \sum_{j=1}^d \widehat{\lambda}_j^{-1} \int_0^1 \langle U_N(x, \cdot), \widehat{\varphi}_j \rangle^2 \, dx. \]
극한 분포 \(T^0(d) = \sum_{j=1}^d \int_0^1 B_j^2(x) \, dx\) — 데이터에 무관, 표준 임계값 사용 가능 (Table 8.1).
8.6 직관: 정상성이 깨지면 statistic 이 발산
\(H_0\) 하: \(U_N\) 이 Brownian bridge 형태 → \(\widehat{T}_N\) 이 유한 분포로 수렴.
\(H_A\) 하: \(U_N\) 에 추가 항 (비정상 신호) → \(\widehat{T}_N \to \infty\). 임계값 초과 → 기각.
8.7 R 구현
8.8 비유: 안정성의 시각적 진단
심전도 모니터링에서 환자의 심박이 정상이면 일정한 패턴, 비정상이면 추세나 점프 감지. 함수 시계열의 정상성 검정도 같은 사고 — 곡선들의 시계열 패턴이 일정한지 (정상) vs 추세·점프 (비정상).
9 FAR(1) 의 존재 조건 (8.8)
9.1 Theorem 8.8.1
\(\|\Phi\| < 1\) 이면 식 (8.1) 의 unique strictly stationary solution 존재:
\[ X_n = \sum_{j=0}^\infty \Phi^j(\varepsilon_{n-j}). \]
이 급수는 a.s. 수렴 + \(L^2\) 수렴.
9.2 스칼라 AR(1) 과의 비교
| 모형 | 정상성 조건 | 해 형태 |
|---|---|---|
| 스칼라 AR(1) | \(|\varphi| < 1\) | \(X_n = \sum_{j=0}^\infty \varphi^j \varepsilon_{n-j}\) |
| FAR(1) | \(\|\Phi\| < 1\) | \(X_n = \sum_{j=0}^\infty \Phi^j(\varepsilon_{n-j})\) |
핵심 일관성: 스칼라의 \(|\varphi|\) → 함수의 연산자 노름 \(\|\Phi\|\). 같은 직관, 다른 표현.
9.3 충분 조건: Hilbert-Schmidt 노름
응용에서 자주 쓰이는 더 강한 충분 조건 — 적분 핵 \(\Phi\) 에 대해:
\[ \iint \varphi^2(t, s) \, dt \, ds < 1. \]
이는 핵의 Hilbert-Schmidt 노름 \(\|\Phi\|_S < 1\), 보통 \(\|\Phi\| \leq \|\Phi\|_S\).
9.4 직관: 스칼라 직관의 직접 일반화
\(|\varphi| = 1\) 의 random walk → FAR(1) 의 \(\|\Phi\| = 1\) 도 random walk 같은 비정상. \(\|\Phi\|\) 가 함수 차원에서 “AR 강도” 의 척도.
조건 \(\|\Phi\| < 1\) 은 직관적으로 “과거 곡선의 영향이 시간에 따라 충분히 빠르게 감쇠” 를 의미 — 스칼라 AR 와 같은 본성.
9.5 비유: 메아리의 감쇠
콘서트장의 메아리가 시간에 따라 충분히 감쇠해야 (감쇠 계수 < 1) 음악이 안정적으로 들림. 감쇠가 부족하면 (= 1) 무한히 누적되어 카오스. FAR(1) 의 \(\|\Phi\| < 1\) 도 같은 직관 — 시계열의 “메아리” 가 충분히 감쇠.
10 R 패키지
| 패키지 | 주요 기능 |
|---|---|
fda |
함수 객체 생성, EFPC 추정 (pca.fd) — 8.7 의 FAR(1) 시뮬레이션 |
far |
FAR 시뮬레이션·추정의 별도 도구 |
ftsa |
Hyndman-Ullah 예측 (fdm, forecast.fdm), 다변량 예측 (farforecast), 정상성 검정 (T_stationary) |
demography |
사망률 데이터 + 함수 모형 (fdm) |
vars |
VAR 모형 — farforecast 의 내부 도구 |
ftsa 가 가장 포괄적. 사망률·기상·금융 데이터의 FTS 분석에서 표준.
11 Chapter 8 의 통합 시각
11.1 한 줄 요약
함수 시계열 (FTS) 은 시간 순서로 관측된 곡선 수열의 분석 framework — iid 가정이 깨진 환경에서 FAR(1) X_n = Φ(X_{n-1}) + ε_n 를 핵심 모형으로 한다. 추정은 스칼라 AR 의 γ_1/γ_0 직관을 함수로 일반화한 Φ ≈ C C_1^{-1} 이지만 C^{-1} 의 부재로 pseudo-inverse C_p^+ 를 사용한다. Hyndman-Ullah 예측은 KL 절단 + 단변량 점수 시계열 예측의 자동화 도구이며, 다변량 예측은 점수 사이 cross-covariance 를 활용. 종속 데이터의 표준오차는 장기 공분산 함수 (LRCF) 로 보정. 정상성 검정은 partial sum + Brownian bridge 의 점근 분포 기반. FAR(1) 의 존재는 ‖Φ‖ < 1 (Theorem 8.8.1) — 스칼라 |φ| < 1 의 직접 일반화.
11.2 Ch.7 (Sparse FDA) 와의 비교
| 측면 | Ch.7 (Sparse FDA) | Ch.8 (FTS) |
|---|---|---|
| 데이터 본성 | iid + 단위당 sparse | 시간 종속 + 단위당 dense |
| 핵심 어려움 | 개별 곡선 평활 불가능 | 독립 가정 깨짐 |
| 핵심 도구 | PACE (BLUP) | FAR(1), LRCF |
| 응용 | 종단 의학 데이터 | 사망률·금융·환경 곡선 |
두 챕터가 iid 가정의 두 다른 방향 위반 — Sparse 는 단위 차원, FTS 는 시간 차원. 도구는 다르지만 iid 의 한계를 극복하는 두 패턴.
11.3 후속 챕터와의 연결
| 다음 챕터 | Ch.8 의 도구를 어떻게 활용하는가 |
|---|---|
| Ch.9 공간 함수 | 공간 차원의 시계열 (지역별 + 시간) |
| Ch.10~11 힐베르트 공간 | FAR(1) 존재 정리의 형식적 토대 |
| Ch.12 추론 | 정상 FTS 의 점근 분포, LRCF 기반 신뢰 구간 |
Ch.8 의 LRCF 가 후속 챕터들의 종속 데이터 추론의 표준 도구.
11.4 실용 워크플로우
- 데이터 준비 — 시간 순서 곡선 수열로 정리.
- 시각화 — 곡선 수열의 시간 추세 확인.
- 정상성 검정 (
ftsa::T_stationary) — 비정상이면 차분 또는 normalize. - FPCA 분해 — KL 점수 시계열 추출.
- 점수 시계열 분석 — ACF, AR 모형 적합.
- 예측 — Hyndman-Ullah (
ftsa::fdm) 또는 다변량 (ftsa::farforecast). - 추론 — LRCF 기반 신뢰 구간.
12 관련 주제
선행 지식
- FDA 1.0 — 개요
- FDA 3.0 — 함수 데이터의 수학적 프레임워크 개관
- FDA 5.3~5.4 — 함수-on-함수 회귀와 refund 통합 구현 — 핵 \(\psi(t,s)\) 의 추정 framework
- FDA 7.0 — 희소 FDA 개관 — iid 가정 위반의 다른 방향
- 스칼라 시계열 기초 (AR, ARIMA)
후속 주제
- FDA 8.1~8.2 — 시계열 기초와 FAR(1) 모형
- FDA 8.3~8.4 — Hyndman-Ullah 와 다변량 예측
- FDA 8.5~8.6 — LRCF 와 정상성 검정
- FDA 8.7~8.8 — FAR(1) R 구현과 존재 조건
- FDA 8.10 — Chapter 8 연습문제 풀이
- FDA Ch.9 — 공간 함수 데이터
관련 개념
- AR(1) 모형과 정상성 — FAR(1) 의 스칼라 원조
- Vector Autoregression (VAR) — 8.4 의 도구
- Brownian Bridge — 8.6 의 점근 분포
- Long-Run Variance (LRV) — 8.5 의 스칼라 원조
ftsaR 패키지 — FTS 분석의 표준 도구- Karhunen-Loève 전개 — 8.3 Hyndman-Ullah 의 토대