FDA 8.0 — 함수 시계열 (Functional Time Series) 개관

독립 가정이 깨진 곡선 수열의 분석: FAR(1) 모형, Hyndman-Ullah 예측, 장기 공분산, 정상성 검정

Kokoszka & Reimherr (2017) Ch.8 의 핵심을 개관한다. 시계열 순서로 관측된 함수 수열 — 독립 가정이 깨진 곡선들 — 의 분석 framework. 스칼라 AR(1) 의 함수 일반화인 FAR(1) X_n = Φ(X_{n-1}) + ε_n 와 그 추정 (Φ ≈ C C_1^{-1} 의 pseudo-inverse 환원), KL 절단 + 단변량 점수 예측의 Hyndman-Ullah 방법, 다변량 예측 벡터 (VAR), 종속 데이터의 표준오차를 위한 장기 공분산 함수 (LRCF), partial sum 기반의 정상성 검정, FAR(1) 의 존재 조건 ‖Φ‖ < 1 (Theorem 8.8.1) — 미국 사망률 곡선과 호주 대기 오염 데이터를 통한 응용을 통합 정리한다.

Statistics
Functional Data Analysis
저자

Kwangmin Kim

공개

2026년 05월 07일

1 이 장의 위치와 목적

Chapter 1~7 의 모든 함수 데이터 분석 도구는 iid 가정 하에 전개되었다 — 곡선 표본 \(X_1, X_2, \ldots, X_N\) 이 같은 분포에서 독립적으로 추출. 이 가정 덕에 표본 평균·공분산이 모집단의 좋은 추정량이고, FPCA·회귀·검정의 모든 점근 결과가 표준 형태.

그러나 시간 순서로 관측된 함수 수열 에서는 iid 가정이 본질적으로 깨진다.

  • 일별 오염 곡선 — 어제의 오염이 오늘의 오염에 영향. 서로 독립 아님.
  • 연도별 사망률 곡선 — 1970 년 사망률과 2010 년 사망률은 시간 추세로 연결.
  • 분 단위 주가 곡선 — 어제의 종가가 오늘의 시가에 영향.

iid 가정이 깨지면:

  1. 표준오차가 부정확 — 양의 자기상관이면 분산이 과소평가.
  2. 요일·계절 효과 — 곡선의 분포가 시간에 따라 변할 수 있음 (비정상).
  3. 예측이 가능 — 과거의 곡선들에서 미래 곡선을 예측하는 새 도구 필요.

1.1 함수 시계열 (Functional Time Series, FTS) 의 정의

정의: 함수 시계열

시간 순서로 관측된 함수 수열 \(\{X_n: n \in \mathbb{Z}\}\), 각 \(X_n \in L^2\).

iid 가 아닌 종속 구조를 가지며, 보통 한 곡선이 다음 곡선에 영향을 준다 (자기상관).

정상 (stationary) FTS: \(E[X_n(t)] = \mu(t)\)\(\gamma_h(t, s) = \text{Cov}(X_n(t), X_{n+h}(s))\)\(n\) 에 의존하지 않는 경우.

1.2 직관: 시계열 분석의 함수 일반화

FTS 는 스칼라 시계열 분석의 함수 일반화 — 모든 핵심 개념이 함수 차원으로 확장.

스칼라 시계열 함수 시계열
\(X_n \in \mathbb{R}\) \(X_n(t) \in L^2\)
AR(1): \(X_n = \varphi X_{n-1} + \varepsilon_n\) FAR(1): \(X_n = \Phi(X_{n-1}) + \varepsilon_n\)
자기공분산 \(\gamma_h\) (스칼라) 자기공분산 \(\gamma_h(t, s)\) (이변량 함수)
정상성 (\(\mu, \gamma_h\) 시간 무관) 정상성 (\(\mu(t), \gamma_h(t, s)\) 시간 무관)
LRV \(\sigma^2 = \sum \gamma_h\) LRCF \(\sigma(t, s) = \sum \gamma_h(t, s)\)
표본 평균 분산 \(\sigma^2/N\) 표본 평균 곡선 공분산 \(\sigma(t, s)/N\)

스칼라 도구의 모든 직관 + 함수 차원의 추가 어려움 (무한차원, 적분, KL 분해).

1.3 비유: 음악과 영화의 시간 순서

  • 스칼라 시계열 = 음악의 음표 수열 (각 시점에 하나의 음).
  • 함수 시계열 = 영화의 프레임 수열 (각 시점에 하나의 영상 프레임 = 무한차원 함수).

영화의 프레임 수열도 음악의 음표 수열과 같은 시계열 구조 (이전 프레임이 다음 프레임에 영향) — 단지 각 시점의 객체가 더 풍부.

1.4 이 포스트의 흐름

8.1 스칼라 시계열 기초 — AR(1), 자기상관, 정상성
    ↓
8.2 FAR(1) 모형 — 함수 자기회귀 X_n = Φ(X_{n-1}) + ε_n 와 pseudo-inverse 추정
    ↓
8.3 Hyndman-Ullah 예측 — KL 절단 + 단변량 점수 시계열 예측
    ↓
8.4 다변량 예측 — 점수 벡터의 VAR 모형
    ↓
8.5 장기 공분산 함수 (LRCF) — 종속 데이터의 표준오차
    ↓
8.6 정상성 검정 — partial sum + Brownian bridge
    ↓
8.7 FAR(1) 의 R 구현 — fda 패키지로 시뮬레이션·추정
    ↓
8.8 FAR(1) 존재 조건 — ‖Φ‖ < 1 (Theorem 8.8.1)

8.2 의 FAR(1) 가 가장 핵심적인 모형, 8.5 의 LRCF 가 모든 추론의 토대, 8.6 의 정상성 검정이 실무 적용의 첫 단계.


2 스칼라 시계열의 핵심 개념

2.1 AR(1) 모형

가장 단순하면서 가장 흔한 시계열 모형:

\[ X_n - \mu = \varphi(X_{n-1} - \mu) + \varepsilon_n, \]

여기서 \(\{\varepsilon_n\}\)백색 잡음 (\(E\varepsilon_n = 0\), \(\text{Var}[\varepsilon_n] = \sigma^2\), \(\text{Cov}(\varepsilon_n, \varepsilon_{n+h}) = 0\) for \(h \neq 0\)).

2.2 정상성 조건

정상성 (Stationarity)

시계열 모형 \(\{X_n\}\)정상 이면 \(E[X_n]\)\(\text{Cov}(X_n, X_{n+h})\)\(n\) 에 의존하지 않음.

AR(1) 의 경우: \(|\varphi| < 1\) 이어야 정상 해 존재.

2.3 자기공분산 함수

정상 모형에서:

\[ \gamma_h = \text{Cov}(X_n, X_{n+h}), \quad h = 0, 1, 2, \ldots \]

음의 lag 는 대칭으로 자동 결정 (\(\gamma_{-h} = \gamma_h\)).

자기상관:

\[ \rho_h = \gamma_h / \gamma_0. \]

표본 자기상관 함수 (ACF) 가 시계열 분석의 가장 흔한 진단 도구.

2.4 직관: AR(1) 의 두 종류 행동

  • \(0 < \varphi < 1\)양의 지속성 (positive persistence). 양의 값이 다음 시점에도 양의 경향. 매끄러운 진행.
  • \(-1 < \varphi < 0\)부호 교대. 양 → 음 → 양 진동.
  • \(\varphi = 1\)random walk (랜덤 워크). 정상 아님 — 표류 (drift) 발생.

함수 시계열에서도 같은 패턴 — Φ 의 “강도” 가 곡선 수열의 매끄러움/진동 결정.

2.5 비유: 일상의 자기상관

오늘의 기온이 어제의 기온과 비슷 (양의 자기상관, \(\varphi > 0\)). 오늘의 주가 변화가 어제의 변화와 무관 (백색 잡음, \(\varphi = 0\)). 오늘의 광고 클릭이 어제 클릭한 사람들에게 다음 광고가 안 나가게 만들면 음의 자기상관 (\(\varphi < 0\)).

스칼라 시계열의 모든 직관이 함수 시계열로 확장 — 단지 각 시점의 객체가 곡선.


3 FAR(1) — 함수 자기회귀 모형

3.1 모형 정의

정의: FAR(1) 모형 (식 8.1)

\(L^2\) 의 평균 0 함수 수열 \(\{X_n: -\infty < n < \infty\}\) 가 다음을 만족하면 FAR(1):

\[ X_n = \Phi(X_{n-1}) + \varepsilon_n, \]

여기서:

  • \(\Phi: L^2 \to L^2\) — 함수를 함수로 변환하는 선형 연산자.
  • \(\{\varepsilon_n\}\) — iid 평균 0 함수 잡음.
  • 응용에서 \(\Phi\) 가 적분 연산자: \(\Phi(x)(t) = \int \varphi(t, s) x(s) \, ds\).
  • \(X_n(t) = \int \varphi(t, s) X_{n-1}(s) \, ds + \varepsilon_n(t)\).

3.2 스칼라 AR(1) 과의 비교

측면 스칼라 AR(1) FAR(1)
\(X_n\) 스칼라 함수
회귀계수 스칼라 \(\varphi\) 연산자 \(\Phi\) (또는 핵 \(\varphi(t, s)\))
자기공분산 스칼라 \(\gamma_h\) 이변량 함수 \(\gamma_h(t, s)\)
정상성 조건 \(|\varphi| < 1\) \(\|\Phi\| < 1\) (또는 \(\|\Phi^j\| < 1\))

3.3 직관: 핵 φ(t, s) 의 의미

\(\varphi(t, s)\) 는 “전 시점의 시간 \(s\) 의 값이 현 시점의 시간 \(t\) 의 값에 주는 영향력”. 함수-on-함수 회귀 (Ch.5.3) 의 핵 \(\psi(t, s)\) 와 같은 구조이지만, 회귀자와 반응이 같은 곡선의 다른 시점.

3.4 비유: 시계열의 메아리

스피커 시스템의 임펄스 응답 — 한 순간의 입력이 후속 시점의 출력에 어떻게 메아리치는가. FAR(1) 의 핵 \(\varphi(t, s)\) 도 비슷 — 어제의 곡선의 한 시점이 오늘의 곡선의 한 시점에 어떻게 메아리.

이는 함수 시계열의 본성 — 각 시점이 함수이지만, 시간 의존성이 곡선 사이의 관계로 표현.


4 FAR(1) 의 추정

4.1 스칼라 직관에서 출발

스칼라 AR(1) 의 추정: \(\widehat{\varphi} = \widehat{\gamma}_1 / \widehat{\gamma}_0\). 이는 lag-1 자기공분산 / lag-0 분산.

4.2 함수 일반화

함수 자기공분산 연산자:

\[ C(x) = E[\langle X_n, x \rangle X_n] \quad (\text{lag-0, 즉 통상의 공분산}), \]

\[ C_1(x) = E[\langle X_n, x \rangle X_{n+1}] \quad (\text{lag-1}). \]

(8.1) 의 양변에 \(\langle X_{n-1}, x \rangle\) 를 곱하고 기댓값 → \(C_1 = \Phi C\) (식 8.2). 따라서:

\[ \Phi = C_1 C^{-1}. \]

4.3 핵심 어려움: \(C^{-1}\)\(L^2\) 전체에 정의되지 않음

스펙트럼 분해 \(C(x) = \sum_j \lambda_j \langle x, v_j \rangle v_j\) 로:

\[ C^{-1}(y) = \sum_j \lambda_j^{-1} \langle y, v_j \rangle v_j. \]

이 합이 수렴하려면 \(\sum_j \lambda_j^{-2} \langle y, v_j \rangle^2 < \infty\)모든 \(y\) 에 대해 성립 안 함 (작은 \(\lambda_j\)\(\lambda_j^{-2}\) 를 폭발시킴).

4.4 Pseudo-Inverse \(C_p^+\)

해결책: \(p\) 개 PC 만 사용 (절단):

\[ C_p^+(y) = \sum_{j=1}^p \lambda_j^{-1} \langle y, v_j \rangle v_j. \]

이는 \(L^2\) 전체에 정의되지만 진짜 역은 아님 (Problem 8.4) — pseudo-inverse.

4.5 핵 추정량 (식 8.5)

\(\Phi \approx C_1 C_p^+\) 와 KL 분해를 사용하여:

\[ \widehat{\varphi}_p(t, s) = \frac{1}{N-1} \sum_{k=1}^{N-1} \sum_{i, j = 1}^{p} \widehat{\lambda}_j^{-1} \langle X_k, \widehat{v}_j \rangle \langle X_{k+1}, \widehat{v}_i \rangle \widehat{v}_j(s) \widehat{v}_i(t). \]

4.6 직관: 모든 핵심 양은 PCA 의 출력

추정량 (8.5) 의 모든 양 — \(\widehat{\lambda}_j\) (고유값), \(\widehat{v}_j\) (EFPC), \(\langle X_k, \widehat{v}_j \rangle\) (점수) — 가 표준 함수 PCA 의 출력. R 의 pca.fd 함수만으로 핵 추정 가능.

4.7 \(p\) 의 균형

  • 작은 \(p\) — 안정적이지만 미세 패턴 놓침.
  • \(p\) — 작은 \(\widehat{\lambda}_j\) 가 추정량을 폭발 (분모로 들어가 \(\widehat{\lambda}_j^{-1}\) 큼).

CPV (누적 분산 비율) 85~95% 가 표준 선택.

4.8 비유: 음악의 메아리 추정

여러 콘서트의 (입력 음악, 출력 메아리) 쌍에서 콘서트장의 음향 특성을 역추정. 가장 두드러진 음향 모드 (PC) 만 추정하고 미세한 모드는 무시 — 안정적이지만 충실.


5 Hyndman-Ullah 예측 방법

5.1 동기

FAR(1) 모형의 추정 + 예측이 정상 가정 + 강한 모형 가정에 의존. 더 일반적이고 자동화된 예측 방법 이 필요.

5.2 핵심 아이디어

Hyndman-Ullah 방법
  1. 관측 함수 \(X_1, \ldots, X_N\) 의 KL 절단 표현: \[ X_n^{(J)}(t) = \widehat{\mu}(t) + \sum_{j=1}^J \widehat{\xi}_{n, j} \widehat{v}_j(t). \]
  2. 각 점수 시계열 \(\widehat{\xi}_{1, j}, \ldots, \widehat{\xi}_{N, j}\)단변량 시계열 예측 (ARIMA 등) 으로 미래 점수 \(\widehat{\xi}_{N+h | N, j}\) 예측.
  3. 미래 곡선 재구성: \[ X_{N+h | N}^{(J)}(t) = \widehat{\mu}(t) + \sum_{j=1}^J \widehat{\xi}_{N+h | N, j} \widehat{v}_j(t). \]

5.3 직관: 차원 축소 후 단변량 예측

함수 시계열 예측의 본질적 어려움은 무한차원. KL 절단으로 \(J\) 차원 단변량 시계열로 환원 후 표준 예측 도구 사용.

이는 Hyndman-Ullah 방법의 매력 — 모든 단변량 시계열 예측 도구 (ARIMA, exponential smoothing 등) 가 자동으로 사용 가능.

5.4 응용: 미국 사망률 곡선

연간 사망률 곡선 \(\ln m_n(t)\) (\(t\) = 나이, \(n\) = 연도). \(\widehat{v}_1(t)\) 가 양 (의학 발전으로 사망률 전체 감소), 1960~2010 의 점수 \(\widehat{\xi}_{n, 1}\) 가 명확한 하향 추세 → 미래 사망률 감소 예측.

5.5 직관: PC 점수의 시간 추세가 핵심

각 PC 의 점수 시계열이 다른 시간 패턴 보임:

  • PC1 점수 — 의학 진보 추세 (장기 하향).
  • PC2 점수 — 단기 변동 (주기적).
  • PC3 점수 — 노이즈 (자기상관 약함).

각 점수의 시계열을 따로 예측 → 함수 예측에 합성. 차원별 분리된 분석 이 차원의 저주를 우회.

5.6 비유: 다채널 음악의 시계열 예측

5 채널 음악의 미래 흐름 예측 = 각 채널의 시계열을 따로 예측 후 합성. 채널 사이의 의존성을 무시하지만 (단순화), 단일 시계열 도구로 자동 처리 가능.

Hyndman-Ullah 의 PC 별 단변량 예측도 같은 사고 — PC 사이 결합을 무시하는 단순화 가 자동화의 대가.


6 다변량 예측 (8.4)

6.1 동기

Hyndman-Ullah 방법은 PC 점수들을 독립적으로 예측. 점수 사이 cross-covariance 를 활용하면 더 정확한 예측 가능.

6.2 다변량 알고리즘

  1. KL 절단 차원 \(J\) 선택, 점수 벡터 형성: \[ \boldsymbol{\Xi}_n^{(J)} = (\widehat{\xi}_{n, 1}, \ldots, \widehat{\xi}_{n, J})^T. \]
  2. 다변량 시계열 예측 기법 (VAR — Vector Autoregression 등) 으로 \(\boldsymbol{\Xi}_{N+h}^{(J)}\) 예측.
  3. 식 (8.6) 으로 함수 예측 재구성.

6.3 Hyndman-Ullah vs 다변량 예측

측면 Hyndman-Ullah 다변량
점수 처리 각 PC 별 독립 단변량 예측 모든 PC 동시 다변량 예측
변동성 단순 (각 PC 별로) 더 안정적 (PC 사이 정보 활용)
구현 ARIMA 등 VAR (vars 패키지)
응용 ftsa::fdm ftsa::farforecast

6.4 직관: 정보 활용의 균형

Hyndman-Ullah 가 단순하고 견고하지만 PC 사이 cross-covariance 정보 를 잃음. 다변량 방법이 그 정보를 활용하여 더 효율적이지만, 추정 모수 수가 더 많음 (VAR 의 추가 모수).

표본이 충분히 크면 다변량이 더 좋고, 작으면 Hyndman-Ullah 가 더 안정적. 상황 의존.


7 장기 공분산 함수 (LRCF, 8.5)

7.1 동기

iid 표본의 표본 평균 분산: \(\text{Var}[\bar{X}_N] = \sigma^2 / N\).

종속 표본 (시계열) 의 경우 분산이 다름:

\[ \text{Var}[\bar{X}_N] = N^{-2} \sum_{n, m} \text{Cov}(X_n, X_m). \]

정상성 + 큰 \(N\) 의 점근에서:

\[ N \cdot \text{Var}[\bar{X}_N] \to \sigma^2 = \sum_{h = -\infty}^\infty \gamma_h \quad (\text{LRV: Long-Run Variance}). \]

7.2 함수 시계열의 LRCF

함수 일반화:

\[ \sigma(t, s) = \sum_{h = -\infty}^\infty \gamma_h(t, s) \quad (\text{식 8.12}), \]

여기서 \(\gamma_h(t, s) = \text{Cov}(X_n(t), X_{n+h}(s))\).

7.3 표본 평균의 점근 분포

iid 의 CLT 와 비교:

상황 CLT
iid \(\sqrt{N}(\bar{X}_N - \mu) \to N(0, \gamma_0)\) — lag-0 공분산
정상 시계열 \(\sqrt{N}(\bar{X}_N - \mu) \to N(0, \sigma)\) — LRCF

확률 변수의 분포가 LRCF 로 변경 — 시계열 추론의 모든 표준오차가 LRCF 기반.

7.4 직관: 종속이 분산을 변화시키는 이유

  • 양의 자기상관 — 인접 시점이 비슷한 값. 표본 평균에 같은 정보가 반복 → 유효 표본 크기 감소 → 분산 증가.
  • 음의 자기상관 — 인접 시점이 반대 부호. 평균에서 자동 상쇄 → 유효 표본 크기 증가 → 분산 감소.
  • 무자기상관 (iid) — 표준 결과.

7.5 LRCF 추정 (식 8.16)

표본 LRCF:

\[ \widehat{\sigma}(t, s) = \widehat{\gamma}_0(t, s) + \sum_{h=1}^{N-1} K\left(\frac{h}{q}\right) \{\widehat{\gamma}_h(t, s) + \widehat{\gamma}_h(s, t)\}, \]

여기서 \(K\) 는 lag window (예: Bartlett window \(K(x) = 1 - |x|\)), \(q\) 는 bandwidth.

7.6 직관: Lag window 가 무한합을 절단

이론적 LRCF 는 무한합. \(K\) 가 큰 \(|h|\) 의 자기공분산을 0 으로 — 자연스러운 절단.

Bandwidth \(q\) 의 균형:

  • 작은 \(q\) — 적은 lag 만 사용. 안정적이지만 \(\sigma\) 의 일부만 추정.
  • \(q\) — 많은 lag 사용. 더 완전하지만 잡음 큼.

규칙: \(q / N \to 0\)\(q \to \infty\).

7.7 비유: 메아리의 누적

극장의 메아리를 측정할 때, 얼마나 많은 메아리 (lag) 까지 누적할지 가 결정. 가까운 메아리만 (작은 \(q\)) 안정적이지만 일부만 측정. 멀리까지 (큰 \(q\)) 완전하지만 약한 메아리는 잡음과 구별 어려움.

LRCF 추정의 \(q\) 도 같은 균형 — 신호와 잡음의 트레이드오프.


8 정상성 검정 (8.6)

8.1 동기

함수 시계열의 모든 표준 분석 (FAR 추정, Hyndman-Ullah, LRCF 추정) 이 정상성 가정. 데이터가 정상인지 검증 이 필수 첫 단계.

8.2 검정 문제

\[ H_0: X_i(t) = \mu(t) + \eta_i(t), \]

\(\{\eta_i\}\) 가 strictly stationary, \(\mu\) 는 시간 무관 평균.

대립 가설:

  • \(H_{A, 1}\) (change point): 어떤 시점 \(k^*\) 에서 평균이 \(\mu(t) + \delta(t)\) 로 변경.
  • \(H_{A, 2}\) (random walk): \(X_i(t) = \mu(t) + \sum_{\ell=1}^i u_\ell(t)\) — 누적적 비정상.

8.3 검정 통계량 — Partial Sum 기반

부분합 과정:

\[ S_N(x, t) = N^{-1/2} \sum_{i=1}^{[Nx]} X_i(t), \quad 0 \leq x \leq 1. \]

CUSUM 형태:

\[ U_N(x) = S_N(x) - x S_N(1). \]

\(H_0\)\(U_N\) 이 평균 0 으로 수렴 (Brownian bridge 형태).

8.4 검정 통계량 (Monte Carlo 형태)

\[ \widehat{T}_N = \int_0^1 \|U_N(x)\|^2 \, dx. \]

\(H_0\) 하 점근 분포가 \(T = \sum_j \lambda_j \int B_j^2(x) \, dx\)Brownian bridge 의 제곱적분의 가중 합.

8.5 Pivotal 검정 통계량

\(\widehat{\lambda}_j\) 로 정규화하면 분포가 \(H_0\) 하 표준화:

\[ \widehat{T}_N^0(d) = \sum_{j=1}^d \widehat{\lambda}_j^{-1} \int_0^1 \langle U_N(x, \cdot), \widehat{\varphi}_j \rangle^2 \, dx. \]

극한 분포 \(T^0(d) = \sum_{j=1}^d \int_0^1 B_j^2(x) \, dx\)데이터에 무관, 표준 임계값 사용 가능 (Table 8.1).

8.6 직관: 정상성이 깨지면 statistic 이 발산

\(H_0\) 하: \(U_N\) 이 Brownian bridge 형태 → \(\widehat{T}_N\) 이 유한 분포로 수렴.

\(H_A\) 하: \(U_N\) 에 추가 항 (비정상 신호) → \(\widehat{T}_N \to \infty\). 임계값 초과 → 기각.

8.7 R 구현

library(ftsa)

# pm_10_GR_sqrt: 함수 시계열 객체 (Section 8.4)
result <- T_stationary(pm_10_GR_sqrt$y)
# 출력: P-value, 검정 결과

8.8 비유: 안정성의 시각적 진단

심전도 모니터링에서 환자의 심박이 정상이면 일정한 패턴, 비정상이면 추세나 점프 감지. 함수 시계열의 정상성 검정도 같은 사고 — 곡선들의 시계열 패턴이 일정한지 (정상) vs 추세·점프 (비정상).


9 FAR(1) 의 존재 조건 (8.8)

9.1 Theorem 8.8.1

FAR(1) 의 존재와 일치성

\(\|\Phi\| < 1\) 이면 식 (8.1) 의 unique strictly stationary solution 존재:

\[ X_n = \sum_{j=0}^\infty \Phi^j(\varepsilon_{n-j}). \]

이 급수는 a.s. 수렴 + \(L^2\) 수렴.

9.2 스칼라 AR(1) 과의 비교

모형 정상성 조건 해 형태
스칼라 AR(1) \(|\varphi| < 1\) \(X_n = \sum_{j=0}^\infty \varphi^j \varepsilon_{n-j}\)
FAR(1) \(\|\Phi\| < 1\) \(X_n = \sum_{j=0}^\infty \Phi^j(\varepsilon_{n-j})\)

핵심 일관성: 스칼라의 \(|\varphi|\) → 함수의 연산자 노름 \(\|\Phi\|\). 같은 직관, 다른 표현.

9.3 충분 조건: Hilbert-Schmidt 노름

응용에서 자주 쓰이는 더 강한 충분 조건 — 적분 핵 \(\Phi\) 에 대해:

\[ \iint \varphi^2(t, s) \, dt \, ds < 1. \]

이는 핵의 Hilbert-Schmidt 노름 \(\|\Phi\|_S < 1\), 보통 \(\|\Phi\| \leq \|\Phi\|_S\).

9.4 직관: 스칼라 직관의 직접 일반화

\(|\varphi| = 1\) 의 random walk → FAR(1) 의 \(\|\Phi\| = 1\) 도 random walk 같은 비정상. \(\|\Phi\|\) 가 함수 차원에서 “AR 강도” 의 척도.

조건 \(\|\Phi\| < 1\) 은 직관적으로 “과거 곡선의 영향이 시간에 따라 충분히 빠르게 감쇠” 를 의미 — 스칼라 AR 와 같은 본성.

9.5 비유: 메아리의 감쇠

콘서트장의 메아리가 시간에 따라 충분히 감쇠해야 (감쇠 계수 < 1) 음악이 안정적으로 들림. 감쇠가 부족하면 (= 1) 무한히 누적되어 카오스. FAR(1) 의 \(\|\Phi\| < 1\) 도 같은 직관 — 시계열의 “메아리” 가 충분히 감쇠.


10 R 패키지

FTS 분석의 표준 R 패키지
패키지 주요 기능
fda 함수 객체 생성, EFPC 추정 (pca.fd) — 8.7 의 FAR(1) 시뮬레이션
far FAR 시뮬레이션·추정의 별도 도구
ftsa Hyndman-Ullah 예측 (fdm, forecast.fdm), 다변량 예측 (farforecast), 정상성 검정 (T_stationary)
demography 사망률 데이터 + 함수 모형 (fdm)
vars VAR 모형 — farforecast 의 내부 도구

ftsa 가 가장 포괄적. 사망률·기상·금융 데이터의 FTS 분석에서 표준.


11 Chapter 8 의 통합 시각

11.1 한 줄 요약

함수 시계열 (FTS) 은 시간 순서로 관측된 곡선 수열의 분석 framework — iid 가정이 깨진 환경에서 FAR(1) X_n = Φ(X_{n-1}) + ε_n 를 핵심 모형으로 한다. 추정은 스칼라 AR 의 γ_1/γ_0 직관을 함수로 일반화한 Φ ≈ C C_1^{-1} 이지만 C^{-1} 의 부재로 pseudo-inverse C_p^+ 를 사용한다. Hyndman-Ullah 예측은 KL 절단 + 단변량 점수 시계열 예측의 자동화 도구이며, 다변량 예측은 점수 사이 cross-covariance 를 활용. 종속 데이터의 표준오차는 장기 공분산 함수 (LRCF) 로 보정. 정상성 검정은 partial sum + Brownian bridge 의 점근 분포 기반. FAR(1) 의 존재는 ‖Φ‖ < 1 (Theorem 8.8.1) — 스칼라 |φ| < 1 의 직접 일반화.

11.2 Ch.7 (Sparse FDA) 와의 비교

측면 Ch.7 (Sparse FDA) Ch.8 (FTS)
데이터 본성 iid + 단위당 sparse 시간 종속 + 단위당 dense
핵심 어려움 개별 곡선 평활 불가능 독립 가정 깨짐
핵심 도구 PACE (BLUP) FAR(1), LRCF
응용 종단 의학 데이터 사망률·금융·환경 곡선

두 챕터가 iid 가정의 두 다른 방향 위반 — Sparse 는 단위 차원, FTS 는 시간 차원. 도구는 다르지만 iid 의 한계를 극복하는 두 패턴.

11.3 후속 챕터와의 연결

다음 챕터 Ch.8 의 도구를 어떻게 활용하는가
Ch.9 공간 함수 공간 차원의 시계열 (지역별 + 시간)
Ch.10~11 힐베르트 공간 FAR(1) 존재 정리의 형식적 토대
Ch.12 추론 정상 FTS 의 점근 분포, LRCF 기반 신뢰 구간

Ch.8 의 LRCF 가 후속 챕터들의 종속 데이터 추론의 표준 도구.

11.4 실용 워크플로우

함수 시계열 분석의 표준 단계
  1. 데이터 준비 — 시간 순서 곡선 수열로 정리.
  2. 시각화 — 곡선 수열의 시간 추세 확인.
  3. 정상성 검정 (ftsa::T_stationary) — 비정상이면 차분 또는 normalize.
  4. FPCA 분해 — KL 점수 시계열 추출.
  5. 점수 시계열 분석 — ACF, AR 모형 적합.
  6. 예측 — Hyndman-Ullah (ftsa::fdm) 또는 다변량 (ftsa::farforecast).
  7. 추론 — LRCF 기반 신뢰 구간.

12 관련 주제

선행 지식

후속 주제

관련 개념

Subscribe

Enjoy this blog? Get notified of new posts by email: