FDA 9.5~9.6 — geofd 패키지와 공간 함수 데이터의 확장 주제

Canadian Weather Calgary 예측 + Delicado 함수 가중치, 이온층 글로벌 냉각, separability 검정, 폭염 확률 (heat wave)

Kokoszka & Reimherr (2017) Ch.9.5~9.6 의 핵심을 다룬다. geofd 패키지의 R 구현 — Canadian Weather 35 개 관측소에서 Calgary 의 기온 곡선 예측, trace variogram 추정, exponential 모형 적합, kriging 가중치 (Edmonton ~ 0.7) 와 실제 비교 (9.5). 이어서 확장 주제 — Delicado et al. (2010) 의 함수 가중치 kriging, Caballero·Menafoglio 의 covariate-based 평균, Gromenko-Kokoszka 의 이온층 글로벌 냉각 (β_2 < 0 검증), midwest 미국 강수 변화점 검정 (1966 년), separability 검정 (Aston, Constantinou, flip-flop 방법), French et al. (2016) 의 공간-시간 폭염 (heat wave) 확률 — 까지 함수 공간 데이터의 첨단 응용을 정리한다 (9.6).

Statistics
Functional Data Analysis
저자

Kwangmin Kim

공개

2026년 05월 07일

1 두 절의 역할

이 포스트의 범위
주제 핵심 도구
9.5 geofd 패키지 R 구현 Canadian Weather, trace variogram, kriging 가중치
9.6 확장 주제 Delicado 함수 가중치, 이온층 냉각, change point, separability, heat wave

9.5 는 9.3~9.4 의 알고리즘의 R 실습geofd 패키지가 표준 도구. Canadian Weather 35 개 관측소에서 Calgary 의 기온 곡선을 예측 — Edmonton 가중치 ~ 0.7, 실제와 매우 유사한 예측.

9.6 은 공간 함수 데이터의 첨단 응용 + 확장. Ch.9 의 본문이 다루지 못한 깊은 응용:

  • 이온층 글로벌 냉각 — CO₂ 의 지표 온난화 + 이온층 냉각의 동시 효과 검증.
  • Midwest 미국 강수 변화점 — 1966 년 변화점 검출 + 변화 지역 시각화.
  • Separability 검정 — 시공간 공분산의 분리 가능성 검정.
  • Spatio-temporal extremes — 폭염 (heat wave) 확률 계산.

두 절을 합치면 표준 도구 (9.5) + 첨단 응용 (9.6) — Ch.9 의 모든 자료의 통합.


2 geofd 패키지 개요 (9.5)

2.1 패키지 구성

geofd 의 표준 도구
  • trace.variog() — Trace variogram 추정.
  • variofit() — 모수 variogram 모형 적합 (exponential, Matérn 등).
  • cov.spatial() — 적합된 모형으로 공분산 평가.
  • 의존: fda, fda.usc, maps.

geofd 가 9.3 (functional kriging) + 9.4 (mean kriging) 의 자동 구현.

2.2 Canadian Weather 응용

35 개 캐나다 기상 관측소의 일별 기온 곡선. Calgary 를 제외 후 나머지 34 개로 Calgary 의 곡선 예측 — kriging 알고리즘의 검증 사례.

2.3 실용 의의

이 응용이 함수 kriging 의 정확성을 명시적으로 검증 — 진짜 Calgary 곡선과 예측 곡선의 비교 가능 (한 위치를 hold-out).


3 코드 단계 1: 데이터 준비

3.1 패키지 로드

library(fda)
library(fda.usc)
library(geofd)
library(maps)

data("CanadianWeather")

3.2 데이터 추출

# CanadianWeather 객체의 구조
dailyAv <- CanadianWeather$dailyAv      # 365 x 35 x 3 array
                                         # (일, 관측소, 변수)
Temperature <- dailyAv[, , 1]            # 365 x 35
Precipitation <- dailyAv[, , 2]
log10Precip <- dailyAv[, , 3]

place <- CanadianWeather$place           # 관측소 이름

# 좌표 (위도, 경도) 처리
coordinates <- CanadianWeather$coordinates
coordinates <- coordinates[, 2:1]        # (경도, 위도) 순서로
coordinates[, 1] <- -coordinates[, 1]    # 서경 음수화

3.3 직관: 좌표 처리의 미묘함

R 의 maps 패키지는 (경도, 위도) 순서, 캐나다 데이터는 (위도, 서경) 으로 저장. 좌표축 swap + 부호 변경 이 흔한 데이터 처리 단계.

이런 미묘한 변환이 잘못되면 지도 위 위치가 완전히 다른 곳으로 — 실무에서 자주 발생하는 버그.

3.4 Calgary 제외 + 거리 행렬

# 모든 위치 사이 유클리드 거리
geo.dist.35 <- dist(coordinates)

# Calgary 의 인덱스
i.0 <- which(place == "Calgary")
coord.0 <- coordinates[i.0, ]

# 지도 시각화 (Figure 9.2)
map('world', ylim = c(42, 78), xlim = c(-170, -40))
map('world', region = "Canada", add = TRUE)
points(coordinates, col = 'black', pch = 19)
points(coord.0[1], coord.0[2], pch = 15, col = "red")  # Calgary 빨간 사각형

4 코드 단계 2: 함수 객체 변환

4.1 Fourier 기저 평활

Day <- 1:365
n <- ncol(Temperature)
nt <- nrow(Temperature)

# Calgary 제외 데이터
Tempe.34 <- Temperature[, -i.0]
coord.34 <- coordinates[-i.0, ]

# Fourier 기저 (연주기 데이터에 적합)
K <- min(99, max(49, 1 + 4 * round(sqrt(nt))))
fourier.basis <- create.fourier.basis(rangeval = range(Day), nbasis = K)

# 함수 객체 변환
temp.fd.Fb.34 <- Data2fd(argvals = Day, y = Tempe.34, basisobj = fourier.basis)
temp.fd.Fb.0 <- Data2fd(argvals = Day, y = Temperature[, i.0], basisobj = fourier.basis)

# 시각화
plot(temp.fd.Fb.34, col = "grey",
     xlab = "Day", ylab = "Temperature (degrees C)",
     main = "Average daily temperatures")
lines(temp.fd.Fb.0, lwd = 2)   # Calgary 진한 색

4.2 직관: Fourier 기저의 자연스러움

기온 곡선 = 연주기 데이터 (1 월 1 일 ≈ 12 월 31 일).

  • B-spline: 양 끝의 연속성 강제 안 됨.
  • Fourier: 자동으로 주기성 강제 — 자연스러운 선택.

기저 함수 수 \(K\) = \(4\sqrt{nt}\) 근처 (경험 규칙) — 매끄러움과 적합도의 균형.


5 코드 단계 3: Trace Variogram 적합

5.1 Empirical Trace Variogram

# 함수 L2 거리 제곱 (모든 위치 쌍)
L2norm.Fb.34 <- dist(t(temp.fd.Fb.34$coefs))^2

# Binned trace variogram
emp.trace.vari.34 <- trace.variog(coords = coord.34,
                                   L2norm = as.matrix(L2norm.Fb.34),
                                   bin = TRUE)

5.2 Binning 의 의미

각 위치 쌍 \((s_k, s_\ell)\) 마다 한 점 → variogram cloud (잡음 큼). Bin 으로 비슷한 거리의 쌍 그룹화 + 평균 → 안정적 추정.

5.3 Exponential 모형 적합

# 초기 모수 추정 (75% quantile 기반)
sigma2.0 <- quantile(emp.trace.vari.34$v, 0.75)
phi.0 <- quantile(emp.trace.vari.34$Eu.d, 0.75)

# Exponential variogram 적합
fit.vari.34 <- variofit(emp.trace.vari.34,
                        ini.cov.pars = c(sigma2.0, phi.0),
                        cov.model = "exponential")

# Figure 9.3 시각화
plot(as.dist(emp.trace.vari.34$Eu.d), L2norm.Fb.34, col = "grey",
     xlab = "Geographical distances", ylab = "L2 distances",
     main = "Empirical variogram")
points(emp.trace.vari.34$u, emp.trace.vari.34$v, col = "black", pch = 19)
lines(fit.vari.34, col = "black", lwd = 2)
legend("topleft", c("Variogram cloud", "Binned variogram", "Fitted variogram"),
       col = c(8, 1, 1), lwd = c(-1, -1, 2), pch = c(1, 19, -1))

5.4 직관: Variogram 의 시각적 해석

가까운 거리 (\(d\) 작음): L² 거리 작음 (가까운 두 도시의 기온 패턴 비슷). 먼 거리 (\(d\) 큼): L² 거리 큼 (먼 두 도시의 기온 패턴 다름).

Exponential 모형이 이 증가 패턴을 매끄러운 곡선으로 적합 → 모든 거리에 대한 공분산 추정 가능.


6 코드 단계 4: Kriging 가중치 계산

6.1 공분산 행렬 추정

# 34 개 관측소 사이 공분산
hat.C.34 <- cov.spatial(emp.trace.vari.34$Eu.d,
                         cov.model = fit.vari.34$cov.model,
                         cov.pars = fit.vari.34$cov.pars)

# 34 개 관측소 vs Calgary 공분산
geo.dist.0.34 <- as.matrix(geo.dist.35)[-i.0, i.0]
hat.C.0 <- cov.spatial(geo.dist.0.34,
                        cov.model = fit.vari.34$cov.model,
                        cov.pars = fit.vari.34$cov.pars)

6.2 평균 함수의 가중치 (식 9.12)

# Mean kriging 가중치 — 식 (9.12) 풀이
inv.hat.C.34 <- solve(hat.C.34)
v.34 <- apply(inv.hat.C.34, 1, sum)
w.m.34 <- v.34 / sum(v.34)

6.3 Functional Kriging 가중치

# 무제약 가중치 (식 9.6)
w0.k <- solve(hat.C.34, hat.C.0)

# 무편향 보정 (sum to 1)
w.k <- w0.k + w.m.34 * (1 - sum(w0.k))

6.4 가중치 시각화 (Figure 9.4)

plot(geo.dist.0.34, w.k,
     xlab = "Distance to Calgary", ylab = "Kriging weights",
     main = "Kriging weights")
abline(h = 1/34, col = "gray", lwd = 2)   # 단순 평균 1/34
abline(h = 0, col = "black")

6.5 결과 해석

Calgary 예측의 가중치 패턴
  • Edmonton (Calgary 와 가장 가까움, ~250 km): 가중치 ~ 0.7 — 압도적.
  • 먼 관측소 (~3000 km): 가중치 ~ 0.
  • 일부 가까운 관측소: 약간 음수 가중치 (정보 중복 보정).
  • 단순 평균 (\(1/34 \approx 0.029\)) 와 비교: kriging 이 훨씬 polarized 분포.

Edmonton 의 가중치가 0.7 인 의미: Calgary 예측의 70% 가 Edmonton 곡선 — 지리적·기후적 유사성의 직접 반영.

6.6 직관: 가중치의 자연스러움

Calgary 와 Edmonton 은 같은 Alberta 주 (인접 도시, ~250 km) — 기후 패턴 매우 유사. Kriging 알고리즘이 이를 자동 발견 → Edmonton 곡선이 가장 좋은 예측.

이는 알고리즘의 검증 — 도메인 직관과 일치.

6.7 비유: 친구 추천 시스템

영화 추천에서 가장 비슷한 사용자의 영화 평가가 가장 큰 가중치. 함수 kriging 도 같은 사고 — 공간적으로 가장 가까운 (비슷한) 곡선이 가장 큰 가중치.


7 코드 단계 5: 예측 곡선 생성

7.1 가중 평균 함수

# 단순 평균 (비가중)
mean.temp.Fb.34 <- mean(temp.fd.Fb.34)

# 가중 평균 (mean kriging)
w.mean.temp.Fb.34 <- mean.temp.Fb.34
w.mean.temp.Fb.34$coefs <- apply(temp.fd.Fb.34$coefs, 1,
                                   weighted.mean, w = w.m.34)

# 평균 차감
temp.fd.Fb.34.ctrd <- temp.fd.Fb.34
temp.fd.Fb.34.ctrd$coefs <- temp.fd.Fb.34.ctrd$coefs -
                              matrix(w.mean.temp.Fb.34$coefs,
                                     ncol = 34, nrow = 77, byrow = FALSE)

7.2 Calgary 예측

# Functional kriging 예측: μ̂ + Σ w_k (X(s_k) - μ̂)
kriging.i.0 <- w.mean.temp.Fb.34
kriging.i.0$coefs <- kriging.i.0$coefs +
                     apply(temp.fd.Fb.34.ctrd$coefs, 1,
                           weighted.mean, w = w.k)

# Figure 9.5: 진짜 vs 예측 비교
plot(temp.fd.Fb.34, col = 8, xlab = "Day")    # 회색: 34 개 관측 곡선
lines(temp.fd.Fb.0, lwd = 2)                   # 진한 검정: 진짜 Calgary
lines(kriging.i.0, lty = 2, lwd = 2)           # 점선: kriged 예측
legend("bottomright",
       c("True temperature function", "Kriged function"),
       lwd = c(2, 2), lty = c(1, 2))

7.3 결과 (Figure 9.5)

Calgary 예측의 정확성
  • 진짜 Calgary 곡선: 1월 ~ -10°C, 7월 ~ 16°C.
  • Kriged 예측: 거의 동일한 패턴.
  • 차이: 매우 작음 (몇 °C 이내).

알고리즘이 진짜 곡선을 잘 재현 — 알고리즘의 검증. 실무에서 미관측 위치의 곡선을 신뢰성 있게 예측 가능.

7.4 직관: Cross-Validation 의 사고

이 응용이 한 형태의 leave-one-out cross-validation:

  1. 한 위치 (Calgary) 제외.
  2. 나머지로 그 위치 예측.
  3. 진짜와 예측 비교.

모든 위치에 대해 반복하면 알고리즘의 전반적 정확성 평가 가능.


8 확장 주제 1: 함수 가중치 Kriging (9.6)

8.1 Delicado et al. (2010)

Functional Weight Kriging

Ch.9 의 단일 가중치 (\(w_k\)) 대신 함수 가중치 \(w_k(t)\):

\[ \widehat{X}(s; t) = \sum_{k=1}^N w_k(t) X(s_k; t), \quad \sum_k w_k(t) = 1 \forall t. \]

기저 전개 \(w_k(t) = \sum_m b_{km} B_m(t)\) → 행렬 \(\mathbf{B} = [b_{km}]\) 추정.

EFPC \(\widehat{v}_m\) 도 기저로 사용 가능.

8.2 단일 vs 함수 가중치

측면 단일 가중치 (Ch.9.3) 함수 가중치 (Delicado)
가중치 곡선 전체에 한 값 시점별 다른 값
자유도 \(N\) \(N \times M\) (M = 기저 수)
계산 단순 (행렬 풀이) 더 복잡 (Co-kriging 유사)
정확성 충분히 좋음 더 정확 (Delicado 의 예시)

8.3 직관: 시점별 다른 가중치의 가치

기온 곡선의 경우:

  • 여름철 — Calgary 의 패턴이 다른 도시들과 비슷.
  • 겨울철 — Calgary 의 패턴이 다른 도시들과 다름 (대륙성 기후의 강한 영향).

시점별 다른 가중치 가 이 시간 변동을 포착 — 단일 가중치보다 정확.

비용: 더 많은 모수 + 계산 복잡. 데이터가 충분히 풍부할 때만 가치.

8.4 비유: 옷 차용

다른 사람의 옷 차림에서 코디네이션 영감을 얻을 때:

  • 단일 가중치: “전체 스타일” 비율로 차용 (전체적 느낌).
  • 함수 가중치: “여름은 A 의 색, 겨울은 B 의 디자인” 부분별 차용.

함수 가중치 = 시간대별로 다른 가중 = 더 풍부한 정보 활용.


9 확장 주제 2: Covariate-Based Mean

9.1 Caballero et al. (2013), Menafoglio et al. (2013)

본문 Ch.9 의 가정: \(E X(s; t) = \mu(t)\)위치 무관 평균.

확장:

\[ E X(s; t) = \sum_{\ell=1}^L \beta_\ell(t) f_\ell(s), \]

  • \(f_\ell(s)\)공간 covariate (위도, 고도, 해안성 등).
  • \(\beta_\ell(t)\)시간 의존 계수.

9.2 직관: 공간 covariate 의 가치

캐나다 기온이 위치 무관이 아님 — 위도가 가장 큰 영향. 위도 covariate 를 모형에 포함하면:

\[ \mu(s; t) = \beta_0(t) + \beta_1(t) \cdot \text{latitude}(s). \]

훨씬 더 정확한 평균 추정. Kriging 의 잔차도 더 작아져 예측 정확성 향상.

9.3 비유: 회귀의 공변량 보정

표준 회귀의 covariate adjustment 와 같은 사고:

  • 단순: \(y = \mu + \varepsilon\).
  • Covariate: \(y = \alpha + \beta x + \varepsilon\).

공간 함수 데이터의 covariate adjustment — Ch.9 의 단순 모형의 자연스러운 확장.


10 확장 주제 3: 이온층 글로벌 냉각

10.1 천체 물리학 배경

Roble & Dickinson (1989) 의 가설

CO₂, CH₄ 등 온실가스 증가 → 두 가지 동시 효과:

  1. 지표 (troposphere) 의 온난화 — 잘 알려진 글로벌 워밍.
  2. 이온층 (300km 상공) 의 냉각 — 덜 알려졌지만 같은 메커니즘 (반대 방향).

이온층 냉각 → 열적 수축 → 이온층 높이 감소.

검증을 위해 ionosonde (radar 형 측정 도구) 의 측정값 분석.

10.2 데이터의 도전

Ionosonde 데이터의 어려움
  • 81 개 ionosonde 관측소 (전 세계).
  • 임의 시점에 ≤ 40 개만 작동 (Figure 9.7).
  • 큰 결측 + 공간 분포 불균형.
  • 추가 영향: 태양 주기 (SRF) + 계절 + 자기장 (Figure 9.6).

표준 spatial functional kriging 으로는 부족 — 더 정교한 spatio-temporal 모형 필요.

10.3 모형 (식 9.13)

\[ Y(s; \tau) = \mu(s; \tau) + \varepsilon(s; \tau) + \theta(s; \tau), \]

평균 함수 (covariate-based):

\[ \mu(s; \tau) = \beta_1 + \beta_2 \tau + \beta_3 \text{SRF}(\tau) + \beta_4 M(s; \tau). \]

의미
\(\beta_1\) 절편
\(\beta_2 \tau\) 시간 추세 (검정 대상)
\(\beta_3 \text{SRF}(\tau)\) 태양 복사 효과 (혼동 변수 보정)
\(\beta_4 M(s; \tau)\) 자기장 영향 보정

검정: \(H_0: \beta_2 = 0\) (추세 없음).

10.4 결과

\(\beta_2\) 가 유의하게 음수이온층 글로벌 냉각 가설 확증 (Gromenko & Kokoszka 2013, Gromenko et al. 2016).

10.5 직관: 응용의 의의

이 응용의 의미:

공간 함수 데이터 분석의 가장 인상적 실세계 적용 중 하나 — 천체 물리학의 깊은 가설을 통계적 framework 로 검증.

Ch.9 의 도구가 단순 응용 (날씨) 을 넘어 첨단 과학적 발견 에 기여.

10.6 비유: 의학의 약효 검증

신약의 효과 검증 — 무작위 임상 시험 + 공변량 보정 + 통계 검정. 결과 (예: 사망률 감소) 가 의학의 발전.

이온층 냉각 검증도 같은 사고 — 데이터 + 모형 + 검정으로 물리학 가설의 검증.


11 확장 주제 4: 변화점 검정

11.1 Gromenko et al. (2016)

공간 함수 시계열의 변화점

데이터: \(X_n(s, t) = \mu_n(s; t) + \varepsilon_n(s; t)\).

  • \(n\) = 연도, \(s\) = 위치, \(t\) = 시점 (연 내).

검정 가설:

\[ H_0: \mu_1 = \mu_2 = \cdots = \mu_N \quad \text{vs} \quad H_A: \mu_1 = \cdots = \mu_{n^*} \neq \mu_{n^*+1} = \cdots = \mu_N. \]

11.2 검정 통계량

세 가지 (식 9.13~9.15):

\[ \widehat{\Lambda}_1 = \frac{1}{N^2} \sum_k \widehat{w}_k \sum_i \widehat{\lambda}_i^{-1} \sum_r \langle \cdots, \widehat{v}_i \rangle. \]

(정확한 형식은 본문 식 9.13.)

  • \(\widehat{\Lambda}_1\) — temporal FPCA + 고유값 정규화.
  • \(\widehat{\Lambda}_2\) — 정규화 없이.
  • \(\widehat{\Lambda}_2^\infty\)\(p \to \infty\) 의 한계.

11.3 Brownian Bridge 의 점근

각 통계량의 점근 분포가 Brownian bridge 의 가중 적분:

\[ \widehat{\Lambda}_2 \xrightarrow{d} \sum_k w(k) \sum_i \lambda_i \int B_{ik}^2(t) \, dt. \]

\(B_{ik}\) 의 공분산 (식):

\[ \text{Cov}(B_{ik}(t), B_{i'k'}(t')) = \mathbb{1}_{i = i'} \min(t, t')(1 - \min(t, t')) \sigma(s_k, s_{k'}). \]

11.4 직관: 시간 + 공간의 결합

스칼라 시계열 변화점 (Ch.8.6) 이 단일 Brownian bridge \(\int B^2\). 공간 함수 변화점 — 공간 위치별 Brownian bridge + 공간 공분산 \(\sigma(s_k, s_{k'})\).

함수 + 시간 + 공간의 3 차원 결합 — Ch.8.6 의 자연스러운 일반화.

11.5 Midwest 미국 강수 응용

1966 년 변화점 검출 (Figure 9.8). Michigan Lake 부근에서 가장 큰 변화 (강수 증가).

시각화:

\[ \widehat{\phi}(s) = \|\widehat{\mu}_1(s) - \widehat{\mu}_2(s)\|, \]

각 위치에서 변화 전후 평균 함수의 차이 — heat map 으로 표시.

11.6 직관: 시각화의 가치

검정 결과 (P-value < 0.05) 만으로는 변화의 위치적 분포 알 수 없음. Heat map 이 변화의 공간 패턴 시각화 → 도메인 통찰 (Michigan Lake 근처 특이) 도출.

11.7 비유: 의료 영상의 변화 감지

뇌 MRI 의 두 시점 비교에서 변화점 검출:

  • 통계 검정: “변화 있음/없음”.
  • Heat map: “어느 영역의 변화” — 의사의 진단에 핵심.

같은 사고가 공간 함수 변화점에 적용 — 변화의 위치적 시각화.


12 확장 주제 5: Separability 검정

12.1 가정

Spatio-Temporal Separability

공분산 함수가 공간 부분과 시간 부분의 곱 으로 분리:

\[ \sigma(s, s'; t, t') = u(s, s') v(t, t'). \tag{9.14} \]

  • \(u(s, s')\) — 순수 공간 공분산.
  • \(v(t, t')\) — 순수 시간 공분산.

이 가정이 성립하면 계산 + 이론 모두 단순화. 변화점 검정 (위) 의 토대.

12.2 검정 도구

Liu et al. (2014), Aston et al. (2016), Constantinou et al. (2015) 의 세 접근.

12.3 Aston et al.: Partial Trace Operator

추정:

\[ \widehat{u}_{kk'} = \int \widehat{\sigma}(s_k, s_{k'}; t, t) \, dt, \]

\[ \widehat{v}(t, t') = \frac{\sum_k \widehat{\sigma}(s_k, s_k; t, t')}{\sum_k \int \widehat{\sigma}(s_k, s_k; t, t) \, dt}. \]

부분 trace 로 시공간 분리.

12.4 Constantinou et al.: Flip-Flop 방법

기저 전개 후 반복 추정:

\[ \widehat{V} = \frac{1}{N} \sum_n \Xi_n \widehat{U}^{-1} \Xi_n^T, \quad \widehat{U} = \frac{1}{N} \sum_n \Xi_n^T \widehat{V}^{-1} \Xi_n. \]

초기값 \(\widehat{U}_0 = I\)\(\widehat{V}\) 추정 → \(\widehat{U}\) 갱신 → … (수렴까지 반복).

12.5 직관: Flip-Flop 의 의미

다변량 정규분포의 separable covariance 추정의 표준 방법. U 와 V 가 동시에 미지 인 경우 한쪽 고정 → 다른 쪽 추정 → 반복.

EM 알고리즘과 비슷한 사고 — 어려운 동시 추정을 쉬운 반복으로 환원.

12.6 검정 통계량

세 형태 — Wald, likelihood ratio, Frobenius norm:

\[ T_W, T_L, T_F. \]

각각 다른 점근 분포 + 다른 안정성 trade-off.

12.7 직관: 어떤 가정이 깨졌는지 진단

Separability 검정의 의의:

공간 + 시간 의존성이 단순 곱으로 분해되는가 — Ch.9 의 표준 가정의 검증.

Separability 가 거부되면 → 더 복잡한 모형 (non-separable) 필요. 이는 모형 선택의 표준 단계.

12.8 비유: 두 변수의 독립 검정

다변량 통계의 두 변수 독립 검정과 비슷:

  • 독립 → 단순 모형.
  • 종속 → 결합 분포 모형.

Separability = 시공간 차원의 “구조적 독립” — 같은 사고.


13 확장 주제 6: Spatio-Temporal Extremes (Heat Waves)

13.1 French et al. (2016) — 폭염 확률

Heat Wave 의 정의

기온 곡선의 함수 시계열 \(X_n(s_k; t)\)\(n\) 연도, \(s_k\) 위치, \(t\) 일자 (\(t \in \{1, \ldots, 365\}\)).

표준화:

\[ Z_n(s_k; t_i) = \frac{X_n(s_k; t_i) - \bar{X}(s_k; t_i)}{\text{SD}(s_k; t_i)}. \]

위치별·시점별 다른 척도 보정 — 해안과 내륙의 변동성 차이 등.

Heat wave: \(Z_n > 2\) (2 표준편차 위) for 여러 인접 위치 + 수일 동안.

13.2 Heat Wave 통계량

연속 \(\ell\) 일의 평균 + \(K\) 인접 위치의 최소:

\[ Z_n^*(s_k; t_j) = \frac{1}{\ell} \sum_{t_j - \ell < t_i \leq t_j} Z_n(s_k; t_i), \]

\[ Z_n^*(t_j) = \min_{1 \leq k \leq K} Z_n^*(s_k; t_j). \]

\(Z_n^*(t_j) > z\)\(\ell\) 일 동안 \(K\) 인접 위치 모두 \(z\) 표준편차 초과 → heat wave.

13.3 연간 Heat Wave 확률

\[ p(z) = P(\max_{1 \leq j \leq J} Z_n^*(t_j) > z), \quad J = 365. \]

\(M_J = \max Z_n^*(t_j)\) 의 분포가 Generalized Extreme Value (GEV) — Extreme Value Theory 의 표준.

13.4 Figure 9.10 의 결과

$\ell = 3$ (3 일):
- Labrador Peninsula 의 짧은 heat spells 확률 ~ 50% (2 년에 한 번)
- Hudson Bay 부근 빈도 증가
- Rocky Mountains 에서 낮음

$\ell = 10$ (10 일):
- Iowa, Illinois, Texas 의 일부에서 증가
- 캘리포니아 남부 해안 외해

$\ell = 30$ (30 일):
- 일반적으로 < 1% (100 년에 한 번)
- Arizona, 남부 Texas 에서 2~3% (예외)

13.5 직관: Climate Change 의 함수 통계

이 응용의 의의:

함수 데이터 분석 + Extreme Value Theory + Spatio-temporal modeling 의 결합으로 기후 변화의 정량적 영향 평가.

각 도구가 단독으로는 제한적 — 결합 이 새 통찰 (지역별 폭염 확률).

13.6 비유: 보험의 위험 평가

손해보험 회사의 자연재해 위험 평가:

  • 각 지역의 재해 확률 추정.
  • 보험료 책정의 토대.

폭염 확률 분석도 같은 사고 — 공공 정책 + 보건 시스템 의 토대.


14 두 절의 통합 시각

14.1 한 줄 요약

9.5 는 geofd 패키지의 R 실습 — Canadian Weather Calgary 예측에서 trace variogram 추정·exponential 모형 적합·kriging 가중치 (Edmonton ~ 0.7) 계산 → 진짜 곡선과 거의 일치 (Figure 9.5). 9.6 은 공간 함수 데이터의 첨단 응용 — Delicado 의 함수 가중치, Caballero 의 covariate-based 평균, Gromenko-Kokoszka 의 이온층 글로벌 냉각 (β_2 < 0 검증), midwest 강수 1966 변화점, separability 검정 (Aston, Constantinou flip-flop), French et al. 의 spatio-temporal heat wave 확률. Ch.9 의 framework 가 단순 kriging 을 넘어 첨단 과학적 발견 (천체 물리, 기후 변화) 에 기여.

14.2 Ch.9 전반부 (9.1~9.4) 와의 비교

측면 9.1~9.4 9.5~9.6
목표 이론 + 알고리즘 실무 도구 + 첨단 응용
깊이 정의 + 시스템 R 코드 + 도메인 응용
응용 (없음) Calgary, 이온층, midwest, heat wave
R (간접) geofd, 별도 도구들

9.5~9.6 가 Ch.9 의 실무 + 미래 방향 — 본문 (이론 + 알고리즘) 의 자연스러운 마무리.

14.3 Ch.9 의 통합 흐름

9.1: 스칼라 공간 통계 + 9.2: 함수 공간장 (정의)
        ↓
9.3: 함수 kriging + 9.4: 평균 추정 (이론)
        ↓
9.5: geofd R 실습 (도구) ← 이 포스트
        ↓
9.6: 첨단 응용 (이온층, 변화점, separability, heat wave) ← 이 포스트
        ↓
9.7: 연습문제

9.5 가 이론과 응용의 다리, 9.6 이 미래 연구 방향.

14.4 후속 챕터와의 연결

다음 챕터 Ch.9 의 도구를 어떻게 활용하는가
Ch.10 (Hilbert 공간 이론) 함수 공간장의 수학적 토대
Ch.11 (확률 함수, 가우스 과정) Spatial covariance 의 형식적 정의
Ch.12 (추론) 함수 공간 데이터의 점근 분포

Ch.9 가 응용 중심 — 이론적 깊이는 후속 + Cressie (1993), Cressie-Wikle (2011) 등 spatial statistics 표준 참고서.

14.5 실용 워크플로우

Spatial FDA 의 표준 분석 단계
  1. 데이터 준비 — 위치 좌표 + 곡선 데이터.
  2. 시각화 — 지도 + 곡선 (Figure 9.2 형태).
  3. 함수 객체 변환 — Fourier (주기 데이터) 또는 B-spline.
  4. Trace variogram 추정 + 모수 모형 적합 (geofd).
  5. Mean kriging (식 9.12) — 가중 평균 함수.
  6. Functional kriging (식 9.6) — 미관측 위치 예측.
  7. Cross-validation — leave-one-out 으로 정확성 평가.
  8. 확장 도구 — covariate, separability, change point 등 (필요 시).

15 관련 주제

선행 지식

후속 주제

관련 개념

Subscribe

Enjoy this blog? Get notified of new posts by email: