FDA 9.3~9.4 — 함수 크리깅과 평균 함수 가중 추정

L² 손실 + 함수 공분산 C(s, s’) = E⟨X(s)-μ, X(s’)-μ⟩ 로 환원되는 형식적 등동성

Kokoszka & Reimherr (2017) Ch.9.3~9.4 의 핵심을 다룬다. 함수 크리깅 — 미관측 위치 X(s) 를 X̂(s) = μ + Σw_k(X(s_k)-μ) 로 예측, L² 손실 E‖X̂(s) - X(s)‖² 의 전개로 함수 공분산 C(s, s’) (식 9.8) 도출, kriging 시스템이 스칼라 (9.6) 과 형식적으로 동일, C(s, s’) = ∫C(‖s-s’‖; t) dt 로 시점별 스칼라 spatial covariance 의 적분으로 추정 (9.3). 이어서 평균 함수의 가중 추정 — μ̂(t) = Σw_k X(s_k; t), 단일 가중치 vs 함수 가중치, Lagrange multiplier 로 푼 시스템 (식 9.12), Canadian Weather 의 simple vs weighted average 비교 (Figure 9.1) 로 가까운 위치에 작은 가중치 부여의 효과 (9.4).

Statistics
Functional Data Analysis
저자

Kwangmin Kim

공개

2026년 05월 07일

1 두 절의 역할

이 포스트의 범위
주제 핵심 도구
9.3 함수 크리깅 \(L^2\) 손실, 함수 공분산 (식 9.8), kriging 시스템
9.4 평균 함수의 가중 추정 단일 가중치 LS + Lagrange (식 9.12)

9.3 은 함수 크리깅의 핵심 결과 — 미관측 위치 \(s\) 의 곡선 \(X(s)\) 를 관측 곡선들의 가중 합 \(\widehat{X}(s) = \mu + \sum w_k (X(s_k) - \mu)\) 로 예측. \(L^2\) 손실을 전개하면 함수 공분산 \(C(s, s')\) 를 사용한 시스템이 스칼라 kriging (식 9.6) 과 형식적으로 동일 — 우아한 일반화. 추정은 stationarity + isotropy 하 \(C(s, s') = \int C(\|s - s'\|; t) \, dt\)시점별 스칼라 variogram 추정 + 적분.

9.4 는 평균 함수 \(\mu(t)\) 의 가중 추정 — 9.1 의 kriging the mean (식 9.7) 의 자연스러운 함수 일반화. 단일 가중치 \(w_k\) (\(t\) 무관) 로 \(\widehat{\mu}(t) = \sum w_k X(s_k; t)\). Canadian Weather 데이터 (Figure 9.1) 가 시각적 증거 — 단순 평균은 측정소가 밀집한 남부 패턴이 지배, 가중 평균은 북부에 큰 가중치 (남부 일부는 약간 음수) → 캐나다 전체의 진짜 평균.

두 절을 합치면 함수 kriging 의 완전한 framework + 9.5 의 R 구현의 토대.


2 함수 크리깅의 정의 (9.3)

2.1 모형

함수 크리깅 (Functional Kriging)

위치 \(s_1, \ldots, s_N\) 에서 관측된 곡선 \(X(s_1), \ldots, X(s_N)\) 으로부터 미관측 위치 \(s\) 의 곡선 \(X(s)\) 를 예측:

\[ \widehat{X}(s) = \mu + \sum_{k=1}^N w_k (X(s_k) - \mu). \]

각 곡선 \(X(s_k)\)단일 가중치 \(w_k\)곡선을 분리 불가능 객체 로 처리.

2.2 직관: 곡선 단위 처리

가중치를 시점별로 (\(w_k(t)\)) 두지 않고 곡선 전체에 단일 가중치 (\(w_k\)).

이 선택의 의미:

각 위치의 곡선이 한 indivisible data object — 시점별 가중을 분리하지 않고 곡선의 전체적 유사성에 기반.

이는 가장 단순한 함수 kriging 형태 — 9.6 의 Delicado et al. (2010) 가 함수 가중치 \(w_k(t)\) 의 일반화.

2.3 비유: 그림의 차용

화가가 다른 화가들의 작품에서 영감을 얻을 때:

  • 단순 가중: 각 작품에서 비슷한 비율 차용 (전체 스타일 빌림).
  • 시점별 가중: 한 작품의 색채 + 다른 작품의 구도 + 또 다른 작품의 텍스처 차용 (부분별 분리).

함수 kriging 의 단일 가중치 = “그림 전체 스타일” 차용. 함수 가중치 = “부분별” 차용.


3 L² 손실의 전개

3.1 손실 함수

함수 노름의 평균 제곱:

\[ E\|\widehat{X}(s) - X(s)\|^2 = E \int (\widehat{X}(s; t) - X(s; t))^2 \, dt. \]

3.2 노름의 전개

\(\widehat{X}(s) - X(s) = \mu + \sum w_k (X(s_k) - \mu) - X(s) = \sum w_k (X(s_k) - \mu) - (X(s) - \mu)\).

내적으로:

\[ \|\widehat{X}(s) - X(s)\|^2 = \langle \sum_k w_k (X(s_k) - \mu) - (X(s) - \mu), \sum_\ell w_\ell (X(s_\ell) - \mu) - (X(s) - \mu) \rangle. \]

전개:

\[ = \sum_{k, \ell} w_k w_\ell \langle X(s_k) - \mu, X(s_\ell) - \mu \rangle - 2 \sum_k w_k \langle X(s_k) - \mu, X(s) - \mu \rangle + \langle X(s) - \mu, X(s) - \mu \rangle. \]

3.3 함수 공분산 (식 9.8)

기댓값을 취하면 새 객체:

함수 공간 공분산

\[ C(s, s') = E[\langle X(s) - \mu, X(s') - \mu \rangle]. \]

이는 두 위치의 곡선의 함수 내적의 기댓값 — 한 스칼라 양.

3.4 직관: 함수 공분산의 의미

\(\langle X(s) - \mu, X(s') - \mu \rangle = \int (X(s; t) - \mu(t))(X(s'; t) - \mu(t)) \, dt\)두 곡선의 시점별 곱의 적분. 그 기댓값이 두 위치의 곡선의 평균적 유사성.

스칼라 공분산의 함수 일반화 — 단일 시점이 아닌 모든 시점에 걸친 합산.

3.5 비유: 두 곡선의 닮음 정도

두 사람의 일별 기온 곡선:

  • 두 곡선이 시점별로 비슷 (같은 도시 두 측정소) → \(\langle X(s_1), X(s_2) \rangle\) 큼 → \(C(s_1, s_2)\) 큼.
  • 두 곡선이 시점별로 다름 (먼 두 도시) → \(\langle X(s_1), X(s_2) \rangle\) 작음 → \(C(s_1, s_2)\) 작음.

공분산이 공간 거리에 따라 감쇠 — 9.1 의 스칼라 공분산과 같은 패턴.

3.6 손실 함수의 압축 형태

\(E\|\widehat{X}(s) - X(s)\|^2\) 의 기댓값을 취하면:

\[ E\|\widehat{X}(s) - X(s)\|^2 = \sum_{k, \ell=1}^N w_k w_\ell C(s_k, s_\ell) - 2 \sum_{k=1}^N w_k C(s_k, s) + C(s, s). \]

3.7 직관: 스칼라와 동일한 형태

이 식은 식 (9.5) (스칼라 kriging 의 손실) 와 형식적으로 동일 — 단지 공분산의 정의가 함수 내적 기댓값.

이로써 모든 스칼라 kriging 결과가 함수로 자동 일반화 — 수학적 우아함.


4 Kriging 시스템

4.1 시스템 도출

손실의 \(w_k\) 미분을 0 으로:

\[ \frac{\partial}{\partial w_k} \left[\sum_{k', \ell} w_{k'} w_\ell C(s_{k'}, s_\ell) - 2 \sum_{k'} w_{k'} C(s_{k'}, s)\right] = 2 \sum_\ell w_\ell C(s_k, s_\ell) - 2 C(s_k, s) = 0. \]

따라서:

\[ \boxed{ \sum_{\ell=1}^N C(s_k, s_\ell) w_\ell = C(s_k, s), \quad k = 1, 2, \ldots, N. } \]

스칼라 식 (9.6) 와 완전히 동일한 형태 — 단지 공분산이 함수 버전.

4.2 행렬 형태

\(\mathbf{C} = [C(s_k, s_\ell)]\) (\(N \times N\)), \(\mathbf{c}_0 = (C(s_1, s), \ldots, C(s_N, s))^T\):

\[ \mathbf{C} \mathbf{w} = \mathbf{c}_0 \implies \mathbf{w} = \mathbf{C}^{-1} \mathbf{c}_0. \]

행렬 \(\mathbf{C}\) 가 비특이이면 유일한 해.

4.3 직관: 회귀 정규방정식과의 동치

다변량 회귀 \(\boldsymbol{\beta} = (X^T X)^{-1} X^T y\) 와 같은 구조 — 공분산 행렬이 정규방정식의 좌변, cross 공분산이 우변, 가중치가 회귀계수.

이는 kriging 이 다변량 회귀의 공간 일반화 임을 보여준다 — 회귀자가 다변량 → 곡선, 회귀계수가 가중치.


5 함수 공분산의 추정

5.1 Stationarity + Isotropy 하 단순화

가정 (9.2 의 표준): \(X(s)\) 가 stationary + isotropic.

\[ C(s, s') = E \int (X(s; t) - \mu(t))(X(s'; t) - \mu(t)) \, dt. \]

기댓값과 적분 교환 (square integrability):

\[ C(s, s') = \int E[(X(s; t) - \mu(t))(X(s'; t) - \mu(t))] \, dt = \int C(\|s - s'\|; t) \, dt, \]

여기서:

\[ C(h; t) = \text{Cov}(X(s + h; t), X(s; t)) \]

시점 \(t\) 의 스칼라 spatial covariance (그 시점의 측정값들의 공간 의존).

5.2 표준 추정 절차

함수 공분산의 추정 단계
  1. 각 시점 \(t\) 에서: 스칼라 데이터 \(\{X(s_k; t): k = 1, \ldots, N\}\) 의 spatial variogram 추정.
  2. 모수 모형 적합 (powered exponential, Matérn) 으로 \(\widehat{C}(h; t)\) 추정.
  3. 시점에 대해 적분: \(\widehat{C}(s, s') = \int \widehat{C}(\|s - s'\|; t) \, dt\).

5.3 직관: 시점별 분리의 우아함

함수 공분산을 직접 추정하는 것은 어려움 — 9.2 에서 본 양정치성 미묘함 (\(C(h; t, u)\)\(t = u\) 만 양정치) 때문.

시점별 분리 로:

  • \(t\) 에서 표준 스칼라 spatial covariance — 양정치 자동 보장.
  • 시점에 대한 적분 → 함수 공분산 — 양정치 자동 유지 (적분이 양정치 보존).

이는 9.2 의 양정치성 미묘함을 우회하는 표준 우회로.

5.4 비유: 사진별 분석 후 종합

100 장의 사진으로 한 사람의 1 일 활동 분석:

  • 직접: 100 장을 동시 분석 (어려움).
  • 시점별: 각 시점의 한 사진만 분석 (쉬움) → 모든 시점 결과 종합.

함수 kriging 의 추정 절차도 같은 사고 — 시점별 분리 가 어려운 무한차원 문제를 일변량의 모음으로 환원.

5.5 Trace Variogram (geofd 패키지)

geofd 의 표준 도구:

\[ \widehat{\gamma}_{\text{trace}}(d) = \frac{1}{|N(d)|} \sum_{(s_k, s_\ell) \in N(d)} \|X(s_k) - X(s_\ell)\|^2. \]

식 (9.3) (스칼라 semivariogram) 의 함수 버전 — 차의 함수 노름의 평균.

5.6 직관: Trace Variogram 의 의미

\(\|X(s_k) - X(s_\ell)\|^2 = \int (X(s_k; t) - X(s_\ell; t))^2 \, dt\)두 곡선의 차의 모든 시점에서의 차이 적분. 큰 값 = 두 곡선이 매우 다름.

거리 별 binning 후 평균 → 거리에 따른 곡선 차이 패턴. 모수 적합으로 함수 공분산 모형.


6 대안 Kriging 형태

6.1 Alternative Predictor

다른 형태의 예측량:

\[ X^*(s) = \sum_{k=1}^N \lambda_k X(s_k), \quad \sum_{k=1}^N \lambda_k = 1. \]

가중치의 합이 1 인 unbiased 선형 결합.

6.2 Kokoszka 식 (9.6) 와의 차이

식 (9.6) 의 가중치 \(w_j\) 는 일반적으로 \(\sum w_j \neq 1\)무편향 제약 없음.

대안 \(X^*(s)\)무편향 제약 추가 — Lagrange multiplier 필요 (9.4 의 mean kriging 과 같은 구조).

6.3 직관: 두 형태의 관계

응용에서 \(w_j\)\(\lambda_j\) 가 매우 비슷 → \(\widehat{X}(s) \approx X^*(s)\) (Problem 9.12).

차이는 이론적 정확성 vs 무편향성 강제:

  • \(\widehat{X}(s)\) — 손실 최소화의 정확한 해.
  • \(X^*(s)\) — 무편향성 + 손실 최소화 (제약 있는 최적화).

6.4 비유: 회귀 vs ridge

표준 회귀 vs ridge 회귀와 비슷:

  • 표준 — 가장 정확한 LS 해.
  • Ridge — 정칙화로 안정성 추가.

Kriging 의 두 형태도 비슷 — 무편향 제약 이 정칙화 역할 (특히 작은 표본).


7 평균 함수의 가중 추정 (9.4)

7.1 동기

함수 kriging 은 평균 함수 \(\mu(t)\) 가 알려진 것으로 가정. 실무에서는 \(\mu\) 도 추정 필요. 어떻게 추정할까?

7.2 단순 평균의 한계

가장 단순한 추정량:

\[ \widehat{\mu}_{\text{simple}}(t) = \frac{1}{N} \sum_{k=1}^N X(s_k; t). \]

문제: 공간 분포의 불균형 을 무시. 측정소가 한 영역에 밀집하면 그 영역의 곡선이 평균을 지배.

7.3 Canadian Weather 의 시각적 증거

Figure 9.1 의 메시지

35 개 캐나다 기상 관측소 중:

  • 남부 (밀집): 토론토, 오타와 등 도시 지역.
  • 북부 (희소): 한정된 관측소.

단순 평균 (점선): 남부 도시의 기온 패턴 지배 → 따뜻한 곡선. 가중 평균 (실선): 북부에 큰 가중치 → 캐나다 전체의 진짜 평균 (더 추운 곡선).

차이가 약 5°C — 공간 보정의 실질적 효과.

7.4 직관: 측정 밀도의 편향

같은 정보가 여러 번 측정되면 (가까운 측정소) 그 정보가 평균을 과대 대표. 공간 가중치 로 이 중복을 보정 → 진짜 모집단 평균 추정.

이는 Ch.7 의 PACE BLUP 과 같은 사고 — 모집단 정보의 적절한 가중.

7.5 비유: 회의의 의견 가중

같은 부서 5 명 + 다른 부서 1 명의 의견 평균:

  • 단순 평균: 같은 부서가 5/6 지배.
  • 가중 평균: 다른 부서 1 명에 1/2 가중치 → 부서 균형.

캐나다 평균 기온도 같은 사고 — 지역별 균형 잡힌 평균.


8 가중 추정의 모형 (식 9.10)

8.1 추정량

\[ \widehat{\mu}(t) = \sum_{k=1}^N w_k X(s_k; t). \]

각 곡선에 단일 가중치 (시점 무관) — 곡선 전체에 한 가중치.

8.2 함수 가중치의 가능성

이론적으로 \(w_k(t)\) (시점별 가중치) 도 가능 — 더 유연하지만:

  • 계산 복잡성 증가.
  • 추정 모수 폭발 (\(N\)\(N \times M\) where \(M\) 은 시점 수).

본 chapter 는 단순 가중치 (단일) 만 다룸. Delicado et al. (2010) 가 함수 가중치의 일반화.

8.3 직관: 단순함의 가치

\(w_k(t)\) (함수) vs \(w_k\) (스칼라):

  • 함수 가중치 — 시점별 다른 가중 가능. 더 정확한 추정 가능.
  • 스칼라 가중치 — 더 안정적. 더 간단.

캐나다 데이터 같은 응용에서 단순 가중치가 충분 — Ch.9 의 표준 선택.


9 최적 가중치 시스템

9.1 무편향 조건

\(E\widehat{\mu}(t) = \sum w_k E X(s_k; t) = \mu(t) \sum w_k\).

\(\sum w_k = 1\) 일 때 무편향.

9.2 MSE 최소화

\(E\|\widehat{\mu} - \mu\|^2\) 최소화 + \(\sum w_k = 1\) 제약.

손실 (식 9.11):

\[ E\left\|\sum_{k=1}^N w_k X(s_k) - \mu\right\|^2 = E \int \left\{\sum_{k=1}^N w_k X(s_k; t) - \mu(t)\right\}^2 dt. \]

9.3 Lagrange Multiplier

제약 있는 최적화 → Lagrangian:

\[ \mathcal{L}(\mathbf{w}, r) = E\|\widehat{\mu} - \mu\|^2 - 2r \left(\sum_{k=1}^N w_k - 1\right). \]

\(w_k\) 미분 = 0 + \(r\) 미분 = 0 → 시스템 (식 9.12, Problem 9.9):

\[ \boxed{ \sum_{k=1}^N w_k = 1, \quad \sum_{k=1}^N w_k C(s_k, s_n) - r = 0, \quad n = 1, 2, \ldots, N. } \]

\(N + 1\) 미지수 (\(w_1, \ldots, w_N, r\)).

9.4 직관: Lagrange Multiplier 의 의미

\(r\)shadow price — 무편향 제약을 1 단위 풀었을 때 손실의 감소량.

수학적으로: \(r\) 이 모든 \(C(s_k, s_n) w_k\) 의 합과 균형 → 모든 위치에서 cross-correlation 의 가중 합이 동일.

9.5 비유: 예산 제약 하의 최적화

회사의 광고 예산 분배:

  • 제약: 예산 합 = 100 만원.
  • 목표: 매출 최대화.
  • Lagrange multiplier \(r\) = “1 만원 추가 예산의 한계 매출 효과”.

Mean kriging 의 \(r\) 도 같은 사고 — 무편향 제약의 한계 비용.

9.6 시스템의 행렬 형태

\(\mathbf{C} = [C(s_k, s_n)]\), \(\mathbf{1} = (1, \ldots, 1)^T\):

\[ \begin{pmatrix} \mathbf{C} & -\mathbf{1} \\ \mathbf{1}^T & 0 \end{pmatrix} \begin{pmatrix} \mathbf{w} \\ r \end{pmatrix} = \begin{pmatrix} \mathbf{0} \\ 1 \end{pmatrix}. \]

\((N+1) \times (N+1)\) 시스템 — 표준 선형 대수 풀이.


10 Mean Kriging vs Functional Kriging 의 관계

10.1 두 시스템의 비교

측면 Functional Kriging (9.3) Mean Kriging (9.4)
목표 미관측 위치 곡선 \(X(s)\) 모집단 평균 \(\mu\)
가중치 \(\sum w_k\) 자유 \(\sum w_k = 1\) 강제
시스템 식 (9.6), \(N\) 미지수 식 (9.12), \(N + 1\) 미지수
우변 \(C(s_k, s)\) (cross 공분산) 모두 같은 형태

10.2 직관: 두 문제의 본성 차이

  • Functional kriging특정 위치 \(s\) 의 곡선 예측. 그 위치와 관측 위치 간의 cross 공분산이 핵심.
  • Mean kriging모집단 전체의 평균 추정. 무편향성이 핵심 (특정 위치 \(s\) 가 없음).

따라서 다른 시스템 — 같은 framework 이지만 다른 응용.

10.3 응용에서의 우선순위

Functional kriging 은 mean kriging 의 결과를 입력으로 사용:

1. 평균 함수 추정 (mean kriging, 식 9.12)
        ↓
2. 함수 공분산 추정 (시점별 spatial variogram + 적분)
        ↓
3. 미관측 위치 예측 (functional kriging, 식 9.6)

Mean kriging 이 functional kriging 의 전제조건 — 대부분의 응용에서 두 도구가 함께 사용.


11 R 구현 (geofd 패키지의 일부)

11.1 평균 함수 가중치

library(geofd)

# 함수 공분산 행렬 추정 (별도 절차)
# hat.C: N x N 행렬

# Mean kriging 가중치 (식 9.12 의 풀이)
inv.hat.C <- solve(hat.C)
v <- apply(inv.hat.C, 1, sum)
w.mean <- v / sum(v)

# 가중 평균 함수
weighted_mean_function <- function(t) {
  sum(w.mean * X_observed_at_t(t))
}

11.2 함수 Kriging 가중치

# Cross 공분산 (식 9.6 의 우변)
# hat.C.0: 미관측 위치 s 와 N 개 관측 위치의 공분산 벡터

# 무제약 가중치 (식 9.6)
w0.k <- solve(hat.C, hat.C.0)

# 무편향 보정 (sum to 1)
w.k <- w0.k + w.mean * (1 - sum(w0.k))

# 함수 kriging 예측
X_predicted <- X_mean_estimate +
               sum(w.k * (X_observed - X_mean_estimate))

11.3 직관: 두 가중치의 결합

\(\mathbf{w}_k = \mathbf{w}_0 + \mathbf{w}_{\text{mean}} (1 - \sum w_0)\):

  • \(\mathbf{w}_0\) — 무제약 functional kriging 가중치.
  • 보정 항 — \(\sum w_k = 1\) 을 만족시키는 조정.

이 형태가 두 시스템의 자연스러운 결합 — 9.5 의 Canadian Weather 응용에서 정확히 사용.


12 두 절의 통합 시각

12.1 한 줄 요약

함수 크리깅 (9.3) 은 미관측 위치 X(s) 를 X̂(s) = μ + Σw_k(X(s_k)-μ) 로 예측, L² 손실의 전개로 함수 공분산 C(s, s’) = E⟨X(s)-μ, X(s’)-μ⟩ 의 정의 (식 9.8) 와 스칼라 (식 9.6) 와 형식적으로 동일한 시스템 도출. 추정은 stationarity + isotropy 하 C(s, s’) = ∫C(‖s-s’‖; t) dt 로 시점별 스칼라 variogram 추정 + 적분. 평균 함수의 가중 추정 (9.4) 은 Σw_k = 1 무편향 제약 하 MSE 최소화 → Lagrange multiplier 시스템 (식 9.12). Canadian Weather (Figure 9.1) 가 시각적 증거 — 단순 평균은 측정소 밀집 지역 지배, 가중 평균은 공간 균형 회복.

12.2 Sections 9.0~9.1 와의 비교

측면 9-0 (overview) 9-1 (스칼라 + 함수장) 9-2 (이 포스트)
깊이 전체 흐름 정의 + 양정치성 Kriging 시스템 + 추정
수식 핵심만 식 (9.2) 식 (9.5)~(9.12)
응용 언급만 (없음) Canadian Weather 시각적 증거

9-2 가 Ch.9 의 핵심 도구 (kriging) 의 정확한 형태.

12.3 Ch.9 후속 절과의 연결

후속 절 9.3~9.4 의 도구를 어떻게 활용하는가
9.5 geofd 9.3 의 kriging 시스템 + 9.4 의 mean kriging 의 R 구현
9.6 확장 Delicado 의 함수 가중치 (단일 가중치의 일반화), Caballero 의 covariate-based 평균

9.3~9.4 가 Ch.9 의 핵심 알고리즘 — 9.5 의 R 구현은 이 시스템의 기계적 풀이.

12.4 실용 워크플로우

함수 Kriging 의 표준 단계
  1. Trace variogram 계산 (geofd::trace.variog) — 곡선 사이 거리 vs 공간 거리.
  2. 모수 variogram 적합 (variofit) — exponential, Matérn 등.
  3. 함수 공분산 행렬 \(\widehat{\mathbf{C}}\) 추정 — 적합된 variogram 으로.
  4. Mean kriging (식 9.12) — 가중 평균 함수.
  5. Functional kriging (식 9.6) — 미관측 위치 예측.
  6. 시각화 — 가중치 분포 + 예측 vs 진짜 곡선 비교.

13 관련 주제

선행 지식

후속 주제

관련 개념

Subscribe

Enjoy this blog? Get notified of new posts by email: