1 두 절의 역할
| 절 | 주제 | 핵심 도구 |
|---|---|---|
| 9.3 | 함수 크리깅 | \(L^2\) 손실, 함수 공분산 (식 9.8), kriging 시스템 |
| 9.4 | 평균 함수의 가중 추정 | 단일 가중치 LS + Lagrange (식 9.12) |
9.3 은 함수 크리깅의 핵심 결과 — 미관측 위치 \(s\) 의 곡선 \(X(s)\) 를 관측 곡선들의 가중 합 \(\widehat{X}(s) = \mu + \sum w_k (X(s_k) - \mu)\) 로 예측. \(L^2\) 손실을 전개하면 함수 공분산 \(C(s, s')\) 를 사용한 시스템이 스칼라 kriging (식 9.6) 과 형식적으로 동일 — 우아한 일반화. 추정은 stationarity + isotropy 하 \(C(s, s') = \int C(\|s - s'\|; t) \, dt\) — 시점별 스칼라 variogram 추정 + 적분.
9.4 는 평균 함수 \(\mu(t)\) 의 가중 추정 — 9.1 의 kriging the mean (식 9.7) 의 자연스러운 함수 일반화. 단일 가중치 \(w_k\) (\(t\) 무관) 로 \(\widehat{\mu}(t) = \sum w_k X(s_k; t)\). Canadian Weather 데이터 (Figure 9.1) 가 시각적 증거 — 단순 평균은 측정소가 밀집한 남부 패턴이 지배, 가중 평균은 북부에 큰 가중치 (남부 일부는 약간 음수) → 캐나다 전체의 진짜 평균.
두 절을 합치면 함수 kriging 의 완전한 framework + 9.5 의 R 구현의 토대.
2 함수 크리깅의 정의 (9.3)
2.1 모형
위치 \(s_1, \ldots, s_N\) 에서 관측된 곡선 \(X(s_1), \ldots, X(s_N)\) 으로부터 미관측 위치 \(s\) 의 곡선 \(X(s)\) 를 예측:
\[ \widehat{X}(s) = \mu + \sum_{k=1}^N w_k (X(s_k) - \mu). \]
각 곡선 \(X(s_k)\) 에 단일 가중치 \(w_k\) — 곡선을 분리 불가능 객체 로 처리.
2.2 직관: 곡선 단위 처리
가중치를 시점별로 (\(w_k(t)\)) 두지 않고 곡선 전체에 단일 가중치 (\(w_k\)).
이 선택의 의미:
각 위치의 곡선이 한 indivisible data object — 시점별 가중을 분리하지 않고 곡선의 전체적 유사성에 기반.
이는 가장 단순한 함수 kriging 형태 — 9.6 의 Delicado et al. (2010) 가 함수 가중치 \(w_k(t)\) 의 일반화.
2.3 비유: 그림의 차용
화가가 다른 화가들의 작품에서 영감을 얻을 때:
- 단순 가중: 각 작품에서 비슷한 비율 차용 (전체 스타일 빌림).
- 시점별 가중: 한 작품의 색채 + 다른 작품의 구도 + 또 다른 작품의 텍스처 차용 (부분별 분리).
함수 kriging 의 단일 가중치 = “그림 전체 스타일” 차용. 함수 가중치 = “부분별” 차용.
3 L² 손실의 전개
3.1 손실 함수
함수 노름의 평균 제곱:
\[ E\|\widehat{X}(s) - X(s)\|^2 = E \int (\widehat{X}(s; t) - X(s; t))^2 \, dt. \]
3.2 노름의 전개
\(\widehat{X}(s) - X(s) = \mu + \sum w_k (X(s_k) - \mu) - X(s) = \sum w_k (X(s_k) - \mu) - (X(s) - \mu)\).
내적으로:
\[ \|\widehat{X}(s) - X(s)\|^2 = \langle \sum_k w_k (X(s_k) - \mu) - (X(s) - \mu), \sum_\ell w_\ell (X(s_\ell) - \mu) - (X(s) - \mu) \rangle. \]
전개:
\[ = \sum_{k, \ell} w_k w_\ell \langle X(s_k) - \mu, X(s_\ell) - \mu \rangle - 2 \sum_k w_k \langle X(s_k) - \mu, X(s) - \mu \rangle + \langle X(s) - \mu, X(s) - \mu \rangle. \]
3.3 함수 공분산 (식 9.8)
기댓값을 취하면 새 객체:
\[ C(s, s') = E[\langle X(s) - \mu, X(s') - \mu \rangle]. \]
이는 두 위치의 곡선의 함수 내적의 기댓값 — 한 스칼라 양.
3.4 직관: 함수 공분산의 의미
\(\langle X(s) - \mu, X(s') - \mu \rangle = \int (X(s; t) - \mu(t))(X(s'; t) - \mu(t)) \, dt\) 가 두 곡선의 시점별 곱의 적분. 그 기댓값이 두 위치의 곡선의 평균적 유사성.
스칼라 공분산의 함수 일반화 — 단일 시점이 아닌 모든 시점에 걸친 합산.
3.5 비유: 두 곡선의 닮음 정도
두 사람의 일별 기온 곡선:
- 두 곡선이 시점별로 비슷 (같은 도시 두 측정소) → \(\langle X(s_1), X(s_2) \rangle\) 큼 → \(C(s_1, s_2)\) 큼.
- 두 곡선이 시점별로 다름 (먼 두 도시) → \(\langle X(s_1), X(s_2) \rangle\) 작음 → \(C(s_1, s_2)\) 작음.
공분산이 공간 거리에 따라 감쇠 — 9.1 의 스칼라 공분산과 같은 패턴.
3.6 손실 함수의 압축 형태
\(E\|\widehat{X}(s) - X(s)\|^2\) 의 기댓값을 취하면:
\[ E\|\widehat{X}(s) - X(s)\|^2 = \sum_{k, \ell=1}^N w_k w_\ell C(s_k, s_\ell) - 2 \sum_{k=1}^N w_k C(s_k, s) + C(s, s). \]
3.7 직관: 스칼라와 동일한 형태
이 식은 식 (9.5) (스칼라 kriging 의 손실) 와 형식적으로 동일 — 단지 공분산의 정의가 함수 내적 기댓값.
이로써 모든 스칼라 kriging 결과가 함수로 자동 일반화 — 수학적 우아함.
4 Kriging 시스템
4.1 시스템 도출
손실의 \(w_k\) 미분을 0 으로:
\[ \frac{\partial}{\partial w_k} \left[\sum_{k', \ell} w_{k'} w_\ell C(s_{k'}, s_\ell) - 2 \sum_{k'} w_{k'} C(s_{k'}, s)\right] = 2 \sum_\ell w_\ell C(s_k, s_\ell) - 2 C(s_k, s) = 0. \]
따라서:
\[ \boxed{ \sum_{\ell=1}^N C(s_k, s_\ell) w_\ell = C(s_k, s), \quad k = 1, 2, \ldots, N. } \]
스칼라 식 (9.6) 와 완전히 동일한 형태 — 단지 공분산이 함수 버전.
4.2 행렬 형태
\(\mathbf{C} = [C(s_k, s_\ell)]\) (\(N \times N\)), \(\mathbf{c}_0 = (C(s_1, s), \ldots, C(s_N, s))^T\):
\[ \mathbf{C} \mathbf{w} = \mathbf{c}_0 \implies \mathbf{w} = \mathbf{C}^{-1} \mathbf{c}_0. \]
행렬 \(\mathbf{C}\) 가 비특이이면 유일한 해.
4.3 직관: 회귀 정규방정식과의 동치
다변량 회귀 \(\boldsymbol{\beta} = (X^T X)^{-1} X^T y\) 와 같은 구조 — 공분산 행렬이 정규방정식의 좌변, cross 공분산이 우변, 가중치가 회귀계수.
이는 kriging 이 다변량 회귀의 공간 일반화 임을 보여준다 — 회귀자가 다변량 → 곡선, 회귀계수가 가중치.
5 함수 공분산의 추정
5.1 Stationarity + Isotropy 하 단순화
가정 (9.2 의 표준): \(X(s)\) 가 stationary + isotropic.
\[ C(s, s') = E \int (X(s; t) - \mu(t))(X(s'; t) - \mu(t)) \, dt. \]
기댓값과 적분 교환 (square integrability):
\[ C(s, s') = \int E[(X(s; t) - \mu(t))(X(s'; t) - \mu(t))] \, dt = \int C(\|s - s'\|; t) \, dt, \]
여기서:
\[ C(h; t) = \text{Cov}(X(s + h; t), X(s; t)) \]
가 시점 \(t\) 의 스칼라 spatial covariance (그 시점의 측정값들의 공간 의존).
5.2 표준 추정 절차
- 각 시점 \(t\) 에서: 스칼라 데이터 \(\{X(s_k; t): k = 1, \ldots, N\}\) 의 spatial variogram 추정.
- 모수 모형 적합 (powered exponential, Matérn) 으로 \(\widehat{C}(h; t)\) 추정.
- 시점에 대해 적분: \(\widehat{C}(s, s') = \int \widehat{C}(\|s - s'\|; t) \, dt\).
5.3 직관: 시점별 분리의 우아함
함수 공분산을 직접 추정하는 것은 어려움 — 9.2 에서 본 양정치성 미묘함 (\(C(h; t, u)\) 가 \(t = u\) 만 양정치) 때문.
시점별 분리 로:
- 각 \(t\) 에서 표준 스칼라 spatial covariance — 양정치 자동 보장.
- 시점에 대한 적분 → 함수 공분산 — 양정치 자동 유지 (적분이 양정치 보존).
이는 9.2 의 양정치성 미묘함을 우회하는 표준 우회로.
5.4 비유: 사진별 분석 후 종합
100 장의 사진으로 한 사람의 1 일 활동 분석:
- 직접: 100 장을 동시 분석 (어려움).
- 시점별: 각 시점의 한 사진만 분석 (쉬움) → 모든 시점 결과 종합.
함수 kriging 의 추정 절차도 같은 사고 — 시점별 분리 가 어려운 무한차원 문제를 일변량의 모음으로 환원.
5.5 Trace Variogram (geofd 패키지)
geofd 의 표준 도구:
\[ \widehat{\gamma}_{\text{trace}}(d) = \frac{1}{|N(d)|} \sum_{(s_k, s_\ell) \in N(d)} \|X(s_k) - X(s_\ell)\|^2. \]
식 (9.3) (스칼라 semivariogram) 의 함수 버전 — 차의 함수 노름의 평균.
5.6 직관: Trace Variogram 의 의미
\(\|X(s_k) - X(s_\ell)\|^2 = \int (X(s_k; t) - X(s_\ell; t))^2 \, dt\) — 두 곡선의 차의 모든 시점에서의 차이 적분. 큰 값 = 두 곡선이 매우 다름.
거리 별 binning 후 평균 → 거리에 따른 곡선 차이 패턴. 모수 적합으로 함수 공분산 모형.
6 대안 Kriging 형태
6.1 Alternative Predictor
다른 형태의 예측량:
\[ X^*(s) = \sum_{k=1}^N \lambda_k X(s_k), \quad \sum_{k=1}^N \lambda_k = 1. \]
가중치의 합이 1 인 unbiased 선형 결합.
6.2 Kokoszka 식 (9.6) 와의 차이
식 (9.6) 의 가중치 \(w_j\) 는 일반적으로 \(\sum w_j \neq 1\) — 무편향 제약 없음.
대안 \(X^*(s)\) 는 무편향 제약 추가 — Lagrange multiplier 필요 (9.4 의 mean kriging 과 같은 구조).
6.3 직관: 두 형태의 관계
응용에서 \(w_j\) 와 \(\lambda_j\) 가 매우 비슷 → \(\widehat{X}(s) \approx X^*(s)\) (Problem 9.12).
차이는 이론적 정확성 vs 무편향성 강제:
- \(\widehat{X}(s)\) — 손실 최소화의 정확한 해.
- \(X^*(s)\) — 무편향성 + 손실 최소화 (제약 있는 최적화).
6.4 비유: 회귀 vs ridge
표준 회귀 vs ridge 회귀와 비슷:
- 표준 — 가장 정확한 LS 해.
- Ridge — 정칙화로 안정성 추가.
Kriging 의 두 형태도 비슷 — 무편향 제약 이 정칙화 역할 (특히 작은 표본).
7 평균 함수의 가중 추정 (9.4)
7.1 동기
함수 kriging 은 평균 함수 \(\mu(t)\) 가 알려진 것으로 가정. 실무에서는 \(\mu\) 도 추정 필요. 어떻게 추정할까?
7.2 단순 평균의 한계
가장 단순한 추정량:
\[ \widehat{\mu}_{\text{simple}}(t) = \frac{1}{N} \sum_{k=1}^N X(s_k; t). \]
문제: 공간 분포의 불균형 을 무시. 측정소가 한 영역에 밀집하면 그 영역의 곡선이 평균을 지배.
7.3 Canadian Weather 의 시각적 증거
35 개 캐나다 기상 관측소 중:
- 남부 (밀집): 토론토, 오타와 등 도시 지역.
- 북부 (희소): 한정된 관측소.
단순 평균 (점선): 남부 도시의 기온 패턴 지배 → 따뜻한 곡선. 가중 평균 (실선): 북부에 큰 가중치 → 캐나다 전체의 진짜 평균 (더 추운 곡선).
차이가 약 5°C — 공간 보정의 실질적 효과.
7.4 직관: 측정 밀도의 편향
같은 정보가 여러 번 측정되면 (가까운 측정소) 그 정보가 평균을 과대 대표. 공간 가중치 로 이 중복을 보정 → 진짜 모집단 평균 추정.
이는 Ch.7 의 PACE BLUP 과 같은 사고 — 모집단 정보의 적절한 가중.
7.5 비유: 회의의 의견 가중
같은 부서 5 명 + 다른 부서 1 명의 의견 평균:
- 단순 평균: 같은 부서가 5/6 지배.
- 가중 평균: 다른 부서 1 명에 1/2 가중치 → 부서 균형.
캐나다 평균 기온도 같은 사고 — 지역별 균형 잡힌 평균.
8 가중 추정의 모형 (식 9.10)
8.1 추정량
\[ \widehat{\mu}(t) = \sum_{k=1}^N w_k X(s_k; t). \]
각 곡선에 단일 가중치 (시점 무관) — 곡선 전체에 한 가중치.
8.2 함수 가중치의 가능성
이론적으로 \(w_k(t)\) (시점별 가중치) 도 가능 — 더 유연하지만:
- 계산 복잡성 증가.
- 추정 모수 폭발 (\(N\) → \(N \times M\) where \(M\) 은 시점 수).
본 chapter 는 단순 가중치 (단일) 만 다룸. Delicado et al. (2010) 가 함수 가중치의 일반화.
8.3 직관: 단순함의 가치
\(w_k(t)\) (함수) vs \(w_k\) (스칼라):
- 함수 가중치 — 시점별 다른 가중 가능. 더 정확한 추정 가능.
- 스칼라 가중치 — 더 안정적. 더 간단.
캐나다 데이터 같은 응용에서 단순 가중치가 충분 — Ch.9 의 표준 선택.
9 최적 가중치 시스템
9.1 무편향 조건
\(E\widehat{\mu}(t) = \sum w_k E X(s_k; t) = \mu(t) \sum w_k\).
\(\sum w_k = 1\) 일 때 무편향.
9.2 MSE 최소화
\(E\|\widehat{\mu} - \mu\|^2\) 최소화 + \(\sum w_k = 1\) 제약.
손실 (식 9.11):
\[ E\left\|\sum_{k=1}^N w_k X(s_k) - \mu\right\|^2 = E \int \left\{\sum_{k=1}^N w_k X(s_k; t) - \mu(t)\right\}^2 dt. \]
9.3 Lagrange Multiplier
제약 있는 최적화 → Lagrangian:
\[ \mathcal{L}(\mathbf{w}, r) = E\|\widehat{\mu} - \mu\|^2 - 2r \left(\sum_{k=1}^N w_k - 1\right). \]
\(w_k\) 미분 = 0 + \(r\) 미분 = 0 → 시스템 (식 9.12, Problem 9.9):
\[ \boxed{ \sum_{k=1}^N w_k = 1, \quad \sum_{k=1}^N w_k C(s_k, s_n) - r = 0, \quad n = 1, 2, \ldots, N. } \]
\(N + 1\) 미지수 (\(w_1, \ldots, w_N, r\)).
9.4 직관: Lagrange Multiplier 의 의미
\(r\) 이 shadow price — 무편향 제약을 1 단위 풀었을 때 손실의 감소량.
수학적으로: \(r\) 이 모든 \(C(s_k, s_n) w_k\) 의 합과 균형 → 모든 위치에서 cross-correlation 의 가중 합이 동일.
9.5 비유: 예산 제약 하의 최적화
회사의 광고 예산 분배:
- 제약: 예산 합 = 100 만원.
- 목표: 매출 최대화.
- Lagrange multiplier \(r\) = “1 만원 추가 예산의 한계 매출 효과”.
Mean kriging 의 \(r\) 도 같은 사고 — 무편향 제약의 한계 비용.
9.6 시스템의 행렬 형태
\(\mathbf{C} = [C(s_k, s_n)]\), \(\mathbf{1} = (1, \ldots, 1)^T\):
\[ \begin{pmatrix} \mathbf{C} & -\mathbf{1} \\ \mathbf{1}^T & 0 \end{pmatrix} \begin{pmatrix} \mathbf{w} \\ r \end{pmatrix} = \begin{pmatrix} \mathbf{0} \\ 1 \end{pmatrix}. \]
\((N+1) \times (N+1)\) 시스템 — 표준 선형 대수 풀이.
10 Mean Kriging vs Functional Kriging 의 관계
10.1 두 시스템의 비교
| 측면 | Functional Kriging (9.3) | Mean Kriging (9.4) |
|---|---|---|
| 목표 | 미관측 위치 곡선 \(X(s)\) | 모집단 평균 \(\mu\) |
| 가중치 | \(\sum w_k\) 자유 | \(\sum w_k = 1\) 강제 |
| 시스템 | 식 (9.6), \(N\) 미지수 | 식 (9.12), \(N + 1\) 미지수 |
| 우변 | \(C(s_k, s)\) (cross 공분산) | 모두 같은 형태 |
10.2 직관: 두 문제의 본성 차이
- Functional kriging — 특정 위치 \(s\) 의 곡선 예측. 그 위치와 관측 위치 간의 cross 공분산이 핵심.
- Mean kriging — 모집단 전체의 평균 추정. 무편향성이 핵심 (특정 위치 \(s\) 가 없음).
따라서 다른 시스템 — 같은 framework 이지만 다른 응용.
10.3 응용에서의 우선순위
Functional kriging 은 mean kriging 의 결과를 입력으로 사용:
1. 평균 함수 추정 (mean kriging, 식 9.12)
↓
2. 함수 공분산 추정 (시점별 spatial variogram + 적분)
↓
3. 미관측 위치 예측 (functional kriging, 식 9.6)
Mean kriging 이 functional kriging 의 전제조건 — 대부분의 응용에서 두 도구가 함께 사용.
11 R 구현 (geofd 패키지의 일부)
11.1 평균 함수 가중치
11.2 함수 Kriging 가중치
11.3 직관: 두 가중치의 결합
\(\mathbf{w}_k = \mathbf{w}_0 + \mathbf{w}_{\text{mean}} (1 - \sum w_0)\):
- \(\mathbf{w}_0\) — 무제약 functional kriging 가중치.
- 보정 항 — \(\sum w_k = 1\) 을 만족시키는 조정.
이 형태가 두 시스템의 자연스러운 결합 — 9.5 의 Canadian Weather 응용에서 정확히 사용.
12 두 절의 통합 시각
12.1 한 줄 요약
함수 크리깅 (9.3) 은 미관측 위치 X(s) 를 X̂(s) = μ + Σw_k(X(s_k)-μ) 로 예측, L² 손실의 전개로 함수 공분산 C(s, s’) = E⟨X(s)-μ, X(s’)-μ⟩ 의 정의 (식 9.8) 와 스칼라 (식 9.6) 와 형식적으로 동일한 시스템 도출. 추정은 stationarity + isotropy 하 C(s, s’) = ∫C(‖s-s’‖; t) dt 로 시점별 스칼라 variogram 추정 + 적분. 평균 함수의 가중 추정 (9.4) 은 Σw_k = 1 무편향 제약 하 MSE 최소화 → Lagrange multiplier 시스템 (식 9.12). Canadian Weather (Figure 9.1) 가 시각적 증거 — 단순 평균은 측정소 밀집 지역 지배, 가중 평균은 공간 균형 회복.
12.2 Sections 9.0~9.1 와의 비교
| 측면 | 9-0 (overview) | 9-1 (스칼라 + 함수장) | 9-2 (이 포스트) |
|---|---|---|---|
| 깊이 | 전체 흐름 | 정의 + 양정치성 | Kriging 시스템 + 추정 |
| 수식 | 핵심만 | 식 (9.2) | 식 (9.5)~(9.12) |
| 응용 | 언급만 | (없음) | Canadian Weather 시각적 증거 |
9-2 가 Ch.9 의 핵심 도구 (kriging) 의 정확한 형태.
12.3 Ch.9 후속 절과의 연결
| 후속 절 | 9.3~9.4 의 도구를 어떻게 활용하는가 |
|---|---|
| 9.5 geofd | 9.3 의 kriging 시스템 + 9.4 의 mean kriging 의 R 구현 |
| 9.6 확장 | Delicado 의 함수 가중치 (단일 가중치의 일반화), Caballero 의 covariate-based 평균 |
9.3~9.4 가 Ch.9 의 핵심 알고리즘 — 9.5 의 R 구현은 이 시스템의 기계적 풀이.
12.4 실용 워크플로우
- Trace variogram 계산 (
geofd::trace.variog) — 곡선 사이 거리 vs 공간 거리. - 모수 variogram 적합 (
variofit) — exponential, Matérn 등. - 함수 공분산 행렬 \(\widehat{\mathbf{C}}\) 추정 — 적합된 variogram 으로.
- Mean kriging (식 9.12) — 가중 평균 함수.
- Functional kriging (식 9.6) — 미관측 위치 예측.
- 시각화 — 가중치 분포 + 예측 vs 진짜 곡선 비교.
13 관련 주제
선행 지식
- FDA 1.0 — 개요
- FDA 3.1~3.2 — L² 공간과 확률 함수, Karhunen-Loève 전개
- FDA 9.0 — 공간 함수 데이터 (Spatial FDA) 개관
- FDA 9.1~9.2 — 스칼라 공간 통계와 함수 공간장
- 스칼라 Kriging 표준
후속 주제
관련 개념
- BLUP (Best Linear Unbiased Predictor) — Mean kriging 의 토대 (PACE 와 같은 framework)
- Lagrange Multiplier 와 제약 최적화 — 식 (9.12) 의 도구
- 다변량 회귀의 정규방정식 — Kriging 시스템과의 동치
- Trace Variogram (Functional Variogram) —
geofd의 표준 도구 - Cross-validation in Spatial Statistics — Kriging 검증
geofdR 패키지 — Spatial FDA 의 표준 도구