1 이 포스트의 위치
./9-0-spatial-fda.qmd 부터 ./9-3-geofd-extensions.qmd 까지 Ch.9 의 본문 6 개 절을 다뤘다. 이 포스트는 마지막 §9.7 의 13 개 연습문제를 풀이한다.
(주: Ch.9 는 §9.1~§9.7 까지 — §9.8 은 없음. §9.7 가 chapter problems 의 표준 마지막 절.)
Ch.9 본문 (§9.1~§9.6)
↓
Ch.9 연습문제 (§9.7, 13 문제)
├ 9.1~9.4: 공분산 기초 (3 성질·valid·semivariogram·random walk)
├ 9.5~9.7: Kriging 시스템 도출 (Lagrange multiplier)
├ 9.8: 구체적 수치 예제 (exponential 공분산 + 3 위치)
├ 9.9~9.10: 함수 일반화 (mean kriging + functional semivariogram)
└ 9.11~9.13: R 응용 (Canada 지도·okfd·Figure 9.1)
핵심 메시지: 연습문제는 본문의 추상 결과 (변수 이름이 다양한 추상 식) 를 구체적 계산·구체적 수치 예제·R 코드로 정착시킨다. 특히 Problem 9.7 의 Lagrange multiplier 도출이 Ch.9 의 모든 가중치 시스템 (mean kriging, functional kriging) 의 표준 도구이며, Problem 9.10 의 functional semivariogram 식 (9.19) 가 geofd 의 trace variogram 의 이론적 토대.
2 Problem 9.1: 공분산의 기초 성질
2.1 문제
Second-order stationary 스칼라 random field \(\{X(s): s \in \mathbb{R}^d\}\) 의 공분산 함수 \(C\) 에 대해 다음 검증:
- \(C(0) \geq 0\).
- \(C(-h) = C(h)\).
- \(|C(h)| \leq C(0)\).
2.2 풀이
1. \(C(0) \geq 0\):
\(C(0) = \text{Cov}(X(s), X(s)) = \text{Var}[X(s)] \geq 0\). (분산은 비음수.) \(\blacksquare\)
2. \(C(-h) = C(h)\):
\(C(-h) = \text{Cov}(X(s), X(s - h))\). 정상성으로 \(s\) 를 \(s + h\) 로 shift:
\[ C(-h) = \text{Cov}(X(s + h), X(s)) = \text{Cov}(X(s), X(s + h)) = C(h). \]
(공분산 대칭.) \(\blacksquare\)
3. \(|C(h)| \leq C(0)\):
Cauchy-Schwarz 부등식:
\[ |C(h)| = |\text{Cov}(X(s), X(s + h))| \leq \sqrt{\text{Var}[X(s)] \text{Var}[X(s + h)]} = \sqrt{C(0) \cdot C(0)} = C(0). \]
(정상성으로 두 분산 모두 \(C(0)\).) \(\blacksquare\)
2.3 직관: 공분산 함수의 기본 형태
이 세 성질이 모든 공분산 함수의 표준 특성:
- \(C(0)\) — 자기 자신과의 공분산 = 분산 (양수).
- \(C(-h) = C(h)\) — 좌우 대칭. 1D 시계열의 자기공분산 대칭과 같은 성질.
- \(|C(h)| \leq C(0)\) — 분산을 초과하지 못함 (Cauchy-Schwarz 결과).
이 성질들이 valid covariance function 의 후보의 sanity check.
2.4 비유: 키와 키의 공분산
자신의 키와 자신의 키의 공분산 = 키의 분산 (양수). 오른쪽으로 1cm 이동 후 키와의 공분산 = 왼쪽으로 1cm 이동 후 키와의 공분산 (대칭). 다른 위치의 키와 자기 위치 키의 공분산 ≤ 자기 분산 (Cauchy-Schwarz).
자연스러운 패턴들.
3 Problem 9.2: Valid Covariance Function
3.1 문제
Second-order stationary \(X\) 의 공분산 \(C\) 에 대해 다음 nonnegative definiteness 증명:
\[ \sum_{i, j=1}^m a_i a_j C(s_i - s_j) \geq 0 \quad \forall a_i \in \mathbb{R}, s_i \in \mathbb{R}^d. \tag{9.18} \]
3.2 풀이
선형 결합 \(Y = \sum_{i=1}^m a_i X(s_i)\) 의 분산 = 비음수:
\[ 0 \leq \text{Var}[Y] = \text{Var}\left[\sum_i a_i X(s_i)\right] = \sum_{i, j} a_i a_j \text{Cov}(X(s_i), X(s_j)). \]
정상성으로 \(\text{Cov}(X(s_i), X(s_j)) = C(s_i - s_j)\):
\[ 0 \leq \sum_{i, j} a_i a_j C(s_i - s_j). \quad \blacksquare \]
3.3 “Valid” 의 의미
식 (9.18) 의 nonnegative definiteness 를 만족하는 함수를 valid covariance function 이라 한다.
응용에서는 종종 추정 모형 또는 데이터로부터 얻은 \(C\) 가 nonnegative definiteness 를 위배하는 경우가 있어 — 별도의 정칙화 필요.
3.4 직관: 분산이 비음수의 함의
식 (9.18) 의 본질: 분산이 비음수 라는 자명한 사실의 함수 형태.
임의의 선형 결합의 분산이 음수일 수 없음 → 그 분산을 표현하는 식이 비음수 → 공분산 함수가 nonnegative definite.
이는 모든 공분산 함수의 가장 깊은 성질 — 단순한 적률 (mean, variance) 만 가지고 함수 전체를 제약한다.
3.5 비유
회의 참석자들의 의견을 가중 평균한 합의:
- 합의의 분산 = 0 이상.
- 이 사실이 모든 가중 패턴 (양수, 음수, 영) 에 대해 동시 성립 → 의견 사이 공분산 행렬의 모든 quadratic form 이 비음수.
같은 사고가 공간 공분산에 적용 — 위치 사이 공분산의 patterns 가 분산의 비음수 성질에 의해 제약.
4 Problem 9.3: Semivariogram
4.1 문제
식 (9.2) \(\gamma(h) = C(0) - C(h)\) 검증.
4.2 풀이
Semivariogram 의 정의:
\[ \gamma(h) = \frac{1}{2} \text{Var}[X(s + h) - X(s)]. \]
분산의 전개:
\[ \text{Var}[X(s + h) - X(s)] = \text{Var}[X(s + h)] + \text{Var}[X(s)] - 2\text{Cov}(X(s + h), X(s)). \]
정상성으로 \(\text{Var}[X(s)] = \text{Var}[X(s + h)] = C(0)\), \(\text{Cov} = C(h)\):
\[ = C(0) + C(0) - 2 C(h) = 2C(0) - 2C(h). \]
절반:
\[ \gamma(h) = C(0) - C(h). \quad \blacksquare \]
4.3 직관: 두 측도의 관계
- \(C(h)\): \(X(s)\) 와 \(X(s + h)\) 의 닮음 정도.
- \(\gamma(h)\): 두 값의 차이 정도.
정확히 반비례 — 닮음이 크면 차이 작음, 닮음이 작으면 차이 큼.
식 (9.2) 가 이 자명한 관계를 정확한 수식으로 표현.
4.4 시각적 의미
| \(h\) | \(C(h)\) | \(\gamma(h)\) | 해석 |
|---|---|---|---|
| 0 | \(C(0)\) (최댓값) | 0 | 같은 위치, 차이 없음 |
| 작음 | 큼 | 작음 | 가까운 위치, 비슷 |
| 큼 | 작음 | 큼 | 먼 위치, 다름 |
| ∞ | 0 | \(C(0)\) | 무관, 차이 = 분산 |
Variogram 의 단조 증가 (대부분의 응용) ↔︎ Covariance 의 단조 감소.
5 Problem 9.4: Random Walk 의 정상성
5.1 문제
iid \(\varepsilon_i\) (mean 0, variance \(\sigma^2\)) 로 정의된 random walk:
\[ X(j) = \sum_{i=1}^j \varepsilon_i, \quad j \geq 1. \]
Random walk 가 intrinsically stationary 이지만 strictly stationary 이 아님을 보임.
5.2 Strict Stationarity 위반
\(\text{Var}[X(j)] = \sum_{i=1}^j \text{Var}[\varepsilon_i] = j \sigma^2\) — \(j\) 에 의존.
Stationarity 의 정의 (모든 적률이 \(j\) 무관) 위배. \(\blacksquare\)
5.3 Intrinsic Stationarity 검증
차이의 분산:
\[ \text{Var}[X(j + h) - X(j)] = \text{Var}\left[\sum_{i=j+1}^{j+h} \varepsilon_i\right] = h \sigma^2. \]
\(j\) 에 무관 (\(h\) 에만 의존). 따라서 intrinsically stationary. \(\blacksquare\)
5.4 직관: Random Walk 의 두 얼굴
Random walk 의 분산이 시간에 따라 누적 → 비정상.
그러나 차이 \(X(j+h) - X(j) = \sum_{i=j+1}^{j+h} \varepsilon_i\) 가 항상 \(h\) 개의 iid 항의 합 → 분산이 \(h\sigma^2\) 으로 일정.
이는 random walk 의 핵심 — 누적은 비정상이지만 증분은 정상.
5.5 비유: 인플레이션의 누적
물가 지수 = random walk:
- 물가 자체 — 시간에 따라 분산 누적 (비정상).
- 인플레이션 율 (전월 대비 증가율) — 평균/분산 일정 (정상).
차이 (증분) 가 정상 → intrinsically stationary 의 직관.
5.6 응용 의의
이 결과가 시계열 분석의 차분 (differencing) 의 토대:
비정상 시계열 → 차분으로 정상화 — random walk 의 차분 = white noise.
같은 사고가 공간 통계의 intrinsic vs strict stationarity 구별에 적용 — 더 약한 가정이 더 일반적 응용.
6 Problem 9.5: Predictor 의 무편향 + MSE 식
6.1 문제
Predictor \(\widehat{X}(s) = \mu + \sum_k w_k (X(s_k) - \mu)\) 가:
- \(E[\widehat{X}(s) - X(s)] = 0\) (무편향).
- 식 (9.5) MSE 형태:
\[ \sigma^2(s) = C(0) + \sum_{k, j} w_k w_j C(s_k - s_j) - 2 \sum_k w_k C(s_k - s). \]
6.2 무편향 증명
\(E X(s_k) = E X(s) = \mu\) (정상성):
\[ E[\widehat{X}(s) - X(s)] = \mu + \sum_k w_k (E X(s_k) - \mu) - E X(s) = \mu + 0 - \mu = 0. \quad \blacksquare \]
6.3 MSE 도출
\(\widehat{X}(s) - X(s) = \sum_k w_k (X(s_k) - \mu) - (X(s) - \mu)\). MSE:
\[ E[\widehat{X}(s) - X(s)]^2 = \text{Var}\left[\sum_k w_k (X(s_k) - \mu) - (X(s) - \mu)\right]. \]
전개 (정상성 + 평균 0 의 변환된 변수):
\[ = \sum_{k, j} w_k w_j \text{Cov}(X(s_k), X(s_j)) - 2 \sum_k w_k \text{Cov}(X(s_k), X(s)) + \text{Var}[X(s)]. \]
정상성:
\[ = \sum_{k, j} w_k w_j C(s_k - s_j) - 2 \sum_k w_k C(s_k - s) + C(0). \quad \blacksquare \]
6.4 직관: Quadratic Form 의 표준 구조
식 (9.5) 의 형태 = \(\mathbf{w}^T \mathbf{C} \mathbf{w} - 2 \mathbf{w}^T \mathbf{c}_0 + C(0)\) — 이차 형식.
이는 표준 회귀의 SSR 과 같은 구조 — 가중치에 대한 이차 함수, 미분으로 최적화.
6.5 비유: 비용 최소화
회사의 운영 비용:
- 고정 비용 (\(C(0)\)).
- 가중치에 따른 변동 비용 (\(\mathbf{w}^T \mathbf{c}_0\)).
- 가중치 사이 상호작용 비용 (\(\mathbf{w}^T \mathbf{C} \mathbf{w}\)).
총 비용 최소화 = 가중치 미분 = 0 → 표준 최적화 시스템.
7 Problem 9.6: Kriging Weights System (식 9.6)
7.1 문제
식 (9.5) 를 최소화하는 가중치 \(w_1, \ldots, w_K\) 가 식 (9.6) 을 만족함:
\[ \sum_{j=1}^N C(s_k - s_j) w_j = C(s_k - s), \quad k = 1, 2, \ldots, N. \]
7.2 풀이
식 (9.5) 의 \(w_k\) 미분:
\[ \frac{\partial \sigma^2}{\partial w_k} = 2 \sum_{j=1}^N w_j C(s_k - s_j) - 2 C(s_k - s). \]
(이차 항의 미분이 선형 항을 만들어내고, cross term 의 대칭으로 2 배.)
0 으로 놓고 2 로 나눔:
\[ \sum_{j=1}^N C(s_k - s_j) w_j = C(s_k - s). \quad \blacksquare \]
7.3 직관: 표준 정규방정식
식 (9.6) 이 회귀의 정규방정식 \(\mathbf{X}^T \mathbf{X} \boldsymbol{\beta} = \mathbf{X}^T \mathbf{y}\) 와 같은 형태:
- 좌변: 회귀자 사이 공분산 (Gram 행렬) × 가중치.
- 우변: 회귀자와 반응의 공분산.
Kriging 이 본질적으로 공분산 기반의 회귀 임을 보여줌.
7.4 행렬 형태
\(\mathbf{C}_{kk'} = C(s_k - s_{k'})\), \(\mathbf{c}_0 = (C(s_1 - s), \ldots, C(s_N - s))^T\):
\[ \mathbf{C} \mathbf{w} = \mathbf{c}_0 \implies \mathbf{w} = \mathbf{C}^{-1} \mathbf{c}_0. \]
\(\mathbf{C}\) 가 비특이 (positive definite) 이면 유일한 해.
8 Problem 9.7: Lagrange Multiplier 도출 (식 9.7)
8.1 문제
Mean kriging 시스템 (식 9.7) 도출:
\(\sum_k w_k = 1\) 제약 하 \(E\left(\sum w_k X(s_k) - \mu\right)^2\) 최소화.
8.2 Lagrange Multiplier 방법 복습
\(f(x_1, \ldots, x_n)\) 의 극값을 \(g(x_1, \ldots, x_n) = 0\) 제약 하 찾을 때:
극값에서 \(\lambda\) 존재 + 모든 \(\ell\) 에 대해:
\[ \frac{\partial f}{\partial x_\ell}(\mathbf{x}_0) = \lambda \frac{\partial g}{\partial x_\ell}(\mathbf{x}_0). \]
8.3 풀이
목적 함수:
\[ f(\mathbf{w}) = E\left(\sum_{k=1}^N w_k X(s_k) - \mu\right)^2. \]
전개 (Problem 9.5 와 비슷, 단 \(\widehat{X}(s)\) 대신 \(\widehat{\mu}\)):
\[ f(\mathbf{w}) = \sum_{k, j} w_k w_j C(s_k - s_j) + C(0) (?) \cdots \]
(정확히는 좀 다른 형태이지만 핵심은 \(f\) 가 \(\mathbf{w}\) 의 이차 형식.)
미분:
\[ \frac{\partial f}{\partial w_n} = 2 \sum_{k=1}^N w_k C(s_k - s_n). \]
제약 함수 \(g(\mathbf{w}) = \sum w_k - 1 = 0\). 미분: \(\partial g / \partial w_n = 1\).
Lagrange:
\[ 2 \sum_{k=1}^N w_k C(s_k - s_n) = \lambda. \]
\(\lambda / 2 = r\) 로 재정의 + 제약 식 추가:
\[ \sum_{k=1}^N w_k C(s_k - s_n) = r, \quad \sum_{k=1}^N w_k = 1. \]
이는 식 (9.7). \(\blacksquare\)
8.4 직관: Lagrange Multiplier 의 의미
\(\lambda\) (또는 \(r\)) 의 의미:
제약 (sum = 1) 을 1 단위 풀었을 때 목적 함수의 변화율 — shadow price.
수학적으로: 모든 \(n\) 에서 \(\sum w_k C(s_k, s_n)\) 이 같은 값 \(r\) — 균형 상태.
8.5 비유: 균형 잡힌 분배
회사의 부서별 예산 분배:
- 제약: 총 예산 = 100 만원.
- 목표: 매출 최대화.
- Lagrange: “1 만원 추가의 한계 효과” 가 모든 부서에서 동일 — 균형.
Mean kriging 의 \(r\) 도 같은 사고 — 모든 위치의 marginal 효과가 동일 한 균형 상태.
9 Problem 9.8: 구체적 수치 예제
9.1 문제
\(\{X(s), s \in \mathbb{R}\}\) 가 second-order stationary, 공분산 \(C(h) = e^{-h}\).
관측: \(s_1 = 0, s_2 = 1, s_3 = 10\), 값 \(X(s_1) = 1, X(s_2) = 2, X(s_3) = 3\).
가중치 \(w_1, w_2, w_3\) 와 \(\widehat{\mu}\) 계산. \(\widehat{\mu}\) 가 단순 평균 \((1+2+3)/3 = 2\) 보다 큰 이유 직관 설명.
9.2 공분산 행렬
\(C(h) = e^{-h}\), 거리:
| 쌍 | 거리 | \(C\) |
|---|---|---|
| \((s_1, s_1)\) | 0 | 1 |
| \((s_2, s_2)\) | 0 | 1 |
| \((s_3, s_3)\) | 0 | 1 |
| \((s_1, s_2)\) | 1 | \(e^{-1} \approx 0.368\) |
| \((s_1, s_3)\) | 10 | \(e^{-10} \approx 0\) |
| \((s_2, s_3)\) | 9 | \(e^{-9} \approx 0\) |
행렬:
\[ \mathbf{C} = \begin{pmatrix} 1 & e^{-1} & e^{-10} \\ e^{-1} & 1 & e^{-9} \\ e^{-10} & e^{-9} & 1 \end{pmatrix} \approx \begin{pmatrix} 1 & 0.368 & 0 \\ 0.368 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}. \]
9.3 Mean Kriging 시스템
식 (9.7):
\[ \sum_{k} w_k C(s_k - s_n) = r, \quad \sum w_k = 1. \]
\(e^{-9}, e^{-10} \approx 0\) 근사:
\[ w_1 + 0.368 w_2 = r, \]
\[ 0.368 w_1 + w_2 = r, \]
\[ w_3 = r, \]
\[ w_1 + w_2 + w_3 = 1. \]
9.4 풀이
첫 두 식 빼면 \((1 - 0.368)(w_1 - w_2) = 0 \implies w_1 = w_2\) (\(s_1, s_2\) 대칭).
\(w_1 = w_2 = w\), 첫 식: \(w + 0.368 w = r \implies w(1.368) = r\).
\(w_3 = r\), sum-to-1: \(2w + w_3 = 1 \implies 2w + r = 1 \implies 2w + 1.368 w = 1 \implies w = 1 / 3.368 \approx 0.297\).
\(w_3 = r = 1.368 \times 0.297 \approx 0.406\).
검증: \(w_1 + w_2 + w_3 = 0.297 + 0.297 + 0.406 \approx 1\).
9.5 \(\widehat{\mu}\) 계산
\[ \widehat{\mu} = w_1 X(s_1) + w_2 X(s_2) + w_3 X(s_3) = 0.297 \times 1 + 0.297 \times 2 + 0.406 \times 3 \approx 0.297 + 0.594 + 1.218 \approx 2.109. \]
\(\widehat{\mu} \approx 2.11 > 2\) (단순 평균).
9.6 직관: 왜 \(\widehat{\mu} > 2\) 인가
\(s_1 = 0, s_2 = 1\) 은 매우 가까움 → 정보 중복. \(s_3 = 10\) 은 멀리 떨어짐 → 독립 정보.
가까운 두 위치의 가중치 합 = \(w_1 + w_2 = 0.594\) < 2/3 = 0.667 (단순). 먼 위치의 가중치 = \(w_3 = 0.406\) > 1/3 = 0.333 (단순).
먼 위치 (\(X(s_3) = 3\), 큰 값) 에 더 큰 가중치 → 가중 평균이 더 큼.
이는 kriging the mean 의 핵심 직관: 정보 중복이 있는 위치들의 영향 감소 + 독립 정보를 가진 위치 (먼 곳) 의 영향 증가 → 균형 잡힌 평균.
9.7 비유: 인구 조사의 표본 가중
서울 5 명 + 강원 1 명 의견 평균:
- 단순: 서울 5/6 지배.
- 가중 (kriging the mean): 강원 1 명에 큰 가중치 → 지역 균형.
Problem 9.8 의 결과가 정확히 같은 사고 — 공간 정보 중복의 자동 보정.
10 Problem 9.9: 함수 Mean Kriging 시스템 (식 9.12)
10.1 문제
식 (9.11) 을 최소화하는 가중치가 식 (9.12) 를 만족함:
\[ \sum_k w_k = 1, \quad \sum_k w_k C(s_k, s_n) - r = 0, \quad n = 1, \ldots, N. \]
10.2 풀이 (Hint: Problem 9.7 와 같은 사고)
식 (9.11):
\[ f(\mathbf{w}) = E\left\|\sum_k w_k X(s_k) - \mu\right\|^2. \]
함수 노름의 평균 제곱 = 적분 + 기댓값. 전개 후 함수 공분산 (식 9.8) 을 사용:
\[ f(\mathbf{w}) = \sum_{k, \ell} w_k w_\ell C(s_k, s_\ell) - 2 \sum_k w_k C(s_k, s_\mu) + C(\cdots), \]
(단, \(C(s_k, s_\mu) = E\langle X(s_k) - \mu, ?\rangle\) 같은 형태이지만, 실제 문제 9.11 의 식은 \(\mu\) 자체가 비교 대상이므로 어떤 표준 구조.)
핵심은 \(f\) 가 \(\mathbf{w}\) 의 이차 형식이고, \(\sum w_k = 1\) 제약 하 Lagrange:
\[ \frac{\partial f}{\partial w_n} = 2 \sum_k w_k C(s_k, s_n) = \lambda \cdot 1 \implies \sum_k w_k C(s_k, s_n) = r. \]
제약 식 추가 → 식 (9.12). \(\blacksquare\)
10.3 직관: Problem 9.7 와의 동치
식 (9.12) 가 식 (9.7) 의 함수 일반화:
- 스칼라 공분산 \(C(s_k - s_n)\) → 함수 공분산 \(C(s_k, s_n) = E\langle X(s_k) - \mu, X(s_n) - \mu \rangle\).
같은 Lagrange multiplier 메커니즘 — 함수 차원의 일반화에서도 형식적으로 동일.
이는 Ch.9 의 일관된 패턴 — 스칼라 결과의 함수 일반화가 형식적으로 자연스러움 (9-2 에서 본 kriging 시스템과 같은 구조).
11 Problem 9.10: Functional Semivariogram (식 9.19)
11.1 문제
함수 semivariogram 정의:
\[ \gamma(s_k, s_\ell) = \frac{1}{2} E\|X(s_k) - X(s_\ell)\|^2. \]
Stationarity + isotropy 하 (식 9.19):
\[ \gamma_f(h) = C_f(0) - C_f(h), \]
\(h = \|s_k - s_\ell\|\), \(\gamma_f(h) = \gamma(s_k, s_\ell)\), \(C_f(h) = C(s_k, s_\ell)\) (식 9.8).
11.2 풀이
함수 노름의 전개:
\[ \|X(s_k) - X(s_\ell)\|^2 = \langle X(s_k) - X(s_\ell), X(s_k) - X(s_\ell) \rangle. \]
분해:
\[ = \langle X(s_k), X(s_k) \rangle - 2 \langle X(s_k), X(s_\ell) \rangle + \langle X(s_\ell), X(s_\ell) \rangle. \]
평균 차감 후 (식 9.8 의 정의):
\[ E \langle X(s_k) - \mu, X(s_\ell) - \mu \rangle = C(s_k, s_\ell). \]
따라서 (정상성 + isotropy 로 \(C(s_k, s_k) = C_f(0)\)):
\[ E \|X(s_k) - X(s_\ell)\|^2 = C_f(0) - 2 C_f(h) + C_f(0) = 2 (C_f(0) - C_f(h)). \]
절반:
\[ \gamma_f(h) = C_f(0) - C_f(h). \quad \blacksquare \]
11.3 직관: 스칼라 식 (9.2) 의 함수 일반화
스칼라:
\[ \gamma(h) = C(0) - C(h). \]
함수:
\[ \gamma_f(h) = C_f(0) - C_f(h). \]
완전히 같은 형태 — 단지 스칼라 공분산 → 함수 내적 기댓값 \(C_f\).
11.4 geofd 의 구현 의의
식 (9.19) 가 geofd 패키지의 trace variogram 의 이론적 토대:
- Empirical \(\widehat{\gamma}_f(d)\) 계산 — \(\|X(s_k) - X(s_\ell)\|^2\) 의 거리별 평균.
- 모수 모형 (exponential, Matérn) 적합.
- \(C_f(h) = C_f(0) - \widehat{\gamma}_f(h)\) 로 함수 공분산 추정.
- Kriging 시스템 (식 9.6) 풀이.
스칼라 spatial statistics 의 모든 도구가 함수 차원에서 자동 작동 — 식 (9.19) 가 그 다리.
11.5 비유: 같은 도구, 다른 객체
망치 — 못을 박는 도구. 큰 못 (스칼라) 에 작동하면 작은 못 (함수) 에도 작동. 도구의 본질이 객체의 크기와 무관.
식 (9.19) 가 “스칼라 spatial covariance 도구가 함수 차원에서도 같은 형태로 작동” 을 보장 → geofd 의 표준 워크플로우 가능.
12 Problem 9.11: Canada 지도 위 가중치 시각화
12.1 R 코드 (코드 분석)
map('world', ylim = c(42, 78), xlim = c(-180, -40))
map('world', region = "Canada", add = TRUE, fill = TRUE, col = "lightyellow")
# 각 위치에 가중치 시각화
points(coord.34, col = 3 - sign(w.k), # 색: 양수/음수 구분
pch = 19,
cex = 0.75 + 4 * abs(w.k) / max(abs(w.k))) # 크기: 가중치 크기
# 모든 위치 검은 점 (작은) 으로 표시
points(coord.34, col = 'black', pch = 19, cex = 0.5)
# Calgary (예측 대상) 녹색 큰 점
points(coord.0[1], coord.0[2], pch = 19, col = 3, cex = 1.5)
title(main = "Kriging weights")12.2 시각 요소 해석
- 색:
3 - sign(w.k)—w.k가 양수면 색 인덱스 2 (빨강), 음수면 4 (파랑), 0 이면 3 (녹색). - 크기:
0.75 + 4 * abs(w.k) / max(abs(w.k))— 가중치 절댓값에 비례 (큰 가중치 → 큰 점). - 녹색 점 (Calgary): 예측 대상 위치.
- 검은 작은 점: 모든 관측소의 위치 표시 (참조용).
12.3 직관: 시각화의 통찰
- Edmonton (Calgary 와 가장 가까움): 큰 빨강 점 — 큰 양의 가중치.
- 먼 관측소들: 작은 점 — 작은 가중치.
- 일부 가까운 관측소들: 작은 파랑 점 — 약간 음수 가중치 (정보 중복 보정).
지도 시각화로 가중치의 공간적 분포 가 도메인 직관과 일치하는지 확인.
12.4 비유: 영향력 지도
선거 결과 예측에서 각 지역의 “영향력” 을 색·크기로 시각화 — 어느 지역이 결과를 좌우하는지 한눈에 보임.
Kriging 가중치 지도도 같은 사고 — 공간 정보의 시각적 진단.
13 Problem 9.12: okfd Function (대안 Kriging)
13.1 문제 배경
geofd::okfd — 식 (9.9) 형태 (sum to 1 제약) 의 kriging:
\[ X^*(s) = \sum_{k=1}^N \lambda_k X(s_k), \quad \sum \lambda_k = 1. \]
평균 함수 추정 불요 — 무편향 제약 으로 자동 처리.
13.2 R 코드 (가중치 시각화)
lambda.okfd <- okfd.res$functional.kriging.weights
lambda.okfd <- lambda.okfd[-length(lambda.okfd)] # 마지막 요소 제외
plot(geo.dist.0.34, lambda.okfd,
xlab = "Distance to Calgary",
ylab = "Kriging weights",
main = "Kriging weights by 'okfd' function")
abline(h = 1/34, col = "gray", lwd = 2)
abline(h = 0, col = "blue")13.3 두 가중치 (w.k vs lambda.okfd) 의 비교
w.k (식 9.6 의 풀이) vs lambda.okfd (식 9.9 의 풀이):
대부분의 응용에서 매우 비슷 — 9.3 의 본문에서 언급. 실제 응용에서 차이는 작음.
13.4 곡선 비교
plot(okfd.res$datafd, lty = 1, col = 8, xlab = "Day",
ylab = "Temperature (degrees C)", main = "Predictions at Calgary")
lines(kriging.i.0, col = 4, lwd = 2) # 9.5 의 예측
lines(okfd.res$argvals, okfd.res$krig.new.data,
col = "red", lwd = 2) # okfd 의 예측
legend("bottomright", c("Kriged function at Calgary",
"Kriged function at Calgary using 'okfd'"),
lwd = c(2, 2, 2), col = c(1, 4, 2))13.5 직관: 두 방법의 비교
두 예측 곡선이 거의 일치 → 두 방법의 본질적 동등 의 시각적 증거.
차이가 큰 경우는 무편향 제약이 강력하게 작동 할 때 — 작은 표본, 강한 공분산 등.
13.6 비유: 두 도구의 같은 작업
같은 그림을 연필과 만년필로 그림 — 도구가 다르지만 결과가 비슷. 두 kriging 방법도 같은 사고 — 다른 framework, 비슷한 결과.
14 Problem 9.13: Figure 9.1 재현
14.1 R 코드 분석
# 데이터 준비
temp.fd <- fdata(t(Temperature), argvals = Day,
names = list(main = "Canadian Weather. Temperature",
xlab = "Day", ylab = "Temperature"))
# 함수 L2 거리 (raw, smoothing 없이)
L2norm.raw <- as.dist(metric.lp(temp.fd, lp = 2))^2
# Empirical trace variogram
emp.trace.vari <- trace.variog(coords = coordinates,
L2norm = as.matrix(L2norm.raw),
bin = TRUE)
# Exponential variogram 적합
sigma2.0 <- quantile(emp.trace.vari$v, 0.75)
phi.0 <- quantile(emp.trace.vari$Eu.d, 0.75)
fit.vari <- variofit(emp.trace.vari,
ini.cov.pars = c(sigma2.0, phi.0),
cov.model = "exponential")
# 시각화 (variogram cloud + binned + fitted)
plot(geo.dist, L2norm.raw, col = "grey")
points(emp.trace.vari$u, emp.trace.vari$v, col = "red", pch = 19)
lines(fit.vari, col = "blue", lwd = 2)14.2 가중치 계산 + 시각화
14.3 Canada 지도 위 가중치 (Problem 9.11 변형)
14.4 Figure 9.1 의 단순 vs 가중 평균
14.5 결과 해석
- 단순 평균 (점선): 남부 도시 기온이 지배 — 따뜻한 곡선.
- 가중 평균 (실선): 북부 관측소에 큰 가중치 → 더 추운 곡선.
- 차이: 약 5°C — 캐나다의 진짜 평균 vs 도시 표본 평균.
이는 공간 통계의 가치 — 단순 평균이 표본 추출 패턴 (편향) 을 그대로 반영하지만, 가중 평균이 모집단의 진짜 평균을 추정.
14.6 직관: 표본 편향의 자동 보정
캐나다 관측소가 인구 밀집 지역 (남부) 에 편중 — 표본 추출 편향. 단순 평균은 이를 그대로 반영 → 진짜 평균에서 멀어짐.
가중 평균이 공간 정보를 사용해 자동 보정 → 진짜 평균에 더 가까움.
이는 표본 통계의 일반 원칙 — 표본 추출 패턴을 보정 해야 모집단 추론이 올바름.
14.7 비유: 인구 표본의 가중
선거 여론 조사:
- 단순 평균: 도시 응답자 비율이 인구 비율보다 높으면 도시 의견이 지배 → 편향.
- 가중 평균: 인구 비율로 가중 → 진짜 모집단 의견.
캐나다 평균 기온도 같은 사고 — 공간 분포로 가중 → 진짜 모집단 평균.
15 13 문제의 통합 시각
15.1 한 줄 요약
Ch.9 의 13 개 문제는 본문의 추상 결과를 구체적 계산·수치 예제·R 코드로 정착시킨다. Problem 9.1~9.4 가 공분산의 기초 성질 + random walk 의 intrinsic stationarity (차분의 정상화), Problem 9.5~9.7 이 kriging 시스템 도출 (Lagrange multiplier 의 표준 응용), Problem 9.8 이 exponential 공분산 + 3 위치의 구체적 수치 예제 (정보 중복 보정의 직관), Problem 9.9~9.10 이 함수 일반화 (mean kriging + functional semivariogram 식 9.19 —
geofdtrace variogram 의 토대), Problem 9.11~9.13 이 R 코드 (Canada 지도 위 가중치 시각화·okfd 대안 kriging·Figure 9.1 재현). 특히 Problem 9.10 의 식 (9.19) 가 스칼라 공간 통계 도구의 함수 일반화의 다리.
15.2 그룹별 정리
| 그룹 | 문제 | 핵심 도구 |
|---|---|---|
| 공분산 기초 | 9.1~9.4 | \(C(0) \geq 0\), 대칭, \(|C(h)| \leq C(0)\), valid, semivariogram, intrinsic stationarity |
| Kriging 시스템 도출 | 9.5~9.7 | MSE, 미분, Lagrange multiplier |
| 구체적 수치 | 9.8 | Exponential 공분산, 3 위치, \(\widehat{\mu} > 2\) |
| 함수 일반화 | 9.9~9.10 | 식 (9.12), 식 (9.19) trace variogram |
| R 응용 | 9.11~9.13 | Canada 지도, okfd, Figure 9.1 |
15.3 본문과의 매핑
| 본문 절 | 관련 문제 |
|---|---|
| 9.1 (스칼라 공간 통계) | 9.1, 9.2, 9.3 (기초 성질) |
| 9.1 (kriging) | 9.5, 9.6 (시스템 도출) |
| 9.1 (kriging the mean) | 9.7 (Lagrange), 9.8 (수치) |
| 9.2 (함수 공간장) | 9.4 (random walk - intrinsic) |
| 9.3 (함수 kriging) | 9.10 (functional semivariogram) |
| 9.4 (mean kriging) | 9.9 (식 9.12 도출) |
| 9.5 (geofd) | 9.11 (Canada 지도), 9.12 (okfd), 9.13 (Figure 9.1) |
연습문제가 본문의 모든 핵심 식의 단계별 검증 + R 응용. 특히 Problem 9.10 의 식 (9.19) 가 스칼라 → 함수 일반화의 핵심 다리.
16 관련 주제
선행 지식
- FDA 9.0 — 공간 함수 데이터 (Spatial FDA) 개관
- FDA 9.1~9.2 — 스칼라 공간 통계와 함수 공간장
- FDA 9.3~9.4 — 함수 크리깅과 평균 함수 가중 추정
- FDA 9.5~9.6 — geofd 패키지와 공간 함수 데이터의 확장 주제
- FDA 4.9 — Chapter 4 연습문제 풀이
- FDA 5.9 — Chapter 5 연습문제 풀이
- FDA 6.7 — Chapter 6 연습문제 풀이
- FDA 7.6 — Chapter 7 연습문제 풀이
- FDA 8.10 — Chapter 8 연습문제 풀이
후속 주제
관련 개념
- Cauchy-Schwarz 부등식 — Problem 9.1
- Nonnegative Definite Functions — Problem 9.2
- Random Walk 와 차분의 정상화 — Problem 9.4
- Lagrange Multiplier 와 제약 최적화 — Problem 9.7, 9.9
geofdR 패키지의 okfd 함수 — Problem 9.12- Trace Variogram (Functional Variogram) — Problem 9.10 의 응용