Kwangmin Kim - FDA 9.7 — Chapter 9 연습문제 풀이

1 이 포스트의 위치

Section 9.7 의 역할

./9-0-spatial-fda.qmd 부터 ./9-3-geofd-extensions.qmd 까지 Ch.9 의 본문 6 개 절을 다뤘다. 이 포스트는 마지막 §9.7 의 13 개 연습문제를 풀이한다.

(주: Ch.9 는 §9.1~§9.7 까지 — §9.8 은 없음. §9.7 가 chapter problems 의 표준 마지막 절.)

Ch.9 본문 (§9.1~§9.6)
    ↓
Ch.9 연습문제 (§9.7, 13 문제)
    ├ 9.1~9.4: 공분산 기초 (3 성질·valid·semivariogram·random walk)
    ├ 9.5~9.7: Kriging 시스템 도출 (Lagrange multiplier)
    ├ 9.8: 구체적 수치 예제 (exponential 공분산 + 3 위치)
    ├ 9.9~9.10: 함수 일반화 (mean kriging + functional semivariogram)
    └ 9.11~9.13: R 응용 (Canada 지도·okfd·Figure 9.1)

핵심 메시지: 연습문제는 본문의 추상 결과 (변수 이름이 다양한 추상 식) 를 구체적 계산·구체적 수치 예제·R 코드로 정착시킨다. 특히 Problem 9.7 의 Lagrange multiplier 도출이 Ch.9 의 모든 가중치 시스템 (mean kriging, functional kriging) 의 표준 도구이며, Problem 9.10 의 functional semivariogram 식 (9.19) 가 geofd 의 trace variogram 의 이론적 토대.

2 Problem 9.1: 공분산의 기초 성질

2.1 문제

Second-order stationary 스칼라 random field \(\{X(s): s \in \mathbb{R}^d\}\) 의 공분산 함수 \(C\) 에 대해 다음 검증:

\(C(0) \geq 0\).
\(C(-h) = C(h)\).
\(|C(h)| \leq C(0)\).

2.2 풀이

1. \(C(0) \geq 0\):

\(C(0) = \text{Cov}(X(s), X(s)) = \text{Var}[X(s)] \geq 0\). (분산은 비음수.) \(\blacksquare\)

2. \(C(-h) = C(h)\):

\(C(-h) = \text{Cov}(X(s), X(s - h))\). 정상성으로 \(s\) 를 \(s + h\) 로 shift:

\[ C(-h) = \text{Cov}(X(s + h), X(s)) = \text{Cov}(X(s), X(s + h)) = C(h). \]

(공분산 대칭.) \(\blacksquare\)

3. \(|C(h)| \leq C(0)\):

Cauchy-Schwarz 부등식:

\[ |C(h)| = |\text{Cov}(X(s), X(s + h))| \leq \sqrt{\text{Var}[X(s)] \text{Var}[X(s + h)]} = \sqrt{C(0) \cdot C(0)} = C(0). \]

(정상성으로 두 분산 모두 \(C(0)\).) \(\blacksquare\)

2.3 직관: 공분산 함수의 기본 형태

이 세 성질이 모든 공분산 함수의 표준 특성:

\(C(0)\) — 자기 자신과의 공분산 = 분산 (양수).
\(C(-h) = C(h)\) — 좌우 대칭. 1D 시계열의 자기공분산 대칭과 같은 성질.
\(|C(h)| \leq C(0)\) — 분산을 초과하지 못함 (Cauchy-Schwarz 결과).

이 성질들이 valid covariance function 의 후보의 sanity check.

2.4 비유: 키와 키의 공분산

자신의 키와 자신의 키의 공분산 = 키의 분산 (양수). 오른쪽으로 1cm 이동 후 키와의 공분산 = 왼쪽으로 1cm 이동 후 키와의 공분산 (대칭). 다른 위치의 키와 자기 위치 키의 공분산 ≤ 자기 분산 (Cauchy-Schwarz).

자연스러운 패턴들.

3 Problem 9.2: Valid Covariance Function

3.1 문제

Second-order stationary \(X\) 의 공분산 \(C\) 에 대해 다음 nonnegative definiteness 증명:

\[ \sum_{i, j=1}^m a_i a_j C(s_i - s_j) \geq 0 \quad \forall a_i \in \mathbb{R}, s_i \in \mathbb{R}^d. \tag{9.18} \]

3.2 풀이

선형 결합 \(Y = \sum_{i=1}^m a_i X(s_i)\) 의 분산 = 비음수:

\[ 0 \leq \text{Var}[Y] = \text{Var}\left[\sum_i a_i X(s_i)\right] = \sum_{i, j} a_i a_j \text{Cov}(X(s_i), X(s_j)). \]

정상성으로 \(\text{Cov}(X(s_i), X(s_j)) = C(s_i - s_j)\):

\[ 0 \leq \sum_{i, j} a_i a_j C(s_i - s_j). \quad \blacksquare \]

3.3 “Valid” 의 의미

Valid Covariance Function

식 (9.18) 의 nonnegative definiteness 를 만족하는 함수를 valid covariance function 이라 한다.

응용에서는 종종 추정 모형 또는 데이터로부터 얻은 \(C\) 가 nonnegative definiteness 를 위배하는 경우가 있어 — 별도의 정칙화 필요.

3.4 직관: 분산이 비음수의 함의

식 (9.18) 의 본질: 분산이 비음수 라는 자명한 사실의 함수 형태.

임의의 선형 결합의 분산이 음수일 수 없음 → 그 분산을 표현하는 식이 비음수 → 공분산 함수가 nonnegative definite.

이는 모든 공분산 함수의 가장 깊은 성질 — 단순한 적률 (mean, variance) 만 가지고 함수 전체를 제약한다.

3.5 비유

회의 참석자들의 의견을 가중 평균한 합의:

합의의 분산 = 0 이상.
이 사실이 모든 가중 패턴 (양수, 음수, 영) 에 대해 동시 성립 → 의견 사이 공분산 행렬의 모든 quadratic form 이 비음수.

같은 사고가 공간 공분산에 적용 — 위치 사이 공분산의 patterns 가 분산의 비음수 성질에 의해 제약.

4 Problem 9.3: Semivariogram

4.1 문제

식 (9.2) \(\gamma(h) = C(0) - C(h)\) 검증.

4.2 풀이

Semivariogram 의 정의:

\[ \gamma(h) = \frac{1}{2} \text{Var}[X(s + h) - X(s)]. \]

분산의 전개:

\[ \text{Var}[X(s + h) - X(s)] = \text{Var}[X(s + h)] + \text{Var}[X(s)] - 2\text{Cov}(X(s + h), X(s)). \]

정상성으로 \(\text{Var}[X(s)] = \text{Var}[X(s + h)] = C(0)\), \(\text{Cov} = C(h)\):

\[ = C(0) + C(0) - 2 C(h) = 2C(0) - 2C(h). \]

절반:

\[ \gamma(h) = C(0) - C(h). \quad \blacksquare \]

4.3 직관: 두 측도의 관계

\(C(h)\): \(X(s)\) 와 \(X(s + h)\) 의 닮음 정도.
\(\gamma(h)\): 두 값의 차이 정도.

정확히 반비례 — 닮음이 크면 차이 작음, 닮음이 작으면 차이 큼.

식 (9.2) 가 이 자명한 관계를 정확한 수식으로 표현.

4.4 시각적 의미

\(h\)	\(C(h)\)	\(\gamma(h)\)	해석
0	\(C(0)\) (최댓값)	0	같은 위치, 차이 없음
작음	큼	작음	가까운 위치, 비슷
큼	작음	큼	먼 위치, 다름
∞	0	\(C(0)\)	무관, 차이 = 분산

Variogram 의 단조 증가 (대부분의 응용) ↔︎ Covariance 의 단조 감소.

5 Problem 9.4: Random Walk 의 정상성

5.1 문제

iid \(\varepsilon_i\) (mean 0, variance \(\sigma^2\)) 로 정의된 random walk:

\[ X(j) = \sum_{i=1}^j \varepsilon_i, \quad j \geq 1. \]

Random walk 가 intrinsically stationary 이지만 strictly stationary 이 아님을 보임.

5.2 Strict Stationarity 위반

\(\text{Var}[X(j)] = \sum_{i=1}^j \text{Var}[\varepsilon_i] = j \sigma^2\) — \(j\) 에 의존.

Stationarity 의 정의 (모든 적률이 \(j\) 무관) 위배. \(\blacksquare\)

5.3 Intrinsic Stationarity 검증

차이의 분산:

\[ \text{Var}[X(j + h) - X(j)] = \text{Var}\left[\sum_{i=j+1}^{j+h} \varepsilon_i\right] = h \sigma^2. \]

\(j\) 에 무관 (\(h\) 에만 의존). 따라서 intrinsically stationary. \(\blacksquare\)

5.4 직관: Random Walk 의 두 얼굴

Random walk 의 분산이 시간에 따라 누적 → 비정상.

그러나 차이 \(X(j+h) - X(j) = \sum_{i=j+1}^{j+h} \varepsilon_i\) 가 항상 \(h\) 개의 iid 항의 합 → 분산이 \(h\sigma^2\) 으로 일정.

이는 random walk 의 핵심 — 누적은 비정상이지만 증분은 정상.

5.5 비유: 인플레이션의 누적

물가 지수 = random walk:

물가 자체 — 시간에 따라 분산 누적 (비정상).
인플레이션 율 (전월 대비 증가율) — 평균/분산 일정 (정상).

차이 (증분) 가 정상 → intrinsically stationary 의 직관.

5.6 응용 의의

이 결과가 시계열 분석의 차분 (differencing) 의 토대:

비정상 시계열 → 차분으로 정상화 — random walk 의 차분 = white noise.

같은 사고가 공간 통계의 intrinsic vs strict stationarity 구별에 적용 — 더 약한 가정이 더 일반적 응용.

6 Problem 9.5: Predictor 의 무편향 + MSE 식

6.1 문제

Predictor \(\widehat{X}(s) = \mu + \sum_k w_k (X(s_k) - \mu)\) 가:

\(E[\widehat{X}(s) - X(s)] = 0\) (무편향).
식 (9.5) MSE 형태:

\[ \sigma^2(s) = C(0) + \sum_{k, j} w_k w_j C(s_k - s_j) - 2 \sum_k w_k C(s_k - s). \]

6.2 무편향 증명

\(E X(s_k) = E X(s) = \mu\) (정상성):

\[ E[\widehat{X}(s) - X(s)] = \mu + \sum_k w_k (E X(s_k) - \mu) - E X(s) = \mu + 0 - \mu = 0. \quad \blacksquare \]

6.3 MSE 도출

\(\widehat{X}(s) - X(s) = \sum_k w_k (X(s_k) - \mu) - (X(s) - \mu)\). MSE:

\[ E[\widehat{X}(s) - X(s)]^2 = \text{Var}\left[\sum_k w_k (X(s_k) - \mu) - (X(s) - \mu)\right]. \]

전개 (정상성 + 평균 0 의 변환된 변수):

\[ = \sum_{k, j} w_k w_j \text{Cov}(X(s_k), X(s_j)) - 2 \sum_k w_k \text{Cov}(X(s_k), X(s)) + \text{Var}[X(s)]. \]

정상성:

\[ = \sum_{k, j} w_k w_j C(s_k - s_j) - 2 \sum_k w_k C(s_k - s) + C(0). \quad \blacksquare \]

6.4 직관: Quadratic Form 의 표준 구조

식 (9.5) 의 형태 = \(\mathbf{w}^T \mathbf{C} \mathbf{w} - 2 \mathbf{w}^T \mathbf{c}_0 + C(0)\) — 이차 형식.

이는 표준 회귀의 SSR 과 같은 구조 — 가중치에 대한 이차 함수, 미분으로 최적화.

6.5 비유: 비용 최소화

회사의 운영 비용:

고정 비용 (\(C(0)\)).
가중치에 따른 변동 비용 (\(\mathbf{w}^T \mathbf{c}_0\)).
가중치 사이 상호작용 비용 (\(\mathbf{w}^T \mathbf{C} \mathbf{w}\)).

총 비용 최소화 = 가중치 미분 = 0 → 표준 최적화 시스템.

7 Problem 9.6: Kriging Weights System (식 9.6)

7.1 문제

식 (9.5) 를 최소화하는 가중치 \(w_1, \ldots, w_K\) 가 식 (9.6) 을 만족함:

\[ \sum_{j=1}^N C(s_k - s_j) w_j = C(s_k - s), \quad k = 1, 2, \ldots, N. \]

7.2 풀이

식 (9.5) 의 \(w_k\) 미분:

\[ \frac{\partial \sigma^2}{\partial w_k} = 2 \sum_{j=1}^N w_j C(s_k - s_j) - 2 C(s_k - s). \]

(이차 항의 미분이 선형 항을 만들어내고, cross term 의 대칭으로 2 배.)

0 으로 놓고 2 로 나눔:

\[ \sum_{j=1}^N C(s_k - s_j) w_j = C(s_k - s). \quad \blacksquare \]

7.3 직관: 표준 정규방정식

식 (9.6) 이 회귀의 정규방정식 \(\mathbf{X}^T \mathbf{X} \boldsymbol{\beta} = \mathbf{X}^T \mathbf{y}\) 와 같은 형태:

좌변: 회귀자 사이 공분산 (Gram 행렬) × 가중치.
우변: 회귀자와 반응의 공분산.

Kriging 이 본질적으로 공분산 기반의 회귀 임을 보여줌.

7.4 행렬 형태

\(\mathbf{C}_{kk'} = C(s_k - s_{k'})\), \(\mathbf{c}_0 = (C(s_1 - s), \ldots, C(s_N - s))^T\):

\[ \mathbf{C} \mathbf{w} = \mathbf{c}_0 \implies \mathbf{w} = \mathbf{C}^{-1} \mathbf{c}_0. \]

\(\mathbf{C}\) 가 비특이 (positive definite) 이면 유일한 해.

8 Problem 9.7: Lagrange Multiplier 도출 (식 9.7)

8.1 문제

Mean kriging 시스템 (식 9.7) 도출:

\(\sum_k w_k = 1\) 제약 하 \(E\left(\sum w_k X(s_k) - \mu\right)^2\) 최소화.

8.2 Lagrange Multiplier 방법 복습

Lagrange Multiplier (Apostol 1957, Ch.7)

\(f(x_1, \ldots, x_n)\) 의 극값을 \(g(x_1, \ldots, x_n) = 0\) 제약 하 찾을 때:

극값에서 \(\lambda\) 존재 + 모든 \(\ell\) 에 대해:

\[ \frac{\partial f}{\partial x_\ell}(\mathbf{x}_0) = \lambda \frac{\partial g}{\partial x_\ell}(\mathbf{x}_0). \]

8.3 풀이

목적 함수:

\[ f(\mathbf{w}) = E\left(\sum_{k=1}^N w_k X(s_k) - \mu\right)^2. \]

전개 (Problem 9.5 와 비슷, 단 \(\widehat{X}(s)\) 대신 \(\widehat{\mu}\)):

\[ f(\mathbf{w}) = \sum_{k, j} w_k w_j C(s_k - s_j) + C(0) (?) \cdots \]

(정확히는 좀 다른 형태이지만 핵심은 \(f\) 가 \(\mathbf{w}\) 의 이차 형식.)

미분:

\[ \frac{\partial f}{\partial w_n} = 2 \sum_{k=1}^N w_k C(s_k - s_n). \]

제약 함수 \(g(\mathbf{w}) = \sum w_k - 1 = 0\). 미분: \(\partial g / \partial w_n = 1\).

Lagrange:

\[ 2 \sum_{k=1}^N w_k C(s_k - s_n) = \lambda. \]

\(\lambda / 2 = r\) 로 재정의 + 제약 식 추가:

\[ \sum_{k=1}^N w_k C(s_k - s_n) = r, \quad \sum_{k=1}^N w_k = 1. \]

이는 식 (9.7). \(\blacksquare\)

8.4 직관: Lagrange Multiplier 의 의미

\(\lambda\) (또는 \(r\)) 의 의미:

제약 (sum = 1) 을 1 단위 풀었을 때 목적 함수의 변화율 — shadow price.

수학적으로: 모든 \(n\) 에서 \(\sum w_k C(s_k, s_n)\) 이 같은 값 \(r\) — 균형 상태.

8.5 비유: 균형 잡힌 분배

회사의 부서별 예산 분배:

제약: 총 예산 = 100 만원.
목표: 매출 최대화.
Lagrange: “1 만원 추가의 한계 효과” 가 모든 부서에서 동일 — 균형.

Mean kriging 의 \(r\) 도 같은 사고 — 모든 위치의 marginal 효과가 동일 한 균형 상태.

9 Problem 9.8: 구체적 수치 예제

9.1 문제

\(\{X(s), s \in \mathbb{R}\}\) 가 second-order stationary, 공분산 \(C(h) = e^{-h}\).

관측: \(s_1 = 0, s_2 = 1, s_3 = 10\), 값 \(X(s_1) = 1, X(s_2) = 2, X(s_3) = 3\).

가중치 \(w_1, w_2, w_3\) 와 \(\widehat{\mu}\) 계산. \(\widehat{\mu}\) 가 단순 평균 \((1+2+3)/3 = 2\) 보다 큰 이유 직관 설명.

9.2 공분산 행렬

\(C(h) = e^{-h}\), 거리:

쌍	거리	\(C\)
\((s_1, s_1)\)	0	1
\((s_2, s_2)\)	0	1
\((s_3, s_3)\)	0	1
\((s_1, s_2)\)	1	\(e^{-1} \approx 0.368\)
\((s_1, s_3)\)	10	\(e^{-10} \approx 0\)
\((s_2, s_3)\)	9	\(e^{-9} \approx 0\)

행렬:

\[ \mathbf{C} = \begin{pmatrix} 1 & e^{-1} & e^{-10} \\ e^{-1} & 1 & e^{-9} \\ e^{-10} & e^{-9} & 1 \end{pmatrix} \approx \begin{pmatrix} 1 & 0.368 & 0 \\ 0.368 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}. \]

9.3 Mean Kriging 시스템

식 (9.7):

\[ \sum_{k} w_k C(s_k - s_n) = r, \quad \sum w_k = 1. \]

\(e^{-9}, e^{-10} \approx 0\) 근사:

\[ w_1 + 0.368 w_2 = r, \]

\[ 0.368 w_1 + w_2 = r, \]

\[ w_3 = r, \]

\[ w_1 + w_2 + w_3 = 1. \]

9.4 풀이

첫 두 식 빼면 \((1 - 0.368)(w_1 - w_2) = 0 \implies w_1 = w_2\) (\(s_1, s_2\) 대칭).

\(w_1 = w_2 = w\), 첫 식: \(w + 0.368 w = r \implies w(1.368) = r\).

\(w_3 = r\), sum-to-1: \(2w + w_3 = 1 \implies 2w + r = 1 \implies 2w + 1.368 w = 1 \implies w = 1 / 3.368 \approx 0.297\).

\(w_3 = r = 1.368 \times 0.297 \approx 0.406\).

검증: \(w_1 + w_2 + w_3 = 0.297 + 0.297 + 0.406 \approx 1\).

9.5 \(\widehat{\mu}\) 계산

\[ \widehat{\mu} = w_1 X(s_1) + w_2 X(s_2) + w_3 X(s_3) = 0.297 \times 1 + 0.297 \times 2 + 0.406 \times 3 \approx 0.297 + 0.594 + 1.218 \approx 2.109. \]

\(\widehat{\mu} \approx 2.11 > 2\) (단순 평균).

9.6 직관: 왜 \(\widehat{\mu} > 2\) 인가

\(s_1 = 0, s_2 = 1\) 은 매우 가까움 → 정보 중복. \(s_3 = 10\) 은 멀리 떨어짐 → 독립 정보.

가까운 두 위치의 가중치 합 = \(w_1 + w_2 = 0.594\) < 2/3 = 0.667 (단순). 먼 위치의 가중치 = \(w_3 = 0.406\) > 1/3 = 0.333 (단순).

먼 위치 (\(X(s_3) = 3\), 큰 값) 에 더 큰 가중치 → 가중 평균이 더 큼.

이는 kriging the mean 의 핵심 직관: 정보 중복이 있는 위치들의 영향 감소 + 독립 정보를 가진 위치 (먼 곳) 의 영향 증가 → 균형 잡힌 평균.

9.7 비유: 인구 조사의 표본 가중

서울 5 명 + 강원 1 명 의견 평균:

단순: 서울 5/6 지배.
가중 (kriging the mean): 강원 1 명에 큰 가중치 → 지역 균형.

Problem 9.8 의 결과가 정확히 같은 사고 — 공간 정보 중복의 자동 보정.

10 Problem 9.9: 함수 Mean Kriging 시스템 (식 9.12)

10.1 문제

식 (9.11) 을 최소화하는 가중치가 식 (9.12) 를 만족함:

\[ \sum_k w_k = 1, \quad \sum_k w_k C(s_k, s_n) - r = 0, \quad n = 1, \ldots, N. \]

10.2 풀이 (Hint: Problem 9.7 와 같은 사고)

식 (9.11):

\[ f(\mathbf{w}) = E\left\|\sum_k w_k X(s_k) - \mu\right\|^2. \]

함수 노름의 평균 제곱 = 적분 + 기댓값. 전개 후 함수 공분산 (식 9.8) 을 사용:

\[ f(\mathbf{w}) = \sum_{k, \ell} w_k w_\ell C(s_k, s_\ell) - 2 \sum_k w_k C(s_k, s_\mu) + C(\cdots), \]

(단, \(C(s_k, s_\mu) = E\langle X(s_k) - \mu, ?\rangle\) 같은 형태이지만, 실제 문제 9.11 의 식은 \(\mu\) 자체가 비교 대상이므로 어떤 표준 구조.)

핵심은 \(f\) 가 \(\mathbf{w}\) 의 이차 형식이고, \(\sum w_k = 1\) 제약 하 Lagrange:

\[ \frac{\partial f}{\partial w_n} = 2 \sum_k w_k C(s_k, s_n) = \lambda \cdot 1 \implies \sum_k w_k C(s_k, s_n) = r. \]

제약 식 추가 → 식 (9.12). \(\blacksquare\)

10.3 직관: Problem 9.7 와의 동치

식 (9.12) 가 식 (9.7) 의 함수 일반화:

스칼라 공분산 \(C(s_k - s_n)\) → 함수 공분산 \(C(s_k, s_n) = E\langle X(s_k) - \mu, X(s_n) - \mu \rangle\).

같은 Lagrange multiplier 메커니즘 — 함수 차원의 일반화에서도 형식적으로 동일.

이는 Ch.9 의 일관된 패턴 — 스칼라 결과의 함수 일반화가 형식적으로 자연스러움 (9-2 에서 본 kriging 시스템과 같은 구조).

11 Problem 9.10: Functional Semivariogram (식 9.19)

11.1 문제

함수 semivariogram 정의:

\[ \gamma(s_k, s_\ell) = \frac{1}{2} E\|X(s_k) - X(s_\ell)\|^2. \]

Stationarity + isotropy 하 (식 9.19):

\[ \gamma_f(h) = C_f(0) - C_f(h), \]

\(h = \|s_k - s_\ell\|\), \(\gamma_f(h) = \gamma(s_k, s_\ell)\), \(C_f(h) = C(s_k, s_\ell)\) (식 9.8).

11.2 풀이

함수 노름의 전개:

\[ \|X(s_k) - X(s_\ell)\|^2 = \langle X(s_k) - X(s_\ell), X(s_k) - X(s_\ell) \rangle. \]

분해:

\[ = \langle X(s_k), X(s_k) \rangle - 2 \langle X(s_k), X(s_\ell) \rangle + \langle X(s_\ell), X(s_\ell) \rangle. \]

평균 차감 후 (식 9.8 의 정의):

\[ E \langle X(s_k) - \mu, X(s_\ell) - \mu \rangle = C(s_k, s_\ell). \]

따라서 (정상성 + isotropy 로 \(C(s_k, s_k) = C_f(0)\)):

\[ E \|X(s_k) - X(s_\ell)\|^2 = C_f(0) - 2 C_f(h) + C_f(0) = 2 (C_f(0) - C_f(h)). \]

절반:

\[ \gamma_f(h) = C_f(0) - C_f(h). \quad \blacksquare \]

11.3 직관: 스칼라 식 (9.2) 의 함수 일반화

스칼라:

\[ \gamma(h) = C(0) - C(h). \]

함수:

\[ \gamma_f(h) = C_f(0) - C_f(h). \]

완전히 같은 형태 — 단지 스칼라 공분산 → 함수 내적 기댓값 \(C_f\).

11.4 `geofd` 의 구현 의의

식 (9.19) 가 geofd 패키지의 trace variogram 의 이론적 토대:

Empirical \(\widehat{\gamma}_f(d)\) 계산 — \(\|X(s_k) - X(s_\ell)\|^2\) 의 거리별 평균.
모수 모형 (exponential, Matérn) 적합.
\(C_f(h) = C_f(0) - \widehat{\gamma}_f(h)\) 로 함수 공분산 추정.
Kriging 시스템 (식 9.6) 풀이.

스칼라 spatial statistics 의 모든 도구가 함수 차원에서 자동 작동 — 식 (9.19) 가 그 다리.

11.5 비유: 같은 도구, 다른 객체

망치 — 못을 박는 도구. 큰 못 (스칼라) 에 작동하면 작은 못 (함수) 에도 작동. 도구의 본질이 객체의 크기와 무관.

식 (9.19) 가 “스칼라 spatial covariance 도구가 함수 차원에서도 같은 형태로 작동” 을 보장 → geofd 의 표준 워크플로우 가능.

12 Problem 9.11: Canada 지도 위 가중치 시각화

12.1 R 코드 (코드 분석)

map('world', ylim = c(42, 78), xlim = c(-180, -40))
map('world', region = "Canada", add = TRUE, fill = TRUE, col = "lightyellow")

# 각 위치에 가중치 시각화
points(coord.34, col = 3 - sign(w.k),       # 색: 양수/음수 구분
       pch = 19,
       cex = 0.75 + 4 * abs(w.k) / max(abs(w.k)))   # 크기: 가중치 크기

# 모든 위치 검은 점 (작은) 으로 표시
points(coord.34, col = 'black', pch = 19, cex = 0.5)

# Calgary (예측 대상) 녹색 큰 점
points(coord.0[1], coord.0[2], pch = 19, col = 3, cex = 1.5)

title(main = "Kriging weights")

12.2 시각 요소 해석

Color, Size 의 의미

색: 3 - sign(w.k) — w.k 가 양수면 색 인덱스 2 (빨강), 음수면 4 (파랑), 0 이면 3 (녹색).
크기: 0.75 + 4 * abs(w.k) / max(abs(w.k)) — 가중치 절댓값에 비례 (큰 가중치 → 큰 점).
녹색 점 (Calgary): 예측 대상 위치.
검은 작은 점: 모든 관측소의 위치 표시 (참조용).

12.3 직관: 시각화의 통찰

Edmonton (Calgary 와 가장 가까움): 큰 빨강 점 — 큰 양의 가중치.
먼 관측소들: 작은 점 — 작은 가중치.
일부 가까운 관측소들: 작은 파랑 점 — 약간 음수 가중치 (정보 중복 보정).

지도 시각화로 가중치의 공간적 분포 가 도메인 직관과 일치하는지 확인.

12.4 비유: 영향력 지도

선거 결과 예측에서 각 지역의 “영향력” 을 색·크기로 시각화 — 어느 지역이 결과를 좌우하는지 한눈에 보임.

Kriging 가중치 지도도 같은 사고 — 공간 정보의 시각적 진단.

13 Problem 9.12: okfd Function (대안 Kriging)

13.1 문제 배경

geofd::okfd — 식 (9.9) 형태 (sum to 1 제약) 의 kriging:

\[ X^*(s) = \sum_{k=1}^N \lambda_k X(s_k), \quad \sum \lambda_k = 1. \]

평균 함수 추정 불요 — 무편향 제약 으로 자동 처리.

13.2 R 코드 (가중치 시각화)

lambda.okfd <- okfd.res$functional.kriging.weights
lambda.okfd <- lambda.okfd[-length(lambda.okfd)]   # 마지막 요소 제외

plot(geo.dist.0.34, lambda.okfd,
     xlab = "Distance to Calgary",
     ylab = "Kriging weights",
     main = "Kriging weights by 'okfd' function")
abline(h = 1/34, col = "gray", lwd = 2)
abline(h = 0, col = "blue")

13.3 두 가중치 (w.k vs lambda.okfd) 의 비교

w.k (식 9.6 의 풀이) vs lambda.okfd (식 9.9 의 풀이):

대부분의 응용에서 매우 비슷 — 9.3 의 본문에서 언급. 실제 응용에서 차이는 작음.

13.4 곡선 비교

plot(okfd.res$datafd, lty = 1, col = 8, xlab = "Day",
     ylab = "Temperature (degrees C)", main = "Predictions at Calgary")
lines(kriging.i.0, col = 4, lwd = 2)                          # 9.5 의 예측
lines(okfd.res$argvals, okfd.res$krig.new.data,
      col = "red", lwd = 2)                                    # okfd 의 예측
legend("bottomright", c("Kriged function at Calgary",
                         "Kriged function at Calgary using 'okfd'"),
       lwd = c(2, 2, 2), col = c(1, 4, 2))

13.5 직관: 두 방법의 비교

두 예측 곡선이 거의 일치 → 두 방법의 본질적 동등 의 시각적 증거.

차이가 큰 경우는 무편향 제약이 강력하게 작동 할 때 — 작은 표본, 강한 공분산 등.

13.6 비유: 두 도구의 같은 작업

같은 그림을 연필과 만년필로 그림 — 도구가 다르지만 결과가 비슷. 두 kriging 방법도 같은 사고 — 다른 framework, 비슷한 결과.

14 Problem 9.13: Figure 9.1 재현

14.1 R 코드 분석

# 데이터 준비
temp.fd <- fdata(t(Temperature), argvals = Day,
                 names = list(main = "Canadian Weather. Temperature",
                              xlab = "Day", ylab = "Temperature"))

# 함수 L2 거리 (raw, smoothing 없이)
L2norm.raw <- as.dist(metric.lp(temp.fd, lp = 2))^2

# Empirical trace variogram
emp.trace.vari <- trace.variog(coords = coordinates,
                                L2norm = as.matrix(L2norm.raw),
                                bin = TRUE)

# Exponential variogram 적합
sigma2.0 <- quantile(emp.trace.vari$v, 0.75)
phi.0 <- quantile(emp.trace.vari$Eu.d, 0.75)
fit.vari <- variofit(emp.trace.vari,
                     ini.cov.pars = c(sigma2.0, phi.0),
                     cov.model = "exponential")

# 시각화 (variogram cloud + binned + fitted)
plot(geo.dist, L2norm.raw, col = "grey")
points(emp.trace.vari$u, emp.trace.vari$v, col = "red", pch = 19)
lines(fit.vari, col = "blue", lwd = 2)

14.2 가중치 계산 + 시각화

# 공분산 행렬
hat.C <- cov.spatial(emp.trace.vari$Eu.d,
                      cov.model = fit.vari$cov.model,
                      cov.pars = fit.vari$cov.pars)

# Mean kriging 가중치
inv.hat.C <- solve(hat.C)
v <- apply(inv.hat.C, 1, sum)
w <- v / sum(v)

# 가중치 도표
plot(w)
abline(h = 1/35, col = "gray", lwd = 2)   # 단순 평균
abline(h = 0, col = "blue")

14.3 Canada 지도 위 가중치 (Problem 9.11 변형)

map('world', ylim = c(42, 78), xlim = c(-180, -40))
map('world', region = "Canada", add = TRUE, fill = TRUE, col = "lightyellow")
points(coordinates, col = 3 - sign(w), pch = 19, cex = 1 + abs(w) * 35)
points(coordinates, col = 'black', pch = 19, cex = 0.5)

14.4 Figure 9.1 의 단순 vs 가중 평균

# 단순 평균
mean.temp <- apply(t(Temperature), 2, mean)

# 가중 평균
w.mean.temp <- w %*% t(Temperature)

# 시각화
plot(temp.fd, col = 8, main = "")           # 회색: 35 개 곡선
lines(Day, mean.temp, lty = 2, lwd = 2)     # 점선: 단순 평균
lines(Day, w.mean.temp, lwd = 2)             # 실선: 가중 평균

14.5 결과 해석

Figure 9.1 의 메시지

단순 평균 (점선): 남부 도시 기온이 지배 — 따뜻한 곡선.
가중 평균 (실선): 북부 관측소에 큰 가중치 → 더 추운 곡선.
차이: 약 5°C — 캐나다의 진짜 평균 vs 도시 표본 평균.

이는 공간 통계의 가치 — 단순 평균이 표본 추출 패턴 (편향) 을 그대로 반영하지만, 가중 평균이 모집단의 진짜 평균을 추정.

14.6 직관: 표본 편향의 자동 보정

캐나다 관측소가 인구 밀집 지역 (남부) 에 편중 — 표본 추출 편향. 단순 평균은 이를 그대로 반영 → 진짜 평균에서 멀어짐.

가중 평균이 공간 정보를 사용해 자동 보정 → 진짜 평균에 더 가까움.

이는 표본 통계의 일반 원칙 — 표본 추출 패턴을 보정 해야 모집단 추론이 올바름.

14.7 비유: 인구 표본의 가중

선거 여론 조사:

단순 평균: 도시 응답자 비율이 인구 비율보다 높으면 도시 의견이 지배 → 편향.
가중 평균: 인구 비율로 가중 → 진짜 모집단 의견.

캐나다 평균 기온도 같은 사고 — 공간 분포로 가중 → 진짜 모집단 평균.

15 13 문제의 통합 시각

15.1 한 줄 요약

Ch.9 의 13 개 문제는 본문의 추상 결과를 구체적 계산·수치 예제·R 코드로 정착시킨다. Problem 9.1~9.4 가 공분산의 기초 성질 + random walk 의 intrinsic stationarity (차분의 정상화), Problem 9.5~9.7 이 kriging 시스템 도출 (Lagrange multiplier 의 표준 응용), Problem 9.8 이 exponential 공분산 + 3 위치의 구체적 수치 예제 (정보 중복 보정의 직관), Problem 9.9~9.10 이 함수 일반화 (mean kriging + functional semivariogram 식 9.19 — geofd trace variogram 의 토대), Problem 9.11~9.13 이 R 코드 (Canada 지도 위 가중치 시각화·okfd 대안 kriging·Figure 9.1 재현). 특히 Problem 9.10 의 식 (9.19) 가 스칼라 공간 통계 도구의 함수 일반화의 다리.

15.2 그룹별 정리

그룹	문제	핵심 도구
공분산 기초	9.1~9.4	\(C(0) \geq 0\), 대칭, \(\|C(h)\| \leq C(0)\), valid, semivariogram, intrinsic stationarity
Kriging 시스템 도출	9.5~9.7	MSE, 미분, Lagrange multiplier
구체적 수치	9.8	Exponential 공분산, 3 위치, \(\widehat{\mu} > 2\)
함수 일반화	9.9~9.10	식 (9.12), 식 (9.19) trace variogram
R 응용	9.11~9.13	Canada 지도, okfd, Figure 9.1

15.3 본문과의 매핑

본문 절	관련 문제
9.1 (스칼라 공간 통계)	9.1, 9.2, 9.3 (기초 성질)
9.1 (kriging)	9.5, 9.6 (시스템 도출)
9.1 (kriging the mean)	9.7 (Lagrange), 9.8 (수치)
9.2 (함수 공간장)	9.4 (random walk - intrinsic)
9.3 (함수 kriging)	9.10 (functional semivariogram)
9.4 (mean kriging)	9.9 (식 9.12 도출)
9.5 (geofd)	9.11 (Canada 지도), 9.12 (okfd), 9.13 (Figure 9.1)

연습문제가 본문의 모든 핵심 식의 단계별 검증 + R 응용. 특히 Problem 9.10 의 식 (9.19) 가 스칼라 → 함수 일반화의 핵심 다리.

16 관련 주제

선행 지식

후속 주제

관련 개념

Cauchy-Schwarz 부등식 — Problem 9.1
Nonnegative Definite Functions — Problem 9.2
Random Walk 와 차분의 정상화 — Problem 9.4
Lagrange Multiplier 와 제약 최적화 — Problem 9.7, 9.9
geofd R 패키지의 okfd 함수 — Problem 9.12
Trace Variogram (Functional Variogram) — Problem 9.10 의 응용