1 두 절의 역할
| 절 | 주제 | 핵심 도구 |
|---|---|---|
| 5.7 | 함수 선형 모형의 타당성 진단 | FPC 점수 쌍별 산점도 + 식 (5.23) 유도 |
| 5.8 | Ch.5 의 확장과 참고문헌 | Mixed model 일반화, 희소 데이터, 오차 상관 검정 등 |
5.7 은 추정 후 진단 — Ch.5 의 모형들을 적합한 후 “정말 선형 모형이 적절했는가” 를 점검한다. 표준 선형 회귀에서 산점도 + 잔차 도표가 진단의 핵심인 것처럼, 함수 회귀에서도 시각적 도구가 필요하다.
5.8 은 이 챕터를 넘어선 발전 — Ch.5 의 단순 모형이 어떻게 일반화되는가의 지도. 환자별·방문별 종단 데이터, 희소 관측, 시간 의존 오차 등 실무에서 마주치는 복잡성을 다룬 후속 연구의 좌표를 제공한다.
두 절을 합쳐 보면, 5.1~5.6 의 추정·검정 framework 가 “어떻게 사용되는가(5.7)” 와 “어디로 향하는가(5.8)” 의 그림이 완성된다.
2 진단의 동기
2.1 표준 선형 회귀의 산점도 진단
스칼라 단순 회귀 \(y_i = a + b x_i + \varepsilon_i\) 의 적절성 점검:
- \((x_i, y_i)\) 의 산점도를 그린다.
- 점들이 직선 패턴을 보이는지 확인.
- 명백한 곡선 패턴(2차, 사다리, 분리된 군집) 이 보이면 선형 모형 부적절.
표본이 공동 정규(jointly normal) 이면 산점도가 럭비공(football) 모양 — 한 축이 회귀 직선, 그 주위에 정규 잡음.
2.2 함수 회귀로의 확장
같은 원리를 함수 회귀 (5.10) \(Y_i(t) = \alpha(t) + \int \psi(t, s) X_i(s) \, ds + \varepsilon_i(t)\) 에 적용. 두 가지 변경이 필요하다.
- 여러 회귀자가 있으면 — 반응 vs 각 회귀자의 산점도를 모두 검사 (스칼라 다중 회귀에서도 같음).
- 함수가 등장하면 — 함수를 직접 그릴 수 없으므로 추정된 EFPC 의 점수로 대체. 점수는 스칼라이므로 일반적인 산점도 가능.
2.3 직관: 함수를 “압축” 해서 보다
함수 자체는 1차원에 표시할 수 없다. 두 곡선의 산점도(원시 형태) 는 평면에 그려지지 않는다 — 두 곡선을 비교하려면 한 차원으로 압축해야 한다.
EFPC 점수가 그 압축이다. 각 함수의 가장 정보량 큰 차원 을 한 스칼라 값으로 요약하므로, 두 함수 사이의 관계가 점수 산점도로 시각화 가능하다.
비유 — 고차원 데이터의 PCA 시각화. 100차원 데이터를 그릴 수는 없지만 첫 두 주성분으로 사영하여 2D 산점도로 패턴을 본다. 함수 회귀의 진단도 같은 원리이다.
3 진단 절차
3.1 핵심 산점도
\(X_i, Y_i\) 의 EFPC 점수를 계산:
\[ \xi_{ij} = \langle X_i, \widehat{v}_j \rangle, \quad \zeta_{ik} = \langle Y_i, \widehat{u}_k \rangle. \]
가능한 모든 \((j, k)\) 쌍에 대해 산점도 \((\xi_{ij}, \zeta_{ik})\) 를 그린다. 보통 첫 2-3 개 PC 만으로 충분 — \(j, k \in \{1, 2, 3\}\) 의 9 개 산점도.
3.2 패턴 해석
| 산점도 형태 | 함의 |
|---|---|
| 직선 (또는 럭비공) | 선형 가정 충족, 공동 정규에 가까움 |
| 명백한 2차 곡선 | 비선형성 — 함수 GAM 등 비선형 모형 검토 |
| 사다리 / 분리된 군집 | 잠재 그룹 구조 — 잠재 변수, mixture model 검토 |
| 무패턴 (구름) | 효과 없음 또는 잡음 우세 — 5.6 검정과 일치 확인 |
3.3 비선형 시뮬레이션 예시 (Kokoszka 책의 Figure 5.7)
비선형 회귀:
\[ Y_i(t) = H_2(X_i(t)) + \varepsilon_i(t), \quad H_2(x) = x^2 - 1, \quad i = 1, \ldots, 40. \]
이는 함수 선형 모형 (5.10) 이 아니다 — 적분 변환이 아닌 점별 비선형 함수. 그러나 표면적으로 비슷한 함수-on-함수 데이터로 보일 수 있다.
진단:
- \((\xi_{i1}, \zeta_{i1})\) 산점도 → 명백한 2차 곡선 패턴. 선형 모형 부적절.
- \((\xi_{i2}, \zeta_{i1})\), \((\xi_{i1}, \zeta_{i2})\) 등 → 일부도 비선형 패턴, 일부는 평이.
3.4 직관: 첫 PC 쌍이 가장 민감한 이유
\(X\) 의 가장 변동이 큰 방향(\(v_1\)) 을 통과하는 비선형성이 데이터의 가장 큰 비선형 신호이다. 따라서 \(\xi_{i1}\) vs \(\zeta_{i1}\) 산점도가 비선형성 검출에 가장 민감.
후순위 PC 쌍은 변동이 작고 잡음 비중이 높아 비선형 패턴이 잡음에 묻힐 수 있다. 따라서 진단의 우선순위는 첫 PC 쌍부터 시작 하여 점진적으로 후순위로.
3.5 비유: 진료의 1차 검진과 정밀 검진
종합 건강 검진에서 가장 흔한 이상(혈압·혈당·콜레스테롤) 부터 검사한 후, 이상이 있으면 정밀 검진으로 넘어간다. 함수 회귀 진단도 같은 패턴 — 첫 PC 쌍에서 이상 발견 → 후순위 PC 쌍 또는 다른 진단 도구로 정밀 검사.
4 진단의 수학적 정당화
4.1 출발: FPC 전개로 모형 다시 쓰기
함수 선형 모형 (5.10) 에 KL 전개를 평균 함수와 함께 대입:
\[ Y_i(t) = \mu_Y(t) + \sum_{k=1}^{\infty} \zeta_{ik} u_k(t), \quad X_i(s) = \mu_X(s) + \sum_{j=1}^{\infty} \xi_{ij} v_j(s). \]
(5.10) 에 대입하고 정리:
\[ \mu_Y(t) + \sum_{k} \zeta_{ik} u_k(t) = \alpha(t) + \int \psi(t, s) \left[\mu_X(s) + \sum_{j} \xi_{ij} v_j(s)\right] ds + \varepsilon_i(t). \]
4.2 새 함수의 정의
\[ g(t) = \alpha(t) + \int \psi(t, s) \mu_X(s) \, ds, \quad h_j(t) = \int \psi(t, s) v_j(s) \, ds. \]
여기서 \(g\) 는 평균 회귀자에 의해 변환된 절편 + 평균 효과, \(h_j\) 는 \(X\) 의 \(j\) 번째 PC 가 핵을 통과한 결과.
4.3 양변에 u_ℓ 을 곱하고 적분
\(\{u_k\}\) 의 정규직교성 사용:
\[ \langle \mu_Y, u_\ell \rangle + \zeta_{i\ell} = \langle g, u_\ell \rangle + \sum_{j=1}^{\infty} \xi_{ij} \langle h_j, u_\ell \rangle + \langle \varepsilon_i, u_\ell \rangle. \]
새 표기 도입:
- \(a_\ell = \langle g - \mu_Y, u_\ell \rangle\)
- \(b_{\ell j} = \langle h_j, u_\ell \rangle\)
- \(\varepsilon_{i\ell} = \langle \varepsilon_i, u_\ell \rangle\)
4.4 핵심 식 (5.23)
위 등식에서 \(\langle \mu_Y, u_\ell \rangle\) 를 우변으로 옮기고 한 \(j\) 만 분리:
\[ \boxed{ \zeta_{i\ell} = a_\ell + b_{\ell j} \xi_{ij} + \eta_{i, \ell j} } \tag{5.23} \]
여기서 잡음 항:
\[ \eta_{i, \ell j} = \sum_{j' \neq j} b_{\ell j'} \xi_{i j'} + \varepsilon_{i\ell}. \]
4.5 식 (5.23) 의 해석
이 식이 진단의 수학적 토대.
고정된 \(\ell, j\) 에 대해, \(\zeta_{i\ell}\) 와 \(\xi_{ij}\) 는 단순 선형 회귀 관계 \(\zeta = a + b\xi + \eta\).
따라서 함수 선형 모형 (5.10) 이 참이라면 모든 \((\ell, j)\) 쌍의 점수가 (잡음을 갖긴 하지만) 선형 관계 를 만족해야 한다. 산점도가 비선형 패턴을 보이면 모형 위반.
4.6 직관: 분해의 의미
식 (5.23) 의 본질:
- \(a_\ell\) — 절편 (평균 효과의 PC 점수).
- \(b_{\ell j}\) — \(\xi_{ij}\) 와 \(\zeta_{i\ell}\) 사이의 진짜 선형 관계 강도. 5.5 의 분해 계수 \(\psi_{\ell j}\) 와 사실상 같은 양이다 (\(v_j\) 가 정규직교이므로 \(\langle h_j, u_\ell \rangle = \int \int \psi(t, s) v_j(s) u_\ell(t) \, ds \, dt = \psi_{\ell j}\)).
- \(\eta_{i, \ell j}\) — 다른 PC 들의 기여 (\(\sum_{j' \neq j} b_{\ell j'} \xi_{ij'}\)) + 잔차 (\(\varepsilon_{i\ell}\)).
4.7 잡음 항의 성질
- 평균 0: \(E[\eta_{i, \ell j}] = 0\).
- 회귀자와 비상관: \(E[\eta_{i, \ell j} \xi_{ij}] = 0\).
- 단위 간 비상관: \(E[\eta_{i, \ell j} \eta_{i', \ell j}] = 0\) (\(i \neq i'\)).
이 성질들은 표준 단순 선형 회귀의 잔차와 동일 — 단순 OLS 의 모든 추론 도구가 적용 가능.
4.8 공동 정규성과 럭비공 모양
\(X\) 와 \(Y\) 가 공동 가우스 random function 이면 \(u_\ell, v_j\) 위의 사영 \(\xi_{ij}, \zeta_{i\ell}\) 도 공동 가우스. 따라서 산점도는 공동 정규의 럭비공 모양 — 한 축이 회귀 직선, 그 주위에 등방향 잡음 분산.
가우스 가정이 깨져도 식 (5.23) 의 분해 자체는 유효 — 단지 산점도가 럭비공이 아닐 수 있고, 비선형성과 비가우스성을 구별하기 어려워질 수 있다.
4.9 직관: 왜 단순 선형 회귀로 환원되는가
함수 회귀가 무한차원 적분 변환이지만, EFPC 점수 좌표계에서 보면 단순 회귀들의 모음 — 5.5 에서 본 분해의 또 다른 표현이다.
식 (5.23) 은 5.5 의 추정 식 (5.17) 과 같은 사실의 다른 측면 — 추정에서는 분해 계수를 점수 공분산으로 표현, 진단에서는 점수 자체의 선형 관계를 시각화.
이것이 함수 회귀의 가장 매력적 특성 중 하나 — 무한차원 객체를 유한 차원 산점도로 진단할 수 있다는 점.
5 다른 함수 회귀 모형의 진단
5.1 함수-on-스칼라 (Problem 5.11)
모형 \(Y_i(t) = \sum_k x_{ik} \beta_k(t) + \varepsilon_i(t)\) 의 진단:
- \(\zeta_{ik} = \langle Y_i, \widehat{u}_k \rangle\) — 반응 함수의 PC 점수.
- \(x_{i\ell}\) — \(\ell\) 번째 스칼라 회귀자 (이미 스칼라).
- 산점도 \((x_{i\ell}, \zeta_{ik})\) 의 패턴 검사.
식 (5.23) 의 단순 버전:
\[ \zeta_{ik} = a_k + b_{k\ell} x_{i\ell} + \eta_{i, k\ell}. \]
5.2 스칼라-on-함수 (Problem 5.12)
모형 \(Y_i = \int \beta(s) X_i(s) \, ds + \varepsilon_i\) 의 진단:
- \(Y_i\) — 이미 스칼라.
- \(\xi_{ij} = \langle X_i, \widehat{v}_j \rangle\) — 회귀자의 PC 점수.
- 산점도 \((\xi_{ij}, Y_i)\) 의 패턴 검사.
이 경우는 표준 단순 회귀 산점도 형태 그대로 — 스칼라 vs 스칼라.
5.3 직관: 일관된 패턴
세 함수 회귀 형태 모두 진단의 핵심 아이디어가 같다:
함수를 PC 점수로 환원하고, 결과 스칼라들 사이의 산점도 패턴을 본다.
차이는 어느 쪽 함수를 환원하느냐 — 양쪽 모두(함수-on-함수), 반응만(함수-on-스칼라), 회귀자만(스칼라-on-함수).
이 일관성이 FDA 의 통합된 진단 framework 를 가능하게 한다.
6 진단의 실무 워크플로우
- 모형 적합 — 5.3~5.6 의 도구로 핵 또는 효과 함수 추정.
- EFPC 추정 —
pca.fd등으로 \(X, Y\) 의 첫 몇 PC 와 점수 계산. - 점수 산점도 행렬 생성 — 첫 2-3 개 PC 의 모든 쌍에 대해.
- 시각적 검사:
- 직선/럭비공 → 선형 가정 OK.
- 곡선 패턴 → 비선형성 의심.
- 군집 → 잠재 그룹 의심.
- 사후 조치:
- 비선형성 → 함수 GAM (Ch.4.8) 또는 함수 GLM (Ch.6).
- 잠재 그룹 → mixture model 또는 stratified analysis.
- 효과 없음 (구름) → 5.6 검정으로 확인 후 모형 폐기 검토.
6.1 R 구현 예시
library(fda)
# 1. X, Y 의 fd 객체와 EFPC 가 이미 계산되어 있다고 가정
# X_pca <- pca.fd(X_fd_centered, nharm = 3)
# Y_pca <- pca.fd(Y_fd_centered, nharm = 3)
xi_scores <- X_pca$scores # N x 3
zeta_scores <- Y_pca$scores # N x 3
# 2. 9 개 산점도 행렬 (첫 3 PC 쌍)
par(mfrow = c(3, 3), mar = c(4, 4, 2, 1))
for (j in 1:3) {
for (k in 1:3) {
plot(xi_scores[, j], zeta_scores[, k],
xlab = bquote(xi[.(j)]),
ylab = bquote(zeta[.(k)]),
main = paste0("X PC", j, " vs Y PC", k),
pch = 19, cex = 0.7,
col = rgb(0, 0, 0, 0.5))
# 보조선: OLS 적합
fit <- lm(zeta_scores[, k] ~ xi_scores[, j])
abline(fit, col = "red", lty = 2)
# 보조선: LOWESS — 비선형성 검출
lo <- lowess(xi_scores[, j], zeta_scores[, k])
lines(lo, col = "blue", lwd = 1.5)
}
}6.2 직관: OLS 와 LOWESS 의 두 보조선
- 빨간 점선 (OLS): 식 (5.23) 의 진짜 선형 관계 \(a + b \xi\). 데이터가 선형이라면 점들이 이 선 주위에 밀집.
- 파란 실선 (LOWESS): 데이터의 국소 평균 추세. 선형이라면 빨간 점선과 거의 일치, 비선형이면 두 선이 갈라진다.
두 선의 차이가 비선형성의 시각적 증거 — 큰 차이는 선형 모형 부적절.
6.3 비유: 그래프 종이의 격자선
표준 그래프 종이에는 직선 격자가 그려져 있어 데이터의 비선형 패턴이 직관적으로 보인다. OLS 직선이 격자선 이고 LOWESS 가 데이터의 진짜 형태 이다 — 두 선이 일치하면 격자에 맞는(선형) 데이터, 갈라지면 격자를 벗어난(비선형) 데이터.
7 비선형성 검출 후의 대응
7.1 비선형 함수 모형의 선택지
| 비선형 형태 | 권장 모형 | 도구 |
|---|---|---|
| 점별 비선형 (\(Y(t) = H(X(t))\)) | 함수 GAM (Ch.4.8) | refund::pfr + af() |
| 단일 인덱스 (\(Y = g(\int \beta X)\)) | 단일 인덱스 함수 회귀 | 사용자 정의 ML |
| 비정규 반응 (이진·카운트) | 함수 GLM (Ch.6) | refund::pfr + family |
| 잠재 그룹 | Functional mixture model | funFEM, funHDDC |
| 시간 의존 효과 | Mixed model (Scheipl 2015) | refund::pffr |
7.2 직관: 진단 → 모형 변경의 사이클
선형 모형 → 진단 → 비선형 검출 → 비선형 모형 → 다시 진단 → … 의 반복은 표준 통계 모델링의 일반 패턴이며, 함수 회귀에서도 같다.
핵심은 진단을 적합 후에 무조건 한다 는 습관 — 적합 결과만 보고 모형을 신뢰하지 않고, 진단으로 가정을 검증하는 절차를 routine 으로 만든다.
8 확장과 참고문헌 (Section 5.8)
8.1 종합 리뷰
Morris (2015) — 함수 회귀 문헌의 광범위한 리뷰. Ch.5 의 모형들을 broader literature context 에서 위치시키는 출발점.
8.2 절별 출처
| 절 | 출처 | 기여 |
|---|---|---|
| 5.1 | Faraway (1997) | 자동차 대시보드 각도 운동 데이터, 함수-on-스칼라 OLS |
| 5.2 | Reiss et al. (2010) | 식 (5.6) 과 (5.9) 의 유도, GLS 구현 |
| 5.3 | Ivanescu et al. (2015) | mixed model 연결, sparse 곡선 처리, pffr 의 이론적 토대 |
8.3 Scheipl et al. (2015): 일반화된 mixed model framework
5.3, 5.4 의 방법론을 크게 확장. 모형:
\[ Y_i(t) = \mu_i(t) + \varepsilon_i(t), \]
여기서 평균 함수 \(\mu_i(t)\) 가 스칼라·함수·범주형 회귀자에 복잡하게 의존.
8.4 의학 연구 예시
인덱스 \(i = (\iota, \kappa)\) 가 두 성분:
- \(\iota\) — 환자.
- \(\kappa\) — 같은 환자의 의료 방문 (visit).
각 환자의 변수:
- \(d(\iota) \in \{0, 1\}\) — 질병 여부.
- \(g(\iota) \in \{0, 1\}\) — 성별 (남성=1).
- \(u(\iota, \kappa) \in \mathbb{R}\) — \(\kappa\) 번째 방문 시 환자의 나이 (시간 가변).
평균 함수:
\[ \begin{aligned} \mu_{\iota \kappa}(t) &= \alpha_1(d(\iota), t) + \alpha_2(g(\iota), t) + \alpha_3(u(\iota, \kappa), t) \\ &\quad + \int_{\mathcal{S}} \psi_1(d(\iota), t, s) X_{1, \iota \kappa}(s) \, ds \\ &\quad + \int_{\mathcal{R}} \psi_2(d(\iota), t, r) X_{2, \iota \kappa}(r) \, dr. \end{aligned} \]
8.5 직관: 무엇이 일반화되었는가
식 (5.11) 의 단순 모형과 비교:
| 측면 | (5.11) | Scheipl 모형 |
|---|---|---|
| 인덱스 | 단일 \(i\) | 환자-방문 (\(\iota, \kappa\)) |
| 절편 구조 | 단일 \(\alpha(t)\) | \(\alpha_1(0,\cdot), \alpha_1(1,\cdot), \alpha_2(0,\cdot), \alpha_2(1,\cdot), \alpha_3\) — 5 개 함수 |
| 핵 구조 | 단일 \(\psi(t, s)\) | \(\psi(d(\iota), t, s)\) — 질병 여부에 따라 다른 핵 |
| 회귀자 | 시간 불변 | 시간 가변 (\(X_{1, \iota\kappa}\)) |
| 종속성 | iid | 환자 내 방문 사이 종속 (mixed model) |
이는 현실 의학 데이터의 복잡성을 반영 — 같은 환자의 반복 측정, 질병 그룹별 다른 효과, 나이에 따른 변화. pffr 는 이런 모형을 처리하는 도구로 진화했다.
8.6 응용 예시: 뇌영상 의학 연구
Scheipl et al. (2015) 의 실제 응용:
- \(X_{1, \iota \kappa}, X_{2, \iota \kappa}\) — 환자 \(\iota\) 의 \(\kappa\) 번째 방문에서 측정한 뇌의 두 트랙트(white matter tract) 의 신호 곡선.
- \(Y_{\iota \kappa}\) — 다른 트랙트의 신호 곡선.
- 가설: “두 트랙트의 신호 패턴이 세 번째 트랙트를 예측하며, 질병 환자에서 그 패턴이 다르다.”
5.7 의 진단 도구는 이런 복잡한 모형에서도 작동 — 핵 단위로 점수 산점도를 확인하여 선형성을 점검한다.
9 희소 데이터로의 확장
9.1 Yao et al. (2005) — PACE
Section 5.5 의 FPC 기반 추정을 희소(sparse) 관측 으로 확장. 종단 연구에서 각 환자가 소수의 불규칙 시점에서만 관측되는 경우.
핵심 아이디어:
- 환자별 곡선을 직접 평활할 수 없음 (관측점 부족).
- 피험자 간 정보 풀링(pooling) — 모든 환자의 데이터를 합쳐 평균 함수와 공분산 함수를 추정.
- PACE (Principal Analysis by Conditional Expectation) — 추정된 공분산의 고유분해 + 조건부 기대로 개별 곡선의 PC 점수 예측.
자세한 내용은 Ch.7 (희소 FDA).
9.2 직관: 정보 풀링의 동기
한 환자가 5 시점만 관측해서는 곡선의 형태를 알 수 없다. 그러나 100 명의 환자가 각자 5 시점씩 (서로 다른 시점에) 관측하면, 합쳐서 시간 도메인 전체를 잘 덮는다. 환자 간의 정보 공유 가 개별 곡선 추정의 토대.
이는 mixed model 의 random effect 와 같은 통계 철학 — 개체별 정보가 부족하면 모집단 수준에서 정보를 빌려온다.
10 효과 없음 검정의 후속 발전
10.1 Kokoszka et al. (2008)
Section 5.6 의 카이제곱 검정의 원논문. Space physics 데이터(우주 자기장, 태양풍 변동 등) 에 적용.
확장 형태와 추가 예시는 Horváth & Kokoszka (2012) Ch.9 참조.
10.2 Chiou & Müller (2007)
Section 5.7 의 산점도 진단 방법의 원논문. 다양한 종류의 산점도(점수 vs 점수, 점수 vs 잔차 등) 도 함께 제안.
10.3 Gabrys et al. (2010)
오차 함수의 독립성 검정. 모형:
\[ Y_i(t) = \int \psi(t, s) X_i(s) \, ds + \varepsilon_i(t), \]
에서 \(\{\varepsilon_i\}\) 가 iid 인지 vs 시간 시리즈 의존성을 가지는지 검정.
10.4 직관: 왜 오차 독립성을 검정하는가
5.6 의 카이제곱 검정 분포는 \(\varepsilon_i\) 의 iid 가정에 의존. 만약 오차에 시간 종속성이 있으면 (예: 함수 시계열 데이터) \(\chi^2_{pq}\) 가 잘못된 분포 — 1종 오류율 부정확.
Gabrys et al. (2010) 의 검정으로 iid 가정을 사전 확인하면, 5.6 의 검정 결과를 더 신뢰할 수 있다. iid 가 거부되면 함수 시계열 framework (Ch.8) 로 전환.
11 Ch.5 발전의 통합 시각
11.1 시간순 발전 지도
1997: Faraway — 자동차 대시보드, 함수-on-스칼라 OLS의 첫 응용
2005: Yao et al. — PACE, 희소 데이터의 FPC 추정
2007: Chiou & Müller — 산점도 진단 (5.7 토대)
2008: Kokoszka et al. — 카이제곱 효과 없음 검정 (5.6 토대)
2010: Gabrys et al. — 오차 독립성 검정
2010: Reiss et al. — 식 (5.6), (5.9) 유도, GLS
2015: Ivanescu et al. — mixed model 연결, pffr 도입
2015: Scheipl et al. — Mixed model 확장 (의학 데이터)
11.2 발전의 두 축
| 축 | 방향 | 대표 연구 |
|---|---|---|
| 모형 일반화 | 단순 → 복잡 | Faraway → Scheipl |
| 데이터 확장 | 밀집 → 희소·종속 | Yao (희소), Gabrys (종속) |
| 추론 도구 | 추정 → 검정·진단 | Reiss → Kokoszka → Chiou |
Ch.5 가 다룬 framework — 선형 + 밀집 + iid 오차 — 가 이 모든 확장의 출발점이며, 후속 발전은 가정을 하나씩 완화한 일반화이다.
12 두 절의 통합 시각
12.1 한 줄 요약
함수 선형 모형의 타당성은 EFPC 점수 산점도로 진단한다 — 식 (5.23) 의 ζ_iℓ = a_ℓ + b_ℓj ξ_ij + η_i,ℓj 가 보장하듯, 진정 선형 모형이라면 모든 PC 쌍의 산점도가 선형 패턴을 보여야 한다. 비선형성이 검출되면 함수 GAM·GLM·mixture 등의 확장으로 전환하며, 이 framework 는 Scheipl·Yao·Kokoszka·Chiou-Müller 등의 후속 연구로 mixed model·희소 데이터·검정 도구로 확장되었다.
12.2 Ch.5 전체의 통합
5.1~5.8 의 흐름을 한눈에:
| 절 | 핵심 | 역할 |
|---|---|---|
| 5.1 | 함수-on-스칼라 OLS | 가장 단순한 출발점 |
| 5.2 | 벌점 추정 | 잡음 반응 처리 |
| 5.3 | 함수-on-함수 + 라플라시안 벌점 | 일반화된 핵 추정 |
| 5.4 | refund (fosr, pffr) |
실무 도구 |
| 5.5 | FPCA 기반 분해 | 효율적 대안 |
| 5.6 | 효과 없음 검정 | 사전·사후 검증 |
| 5.7 | 선형성 진단 | 모형 가정 점검 |
| 5.8 | 확장과 참고문헌 | 다음 연구 방향 |
5.1~5.4 가 추정 도구, 5.5~5.6 이 효율적 대안과 검정, 5.7~5.8 이 진단과 미래 의 역할.
12.3 Chapter 5 너머
| 다음 챕터 | 5.7~5.8 의 도구를 어떻게 활용하는가 |
|---|---|
| Ch.6 함수 GLM | 비정규 함수 반응 — 5.7 산점도 진단으로 비선형성 검출 후의 대안 |
| Ch.7 희소 FDA | 5.8 의 Yao et al. (2005) PACE 가 핵심 도구 |
| Ch.8 함수 시계열 | 5.8 의 Gabrys et al. (2010) 가 iid 가정 검증의 토대 |
| Ch.12 추론 | 5.6 의 카이제곱 framework 가 평균·공분산 검정으로 확장 |
5.7 의 진단 도구는 모든 후속 챕터에서 모형 정당화의 표준이며, 5.8 의 확장 지도는 FDA 연구의 현 위치를 보여준다.
13 관련 주제
선행 지식
- FDA 1.0 — 개요
- FDA 1.3~1.4 — 주성분 함수(EFPC)와 BOA 주식 수익률
- FDA 3.1~3.2 — L² 공간과 확률 함수, Karhunen-Loève 전개
- FDA 5.0 — 함수 반응 모형 개관
- FDA 5.1~5.2 — 함수-on-스칼라 회귀
- FDA 5.3~5.4 — 함수-on-함수 회귀와 refund 통합 구현
- FDA 5.5~5.6 — FPCA 기반 핵 추정과 효과 없음 카이제곱 검정
후속 주제
- FDA 6.0 — 함수 일반화 선형 모형 개관
- FDA Ch.7 — 희소 함수 데이터와 PACE
- FDA Ch.8 — 함수 시계열과 FAR
- FDA Ch.12 — 평균·공분산 함수의 추론
관련 개념
- 잔차 도표를 이용한 회귀 진단 — 표준 다변량 진단의 함수 일반화 근거
- LOWESS 와 비모수 회귀 — 진단의 보조 도구
- Mixed Model 과 REML — Scheipl 확장의 토대
- 공동 정규성 (joint normality) — 럭비공 산점도의 이론적 근거
- PACE (Principal Analysis by Conditional Expectation) — 희소 데이터 FPC 추정