Kwangmin Kim - FDA 5.7~5.8 — 선형 함수 모형의 진단과 확장 참고문헌

1 두 절의 역할

이 포스트의 범위

절	주제	핵심 도구
5.7	함수 선형 모형의 타당성 진단	FPC 점수 쌍별 산점도 + 식 (5.23) 유도
5.8	Ch.5 의 확장과 참고문헌	Mixed model 일반화, 희소 데이터, 오차 상관 검정 등

5.7 은 추정 후 진단 — Ch.5 의 모형들을 적합한 후 “정말 선형 모형이 적절했는가” 를 점검한다. 표준 선형 회귀에서 산점도 + 잔차 도표가 진단의 핵심인 것처럼, 함수 회귀에서도 시각적 도구가 필요하다.

5.8 은 이 챕터를 넘어선 발전 — Ch.5 의 단순 모형이 어떻게 일반화되는가의 지도. 환자별·방문별 종단 데이터, 희소 관측, 시간 의존 오차 등 실무에서 마주치는 복잡성을 다룬 후속 연구의 좌표를 제공한다.

두 절을 합쳐 보면, 5.1~5.6 의 추정·검정 framework 가 “어떻게 사용되는가(5.7)” 와 “어디로 향하는가(5.8)” 의 그림이 완성된다.

2 진단의 동기

2.1 표준 선형 회귀의 산점도 진단

스칼라 단순 회귀 \(y_i = a + b x_i + \varepsilon_i\) 의 적절성 점검:

\((x_i, y_i)\) 의 산점도를 그린다.
점들이 직선 패턴을 보이는지 확인.
명백한 곡선 패턴(2차, 사다리, 분리된 군집) 이 보이면 선형 모형 부적절.

표본이 공동 정규(jointly normal) 이면 산점도가 럭비공(football) 모양 — 한 축이 회귀 직선, 그 주위에 정규 잡음.

2.2 함수 회귀로의 확장

같은 원리를 함수 회귀 (5.10) \(Y_i(t) = \alpha(t) + \int \psi(t, s) X_i(s) \, ds + \varepsilon_i(t)\) 에 적용. 두 가지 변경이 필요하다.

여러 회귀자가 있으면 — 반응 vs 각 회귀자의 산점도를 모두 검사 (스칼라 다중 회귀에서도 같음).
함수가 등장하면 — 함수를 직접 그릴 수 없으므로 추정된 EFPC 의 점수로 대체. 점수는 스칼라이므로 일반적인 산점도 가능.

2.3 직관: 함수를 “압축” 해서 보다

함수 자체는 1차원에 표시할 수 없다. 두 곡선의 산점도(원시 형태) 는 평면에 그려지지 않는다 — 두 곡선을 비교하려면 한 차원으로 압축해야 한다.

EFPC 점수가 그 압축이다. 각 함수의 가장 정보량 큰 차원 을 한 스칼라 값으로 요약하므로, 두 함수 사이의 관계가 점수 산점도로 시각화 가능하다.

비유 — 고차원 데이터의 PCA 시각화. 100차원 데이터를 그릴 수는 없지만 첫 두 주성분으로 사영하여 2D 산점도로 패턴을 본다. 함수 회귀의 진단도 같은 원리이다.

3 진단 절차

3.1 핵심 산점도

\(X_i, Y_i\) 의 EFPC 점수를 계산:

\[ \xi_{ij} = \langle X_i, \widehat{v}_j \rangle, \quad \zeta_{ik} = \langle Y_i, \widehat{u}_k \rangle. \]

가능한 모든 \((j, k)\) 쌍에 대해 산점도 \((\xi_{ij}, \zeta_{ik})\) 를 그린다. 보통 첫 2-3 개 PC 만으로 충분 — \(j, k \in \{1, 2, 3\}\) 의 9 개 산점도.

3.2 패턴 해석

산점도 형태	함의
직선 (또는 럭비공)	선형 가정 충족, 공동 정규에 가까움
명백한 2차 곡선	비선형성 — 함수 GAM 등 비선형 모형 검토
사다리 / 분리된 군집	잠재 그룹 구조 — 잠재 변수, mixture model 검토
무패턴 (구름)	효과 없음 또는 잡음 우세 — 5.6 검정과 일치 확인

3.3 비선형 시뮬레이션 예시 (Kokoszka 책의 Figure 5.7)

비선형 회귀:

\[ Y_i(t) = H_2(X_i(t)) + \varepsilon_i(t), \quad H_2(x) = x^2 - 1, \quad i = 1, \ldots, 40. \]

이는 함수 선형 모형 (5.10) 이 아니다 — 적분 변환이 아닌 점별 비선형 함수. 그러나 표면적으로 비슷한 함수-on-함수 데이터로 보일 수 있다.

진단:

\((\xi_{i1}, \zeta_{i1})\) 산점도 → 명백한 2차 곡선 패턴. 선형 모형 부적절.
\((\xi_{i2}, \zeta_{i1})\), \((\xi_{i1}, \zeta_{i2})\) 등 → 일부도 비선형 패턴, 일부는 평이.

3.4 직관: 첫 PC 쌍이 가장 민감한 이유

\(X\) 의 가장 변동이 큰 방향(\(v_1\)) 을 통과하는 비선형성이 데이터의 가장 큰 비선형 신호이다. 따라서 \(\xi_{i1}\) vs \(\zeta_{i1}\) 산점도가 비선형성 검출에 가장 민감.

후순위 PC 쌍은 변동이 작고 잡음 비중이 높아 비선형 패턴이 잡음에 묻힐 수 있다. 따라서 진단의 우선순위는 첫 PC 쌍부터 시작 하여 점진적으로 후순위로.

3.5 비유: 진료의 1차 검진과 정밀 검진

종합 건강 검진에서 가장 흔한 이상(혈압·혈당·콜레스테롤) 부터 검사한 후, 이상이 있으면 정밀 검진으로 넘어간다. 함수 회귀 진단도 같은 패턴 — 첫 PC 쌍에서 이상 발견 → 후순위 PC 쌍 또는 다른 진단 도구로 정밀 검사.

4 진단의 수학적 정당화

4.1 출발: FPC 전개로 모형 다시 쓰기

함수 선형 모형 (5.10) 에 KL 전개를 평균 함수와 함께 대입:

\[ Y_i(t) = \mu_Y(t) + \sum_{k=1}^{\infty} \zeta_{ik} u_k(t), \quad X_i(s) = \mu_X(s) + \sum_{j=1}^{\infty} \xi_{ij} v_j(s). \]

(5.10) 에 대입하고 정리:

\[ \mu_Y(t) + \sum_{k} \zeta_{ik} u_k(t) = \alpha(t) + \int \psi(t, s) \left[\mu_X(s) + \sum_{j} \xi_{ij} v_j(s)\right] ds + \varepsilon_i(t). \]

4.2 새 함수의 정의

\[ g(t) = \alpha(t) + \int \psi(t, s) \mu_X(s) \, ds, \quad h_j(t) = \int \psi(t, s) v_j(s) \, ds. \]

여기서 \(g\) 는 평균 회귀자에 의해 변환된 절편 + 평균 효과, \(h_j\) 는 \(X\) 의 \(j\) 번째 PC 가 핵을 통과한 결과.

4.3 양변에 u_ℓ 을 곱하고 적분

\(\{u_k\}\) 의 정규직교성 사용:

\[ \langle \mu_Y, u_\ell \rangle + \zeta_{i\ell} = \langle g, u_\ell \rangle + \sum_{j=1}^{\infty} \xi_{ij} \langle h_j, u_\ell \rangle + \langle \varepsilon_i, u_\ell \rangle. \]

새 표기 도입:

\(a_\ell = \langle g - \mu_Y, u_\ell \rangle\)
\(b_{\ell j} = \langle h_j, u_\ell \rangle\)
\(\varepsilon_{i\ell} = \langle \varepsilon_i, u_\ell \rangle\)

4.4 핵심 식 (5.23)

위 등식에서 \(\langle \mu_Y, u_\ell \rangle\) 를 우변으로 옮기고 한 \(j\) 만 분리:

\[ \boxed{ \zeta_{i\ell} = a_\ell + b_{\ell j} \xi_{ij} + \eta_{i, \ell j} } \tag{5.23} \]

여기서 잡음 항:

\[ \eta_{i, \ell j} = \sum_{j' \neq j} b_{\ell j'} \xi_{i j'} + \varepsilon_{i\ell}. \]

4.5 식 (5.23) 의 해석

이 식이 진단의 수학적 토대.

고정된 \(\ell, j\) 에 대해, \(\zeta_{i\ell}\) 와 \(\xi_{ij}\) 는 단순 선형 회귀 관계 \(\zeta = a + b\xi + \eta\).

따라서 함수 선형 모형 (5.10) 이 참이라면 모든 \((\ell, j)\) 쌍의 점수가 (잡음을 갖긴 하지만) 선형 관계 를 만족해야 한다. 산점도가 비선형 패턴을 보이면 모형 위반.

4.6 직관: 분해의 의미

식 (5.23) 의 본질:

\(a_\ell\) — 절편 (평균 효과의 PC 점수).
\(b_{\ell j}\) — \(\xi_{ij}\) 와 \(\zeta_{i\ell}\) 사이의 진짜 선형 관계 강도. 5.5 의 분해 계수 \(\psi_{\ell j}\) 와 사실상 같은 양이다 (\(v_j\) 가 정규직교이므로 \(\langle h_j, u_\ell \rangle = \int \int \psi(t, s) v_j(s) u_\ell(t) \, ds \, dt = \psi_{\ell j}\)).
\(\eta_{i, \ell j}\) — 다른 PC 들의 기여 (\(\sum_{j' \neq j} b_{\ell j'} \xi_{ij'}\)) + 잔차 (\(\varepsilon_{i\ell}\)).

4.7 잡음 항의 성질

η_{i, ℓj} 의 통계적 성질 (Problem 5.10)

평균 0: \(E[\eta_{i, \ell j}] = 0\).
회귀자와 비상관: \(E[\eta_{i, \ell j} \xi_{ij}] = 0\).
단위 간 비상관: \(E[\eta_{i, \ell j} \eta_{i', \ell j}] = 0\) (\(i \neq i'\)).

이 성질들은 표준 단순 선형 회귀의 잔차와 동일 — 단순 OLS 의 모든 추론 도구가 적용 가능.

4.8 공동 정규성과 럭비공 모양

\(X\) 와 \(Y\) 가 공동 가우스 random function 이면 \(u_\ell, v_j\) 위의 사영 \(\xi_{ij}, \zeta_{i\ell}\) 도 공동 가우스. 따라서 산점도는 공동 정규의 럭비공 모양 — 한 축이 회귀 직선, 그 주위에 등방향 잡음 분산.

가우스 가정이 깨져도 식 (5.23) 의 분해 자체는 유효 — 단지 산점도가 럭비공이 아닐 수 있고, 비선형성과 비가우스성을 구별하기 어려워질 수 있다.

4.9 직관: 왜 단순 선형 회귀로 환원되는가

함수 회귀가 무한차원 적분 변환이지만, EFPC 점수 좌표계에서 보면 단순 회귀들의 모음 — 5.5 에서 본 분해의 또 다른 표현이다.

식 (5.23) 은 5.5 의 추정 식 (5.17) 과 같은 사실의 다른 측면 — 추정에서는 분해 계수를 점수 공분산으로 표현, 진단에서는 점수 자체의 선형 관계를 시각화.

이것이 함수 회귀의 가장 매력적 특성 중 하나 — 무한차원 객체를 유한 차원 산점도로 진단할 수 있다는 점.

5 다른 함수 회귀 모형의 진단

5.1 함수-on-스칼라 (Problem 5.11)

모형 \(Y_i(t) = \sum_k x_{ik} \beta_k(t) + \varepsilon_i(t)\) 의 진단:

\(\zeta_{ik} = \langle Y_i, \widehat{u}_k \rangle\) — 반응 함수의 PC 점수.
\(x_{i\ell}\) — \(\ell\) 번째 스칼라 회귀자 (이미 스칼라).
산점도 \((x_{i\ell}, \zeta_{ik})\) 의 패턴 검사.

식 (5.23) 의 단순 버전:

\[ \zeta_{ik} = a_k + b_{k\ell} x_{i\ell} + \eta_{i, k\ell}. \]

5.2 스칼라-on-함수 (Problem 5.12)

모형 \(Y_i = \int \beta(s) X_i(s) \, ds + \varepsilon_i\) 의 진단:

\(Y_i\) — 이미 스칼라.
\(\xi_{ij} = \langle X_i, \widehat{v}_j \rangle\) — 회귀자의 PC 점수.
산점도 \((\xi_{ij}, Y_i)\) 의 패턴 검사.

이 경우는 표준 단순 회귀 산점도 형태 그대로 — 스칼라 vs 스칼라.

5.3 직관: 일관된 패턴

세 함수 회귀 형태 모두 진단의 핵심 아이디어가 같다:

함수를 PC 점수로 환원하고, 결과 스칼라들 사이의 산점도 패턴을 본다.

차이는 어느 쪽 함수를 환원하느냐 — 양쪽 모두(함수-on-함수), 반응만(함수-on-스칼라), 회귀자만(스칼라-on-함수).

이 일관성이 FDA 의 통합된 진단 framework 를 가능하게 한다.

6 진단의 실무 워크플로우

함수 선형 모형 진단 단계

모형 적합 — 5.3~5.6 의 도구로 핵 또는 효과 함수 추정.
EFPC 추정 — pca.fd 등으로 \(X, Y\) 의 첫 몇 PC 와 점수 계산.
점수 산점도 행렬 생성 — 첫 2-3 개 PC 의 모든 쌍에 대해.
시각적 검사:
- 직선/럭비공 → 선형 가정 OK.
- 곡선 패턴 → 비선형성 의심.
- 군집 → 잠재 그룹 의심.
사후 조치:
- 비선형성 → 함수 GAM (Ch.4.8) 또는 함수 GLM (Ch.6).
- 잠재 그룹 → mixture model 또는 stratified analysis.
- 효과 없음 (구름) → 5.6 검정으로 확인 후 모형 폐기 검토.

6.1 R 구현 예시

library(fda)

# 1. X, Y 의 fd 객체와 EFPC 가 이미 계산되어 있다고 가정
# X_pca <- pca.fd(X_fd_centered, nharm = 3)
# Y_pca <- pca.fd(Y_fd_centered, nharm = 3)

xi_scores <- X_pca$scores      # N x 3
zeta_scores <- Y_pca$scores    # N x 3

# 2. 9 개 산점도 행렬 (첫 3 PC 쌍)
par(mfrow = c(3, 3), mar = c(4, 4, 2, 1))
for (j in 1:3) {
  for (k in 1:3) {
    plot(xi_scores[, j], zeta_scores[, k],
         xlab = bquote(xi[.(j)]),
         ylab = bquote(zeta[.(k)]),
         main = paste0("X PC", j, " vs Y PC", k),
         pch = 19, cex = 0.7,
         col = rgb(0, 0, 0, 0.5))

    # 보조선: OLS 적합
    fit <- lm(zeta_scores[, k] ~ xi_scores[, j])
    abline(fit, col = "red", lty = 2)

    # 보조선: LOWESS — 비선형성 검출
    lo <- lowess(xi_scores[, j], zeta_scores[, k])
    lines(lo, col = "blue", lwd = 1.5)
  }
}

6.2 직관: OLS 와 LOWESS 의 두 보조선

빨간 점선 (OLS): 식 (5.23) 의 진짜 선형 관계 \(a + b \xi\). 데이터가 선형이라면 점들이 이 선 주위에 밀집.
파란 실선 (LOWESS): 데이터의 국소 평균 추세. 선형이라면 빨간 점선과 거의 일치, 비선형이면 두 선이 갈라진다.

두 선의 차이가 비선형성의 시각적 증거 — 큰 차이는 선형 모형 부적절.

6.3 비유: 그래프 종이의 격자선

표준 그래프 종이에는 직선 격자가 그려져 있어 데이터의 비선형 패턴이 직관적으로 보인다. OLS 직선이 격자선 이고 LOWESS 가 데이터의 진짜 형태 이다 — 두 선이 일치하면 격자에 맞는(선형) 데이터, 갈라지면 격자를 벗어난(비선형) 데이터.

7 비선형성 검출 후의 대응

7.1 비선형 함수 모형의 선택지

비선형성 검출 후의 대안 모형

비선형 형태	권장 모형	도구
점별 비선형 (\(Y(t) = H(X(t))\))	함수 GAM (Ch.4.8)	`refund::pfr` + `af()`
단일 인덱스 (\(Y = g(\int \beta X)\))	단일 인덱스 함수 회귀	사용자 정의 ML
비정규 반응 (이진·카운트)	함수 GLM (Ch.6)	`refund::pfr` + family
잠재 그룹	Functional mixture model	`funFEM`, `funHDDC`
시간 의존 효과	Mixed model (Scheipl 2015)	`refund::pffr`

7.2 직관: 진단 → 모형 변경의 사이클

선형 모형 → 진단 → 비선형 검출 → 비선형 모형 → 다시 진단 → … 의 반복은 표준 통계 모델링의 일반 패턴이며, 함수 회귀에서도 같다.

핵심은 진단을 적합 후에 무조건 한다 는 습관 — 적합 결과만 보고 모형을 신뢰하지 않고, 진단으로 가정을 검증하는 절차를 routine 으로 만든다.

8 확장과 참고문헌 (Section 5.8)

8.1 종합 리뷰

함수 회귀 종합 리뷰

Morris (2015) — 함수 회귀 문헌의 광범위한 리뷰. Ch.5 의 모형들을 broader literature context 에서 위치시키는 출발점.

8.2 절별 출처

절	출처	기여
5.1	Faraway (1997)	자동차 대시보드 각도 운동 데이터, 함수-on-스칼라 OLS
5.2	Reiss et al. (2010)	식 (5.6) 과 (5.9) 의 유도, GLS 구현
5.3	Ivanescu et al. (2015)	mixed model 연결, sparse 곡선 처리, `pffr` 의 이론적 토대

8.3 Scheipl et al. (2015): 일반화된 mixed model framework

5.3, 5.4 의 방법론을 크게 확장. 모형:

\[ Y_i(t) = \mu_i(t) + \varepsilon_i(t), \]

여기서 평균 함수 \(\mu_i(t)\) 가 스칼라·함수·범주형 회귀자에 복잡하게 의존.

8.4 의학 연구 예시

인덱스 \(i = (\iota, \kappa)\) 가 두 성분:

\(\iota\) — 환자.
\(\kappa\) — 같은 환자의 의료 방문 (visit).

각 환자의 변수:

\(d(\iota) \in \{0, 1\}\) — 질병 여부.
\(g(\iota) \in \{0, 1\}\) — 성별 (남성=1).
\(u(\iota, \kappa) \in \mathbb{R}\) — \(\kappa\) 번째 방문 시 환자의 나이 (시간 가변).

평균 함수:

\[ \begin{aligned} \mu_{\iota \kappa}(t) &= \alpha_1(d(\iota), t) + \alpha_2(g(\iota), t) + \alpha_3(u(\iota, \kappa), t) \\ &\quad + \int_{\mathcal{S}} \psi_1(d(\iota), t, s) X_{1, \iota \kappa}(s) \, ds \\ &\quad + \int_{\mathcal{R}} \psi_2(d(\iota), t, r) X_{2, \iota \kappa}(r) \, dr. \end{aligned} \]

8.5 직관: 무엇이 일반화되었는가

식 (5.11) 의 단순 모형과 비교:

측면	(5.11)	Scheipl 모형
인덱스	단일 \(i\)	환자-방문 (\(\iota, \kappa\))
절편 구조	단일 \(\alpha(t)\)	\(\alpha_1(0,\cdot), \alpha_1(1,\cdot), \alpha_2(0,\cdot), \alpha_2(1,\cdot), \alpha_3\) — 5 개 함수
핵 구조	단일 \(\psi(t, s)\)	\(\psi(d(\iota), t, s)\) — 질병 여부에 따라 다른 핵
회귀자	시간 불변	시간 가변 (\(X_{1, \iota\kappa}\))
종속성	iid	환자 내 방문 사이 종속 (mixed model)

이는 현실 의학 데이터의 복잡성을 반영 — 같은 환자의 반복 측정, 질병 그룹별 다른 효과, 나이에 따른 변화. pffr 는 이런 모형을 처리하는 도구로 진화했다.

8.6 응용 예시: 뇌영상 의학 연구

Scheipl et al. (2015) 의 실제 응용:

\(X_{1, \iota \kappa}, X_{2, \iota \kappa}\) — 환자 \(\iota\) 의 \(\kappa\) 번째 방문에서 측정한 뇌의 두 트랙트(white matter tract) 의 신호 곡선.
\(Y_{\iota \kappa}\) — 다른 트랙트의 신호 곡선.
가설: “두 트랙트의 신호 패턴이 세 번째 트랙트를 예측하며, 질병 환자에서 그 패턴이 다르다.”

5.7 의 진단 도구는 이런 복잡한 모형에서도 작동 — 핵 단위로 점수 산점도를 확인하여 선형성을 점검한다.

9 희소 데이터로의 확장

9.1 Yao et al. (2005) — PACE

Section 5.5 의 FPC 기반 추정을 희소(sparse) 관측 으로 확장. 종단 연구에서 각 환자가 소수의 불규칙 시점에서만 관측되는 경우.

핵심 아이디어:

환자별 곡선을 직접 평활할 수 없음 (관측점 부족).
피험자 간 정보 풀링(pooling) — 모든 환자의 데이터를 합쳐 평균 함수와 공분산 함수를 추정.
PACE (Principal Analysis by Conditional Expectation) — 추정된 공분산의 고유분해 + 조건부 기대로 개별 곡선의 PC 점수 예측.

자세한 내용은 Ch.7 (희소 FDA).

9.2 직관: 정보 풀링의 동기

한 환자가 5 시점만 관측해서는 곡선의 형태를 알 수 없다. 그러나 100 명의 환자가 각자 5 시점씩 (서로 다른 시점에) 관측하면, 합쳐서 시간 도메인 전체를 잘 덮는다. 환자 간의 정보 공유 가 개별 곡선 추정의 토대.

이는 mixed model 의 random effect 와 같은 통계 철학 — 개체별 정보가 부족하면 모집단 수준에서 정보를 빌려온다.

10 효과 없음 검정의 후속 발전

10.1 Kokoszka et al. (2008)

Section 5.6 의 카이제곱 검정의 원논문. Space physics 데이터(우주 자기장, 태양풍 변동 등) 에 적용.

확장 형태와 추가 예시는 Horváth & Kokoszka (2012) Ch.9 참조.

10.2 Chiou & Müller (2007)

Section 5.7 의 산점도 진단 방법의 원논문. 다양한 종류의 산점도(점수 vs 점수, 점수 vs 잔차 등) 도 함께 제안.

10.3 Gabrys et al. (2010)

오차 함수의 독립성 검정. 모형:

\[ Y_i(t) = \int \psi(t, s) X_i(s) \, ds + \varepsilon_i(t), \]

에서 \(\{\varepsilon_i\}\) 가 iid 인지 vs 시간 시리즈 의존성을 가지는지 검정.

10.4 직관: 왜 오차 독립성을 검정하는가

5.6 의 카이제곱 검정 분포는 \(\varepsilon_i\) 의 iid 가정에 의존. 만약 오차에 시간 종속성이 있으면 (예: 함수 시계열 데이터) \(\chi^2_{pq}\) 가 잘못된 분포 — 1종 오류율 부정확.

Gabrys et al. (2010) 의 검정으로 iid 가정을 사전 확인하면, 5.6 의 검정 결과를 더 신뢰할 수 있다. iid 가 거부되면 함수 시계열 framework (Ch.8) 로 전환.

11 Ch.5 발전의 통합 시각

11.1 시간순 발전 지도

1997: Faraway — 자동차 대시보드, 함수-on-스칼라 OLS의 첫 응용
2005: Yao et al. — PACE, 희소 데이터의 FPC 추정
2007: Chiou & Müller — 산점도 진단 (5.7 토대)
2008: Kokoszka et al. — 카이제곱 효과 없음 검정 (5.6 토대)
2010: Gabrys et al. — 오차 독립성 검정
2010: Reiss et al. — 식 (5.6), (5.9) 유도, GLS
2015: Ivanescu et al. — mixed model 연결, pffr 도입
2015: Scheipl et al. — Mixed model 확장 (의학 데이터)

11.2 발전의 두 축

축	방향	대표 연구
모형 일반화	단순 → 복잡	Faraway → Scheipl
데이터 확장	밀집 → 희소·종속	Yao (희소), Gabrys (종속)
추론 도구	추정 → 검정·진단	Reiss → Kokoszka → Chiou

Ch.5 가 다룬 framework — 선형 + 밀집 + iid 오차 — 가 이 모든 확장의 출발점이며, 후속 발전은 가정을 하나씩 완화한 일반화이다.

12 두 절의 통합 시각

12.1 한 줄 요약

함수 선형 모형의 타당성은 EFPC 점수 산점도로 진단한다 — 식 (5.23) 의 ζ_iℓ = a_ℓ + b_ℓj ξ_ij + η_i,ℓj 가 보장하듯, 진정 선형 모형이라면 모든 PC 쌍의 산점도가 선형 패턴을 보여야 한다. 비선형성이 검출되면 함수 GAM·GLM·mixture 등의 확장으로 전환하며, 이 framework 는 Scheipl·Yao·Kokoszka·Chiou-Müller 등의 후속 연구로 mixed model·희소 데이터·검정 도구로 확장되었다.

12.2 Ch.5 전체의 통합

5.1~5.8 의 흐름을 한눈에:

절	핵심	역할
5.1	함수-on-스칼라 OLS	가장 단순한 출발점
5.2	벌점 추정	잡음 반응 처리
5.3	함수-on-함수 + 라플라시안 벌점	일반화된 핵 추정
5.4	refund (`fosr`, `pffr`)	실무 도구
5.5	FPCA 기반 분해	효율적 대안
5.6	효과 없음 검정	사전·사후 검증
5.7	선형성 진단	모형 가정 점검
5.8	확장과 참고문헌	다음 연구 방향

5.1~5.4 가 추정 도구, 5.5~5.6 이 효율적 대안과 검정, 5.7~5.8 이 진단과 미래 의 역할.

12.3 Chapter 5 너머

다음 챕터	5.7~5.8 의 도구를 어떻게 활용하는가
Ch.6 함수 GLM	비정규 함수 반응 — 5.7 산점도 진단으로 비선형성 검출 후의 대안
Ch.7 희소 FDA	5.8 의 Yao et al. (2005) PACE 가 핵심 도구
Ch.8 함수 시계열	5.8 의 Gabrys et al. (2010) 가 iid 가정 검증의 토대
Ch.12 추론	5.6 의 카이제곱 framework 가 평균·공분산 검정으로 확장

5.7 의 진단 도구는 모든 후속 챕터에서 모형 정당화의 표준이며, 5.8 의 확장 지도는 FDA 연구의 현 위치를 보여준다.

13 관련 주제

선행 지식

후속 주제

관련 개념

잔차 도표를 이용한 회귀 진단 — 표준 다변량 진단의 함수 일반화 근거
LOWESS 와 비모수 회귀 — 진단의 보조 도구
Mixed Model 과 REML — Scheipl 확장의 토대
공동 정규성 (joint normality) — 럭비공 산점도의 이론적 근거
PACE (Principal Analysis by Conditional Expectation) — 희소 데이터 FPC 추정