FDA 6.3~6.4 — 함수 반응 GLM 과 refund 구현

시점별 점별 GLM (함수-on-스칼라) + 이변량 핵 GLM (함수-on-함수) + pffr 의 잠재변수 시뮬레이션 패턴

Kokoszka & Reimherr (2017) Ch.6.3~6.4 의 핵심을 다룬다. 함수 반응 GLM 의 두 형태 — 시점별 점별 GLM η_n(t) = α(t) + x_n β(t) 와 이변량 핵 GLM η_n(t) = α(t) + ∫X_n(s)β(t,s)ds (식 6.7) — 의 정의·추정 전략· 무한차원 밀도 회피 동기 (6.3), 그리고 refund 패키지의 pffr 함수로 함수-on-스칼라 (regular/irregular grid) 와 함수-on-함수 GLM 을 적합하는 방법 — 잠재 가우스 변수 + Matérn 공분산 + probit 링크 시뮬레이션, ydata long format, ff() 텐서 곱 기저 — 을 코드와 함께 다룬다 (6.4).

Statistics
Functional Data Analysis
저자

Kwangmin Kim

공개

2026년 05월 07일

1 두 절의 역할

이 포스트의 범위
주제 핵심 도구
6.3 함수 반응 GLM 의 모형 정의 시점별 점별 GLM, 이변량 핵, 추정 방정식 접근
6.4 refund pffr 구현 잠재변수 시뮬레이션, regular/irregular grid, ff() 헬퍼

6.3 은 반응이 함수 인 GLM 의 정의와 그 어려움을 다룬다. 핵심 결정: 함수 밀도를 정의하지 않고 시점별 점별 GLM 으로 환원 — 무한차원 밀도의 본질적 한계 (6.6 에서 자세히) 를 우회하는 실용적 전략.

6.4 는 6.3 의 모형들을 R 의 refund::pffr 함수로 적합하는 방법. 잠재 가우스 변수 + 임계화 라는 표준 시뮬레이션 패턴과, regular grid (모든 곡선 같은 시점) / irregular grid (곡선마다 다른 시점) 의 두 인터페이스, 그리고 함수-on-함수 GLM 의 텐서 곱 기저까지 다룬다.

두 절을 합쳐 보면, 이론(6.3) 의 환원 + 실무(6.4) 의 자동화 가 함수 반응 GLM 을 다룰 수 있는 도구로 만든다.


2 함수 반응 GLM 의 도전

2.1 무한차원 밀도의 부재

표준 GLM 의 모든 이론 — 우도, MLE, Fisher 정보, 정보 기준 — 은 반응 변수의 밀도 를 중심으로 전개된다. 그러나 함수 반응의 경우:

이항 분포의 함수 버전은 무엇인가? 포아송 함수의 분포는?

이런 질문에 명확한 답이 없다. 무한차원 공간의 두 확률 측도는 일반적으로 직교 (orthogonal) 이므로 한 측도에 대한 다른 측도의 밀도(라돈-니코딤 도함수) 가 잘 정의되지 않는다 — 자세한 이유는 6.6 에서 다룬다.

2.2 실용적 회피 전략

이 어려움을 우회하기 위해 함수 반응 GLM 은:

  1. 함수 밀도를 정의하지 않음 — 가능도 함수 자체가 없음.
  2. 각 시점에서 표준 GLM 가정 — 점별 적률만 사용.
  3. 추정 방정식 (식 6.6 의 함수 버전) 으로 추정.

이는 GMM (generalized method of moments) 와 비슷한 사고 — 분포 가정 없이 적률 조건만으로 추정.

2.3 직관: 전체보다 점별

함수 \(Y_n(t)\) 의 전체 결합 분포를 모형화하려는 욕심을 버린다. 대신 각 시점 \(t\) 마다 표준 GLM — 그 단순함이 무한차원 어려움을 우회한다.

이 접근의 비용: 시점 간 상관 구조가 모형에 명시되지 않음. 따라서 표준오차·신뢰 구간이 보수적 (또는 부정확) 일 수 있다. 그러나 점추정은 일치 (consistent).

2.4 비유: 영화의 프레임별 분석

영화 한 편을 통째로 분석하려 하지 말고, 각 프레임을 개별 사진으로 분석. 프레임 사이의 시간 연속성은 잃지만, 분석은 표준 사진 분석 도구로 가능. 연속성은 추정된 사진들을 매끄럽게 이어 붙여서 회복.

함수 반응 GLM 도 같은 패턴 — 각 시점은 표준 GLM, 시점들의 매끄러움은 효과 함수의 매끄러움 가정으로 회복.


3 함수-on-스칼라 GLM

3.1 모형 정의

정의: 함수-on-스칼라 GLM

각 시점 \(t \in \mathcal{T}\) 에서 반응 \(Y_n(t)\) 가 같은 형태의 GLM 을 따른다고 가정:

\[ Y_n(t) \sim f(y \mid \eta_n(t)), \]

여기서 모수가 시간에 따라 변함:

\[ \eta_n(t) := g(E[Y_n(t)]) = \alpha(t) + x_n \beta(t). \]

  • \(g\) — 시간 무관 링크 함수.
  • \(\alpha(t), \beta(t)\) — 시점 의존 효과 함수.
  • \(x_n\) — 스칼라 회귀자.
  • 시점 간 결합 분포에 대한 가정 없음.

3.2 5.1 의 함수-on-스칼라 회귀와의 관계

측면 5.1 (LS) 6.3 (GLM)
모형 \(Y_n(t) = x_n \beta(t) + \varepsilon_n(t)\) \(g(E[Y_n(t)]) = x_n \beta(t)\)
분포 정규 (오차) 임의 지수족
링크 identity logit·log·probit·…
추정 점별 OLS 점별 추정 방정식
시점 결합 모형은 점별, 정칙화로 시점 결합 동일

핵심 차이는 분포와 링크의 일반화, 모형 구조와 정칙화 도구는 동일.

3.3 직관: “각 시점에 작은 GLM”

5.1 의 함수-on-스칼라 회귀를 한 줄 요약하면 “각 시점에 표준 다중 회귀”. 함수-on-스칼라 GLM 은 “각 시점에 표준 GLM” — 같은 framework 의 자연스러운 일반화.

차이는 시점 사이의 결합. LS 의 경우 점별 추정이 완전히 분리되지만 (5.1 의 식 5.3), GLM 의 경우 벌점 추정이 시점들을 매끄러움으로 묶는다. 이론적으로는 점별이지만, 실무에서는 \(\alpha(t), \beta(t)\) 가 매끄러운 함수라 가정하고 5.2 와 같은 거칠기 벌점을 부과.

3.4 추정 전략

각 시점 \(t_j\) 에서 표준 GLM 을 적용해 \(\widehat{\alpha}(t_j), \widehat{\beta}(t_j)\) 를 얻을 수 있다 — 점별 GLM. 그러나 이는 잡음에 민감하고 시점 사이의 매끄러움을 활용하지 못한다.

벌점 접근 — 효과 함수를 기저 전개 + 거칠기 벌점:

\[ \alpha(t) = \sum_m \alpha_m B_m(t), \quad \beta(t) = \sum_m \beta_m B_m(t), \]

벌점 우도:

\[ \ell_\lambda = \ell - \frac{\lambda_0}{2} \boldsymbol{\alpha}^T \mathbf{R} \boldsymbol{\alpha} - \frac{\lambda_1}{2} \boldsymbol{\beta}^T \mathbf{R} \boldsymbol{\beta}. \]

pffr 가 mgcv 위에서 벌점 IRLS 로 자동 추정.


4 함수-on-함수 GLM

4.1 모형 정의 (식 6.7)

정의: 함수-on-함수 GLM

함수 회귀자 \(X_n(s)\) 가 추가되면:

\[ \eta_n(t) = \alpha(t) + \int_{\mathcal{S}} X_n(s) \beta(t, s) \, ds. \]

여기서 \(\beta(t, s): \mathcal{T} \times \mathcal{S} \to \mathbb{R}\)이변량 회귀 핵.

5.3 의 함수-on-함수 회귀와 같은 핵 구조 + GLM 의 링크 함수 한 겹.

4.2 직관: 두 일반화의 결합

함수-on-함수 GLM = (5.3 의 이변량 핵 적분) + (6.1 의 링크 함수). 두 framework 의 직렬 결합 — 어느 한쪽의 도구를 그대로 재사용 가능.

단계 도구 출처
1. 적분 변환 \(\int X_n(s) \beta(t, s) ds\) Ch.5.3
2. 절편 추가 \(\eta_n(t) = \alpha(t) + (1)\) Ch.5.3
3. 링크 역변환 \(\mu_n(t) = g^{-1}(\eta_n(t))\) Ch.6.1
4. 분포 가정 \(Y_n(t) \sim f(y | \mu_n(t))\) Ch.6.1

4.3 추정: 함수-on-스칼라로의 환원

이변량 핵을 한 시점 기저로 전개:

\[ \beta(t, s) \approx \sum_{k=1}^{K} \beta_k(t) B_k(s). \]

\(t\) 에서 \(\beta(t, s)\)\(s\) 의 함수이므로, \(s\)-방향 기저 계수가 \(t\) 의 함수 가 된다.

대입:

\[ \eta_n(t) \approx \alpha(t) + \sum_{k=1}^{K} \beta_k(t) \underbrace{\int X_n(s) B_k(s) \, ds}_{X_{nk}}. \]

\(X_{nk}\) 가 데이터 의존 스칼라이므로, 모형이 함수-on-스칼라 GLM 형태:

\[ \eta_n(t) \approx \alpha(t) + \sum_{k=1}^{K} x_{nk} \beta_k(t). \]

따라서 함수-on-함수 GLM 의 추정 = \(K\) 개 회귀자를 가진 함수-on-스칼라 GLM 의 추정.

4.4 직관: 일관된 환원 패턴

함수 GLM 의 모든 형태가 결국 표준 GLM 으로 환원된다.

함수-on-함수 GLM
    ↓ (s-방향 기저 전개 → X_{nk})
함수-on-스칼라 GLM
    ↓ (t-방향 점별 또는 t-방향 기저 전개)
시점별 표준 GLM (점별)
    또는
다변량 GLM (기저 + 벌점)

이 환원 사슬의 모든 단계에서 같은 IRLS 알고리즘 이 적용. pffr 가 자동 처리.

4.5 비유: 러시아 인형 (Matryoshka)

가장 큰 인형 = 함수-on-함수 GLM. 그 안에 함수-on-스칼라 GLM, 그 안에 표준 GLM. 각 레벨에서 한 차원씩 환원된다 — 가장 안쪽 인형이 표준 GLM 의 IRLS.

이 중첩 구조 덕에 알고리즘은 가장 안쪽(IRLS) 만 잘 구현하면 모든 레벨에서 작동.


5 refund 패키지의 두 핵심 함수

함수 반응 회귀자 6.4 사용
pfr 스칼라 스칼라 + 함수 (lf()) 6.5 의 DTI 분류 (다음 포스트)
pffr 함수 스칼라 + 함수 (lf(), ff(), af()) 6.4 의 모든 시뮬레이션

5.4 의 pfr/pffr 가 GLM family 인자(binomial, poisson 등) 를 받으면 자동으로 함수 GLM 으로 적합. 함수 GLM 의 활성화는 family 한 줄 변경뿐 — 이것이 refund 의 가장 큰 매력.


6 잠재 변수 시뮬레이션 패턴

6.1 동기

함수 GLM 데이터를 직접 생성하기 어려운 이유 — 함수 이항/포아송 분포 자체가 정의되지 않음. 표준 우회 기법:

잠재 변수 + 임계화 패턴
  1. 잠재 가우스 과정 \(Z_n(t)\) 를 생성: \[ Z_n(t) = \alpha(t) + x_n \beta(t) + \varepsilon_n(t), \] \(\varepsilon_n(t)\) 는 점별 분산 1 의 가우스 과정 (보통 Matérn 공분산).

  2. 임계화 로 이진 반응 생성: \[ Y_n(t) = \mathbb{1}_{Z_n(t) > 0}. \]

  3. 결과: \(E[Y_n(t)] = P(Z_n(t) > 0) = \Phi(\alpha(t) + x_n \beta(t))\)probit GLM.

6.2 왜 이 패턴인가

  • 잠재 가우스 과정 은 다변량 정규로 쉽게 시뮬레이션 (mvrnorm).
  • 임계화 는 결정적이므로 추가 잡음 없음.
  • 결과 분포 는 이항 (각 시점 \(t\) 에서 베르누이).
  • 링크 함수가 정확히 probit\(\Phi\) 가 표준 정규 cdf.

이 패턴은 베이지안 통계의 잠재 변수 모형 (Albert & Chib 1993) 에서 유래했으며, 함수 GLM 시뮬레이션의 사실상 표준이다.

6.3 직관: 가우스를 “이진화” 함

가우스 과정으로 생성한 부드러운 곡선을 0 기준으로 자르면 0 / 1 의 이진 곡선이 된다. 이는 연속 신호를 이진 결정으로 변환 하는 자연스러운 메커니즘 — 의사 결정 이론의 표준 모형.

비유: 환자의 잠재 건강 상태가 연속적으로 변하지만, 의사의 진단은 이진 (질병 유무). 진단 임계값 이상이면 “환자”, 이하면 “건강”. 이 메커니즘이 잠재 변수 패턴이다.


7 함수-on-스칼라 (regular grid) 시뮬레이션

7.1 진짜 효과 함수 (식 6.8)

\[ \alpha(t) = \cos(\pi t + \pi), \quad \beta(t) = 2t. \]

\(\alpha\) 는 코사인 형태 (시작 \(-1\), 끝 \(+1\)), \(\beta\) 는 단순 직선 (기울기 2).

7.2 Matérn 공분산

\[ C(t, s) = \sigma^2 \left(1 + \frac{\sqrt{3} |t-s|}{\rho}\right) \exp\left(-\frac{\sqrt{3} |t-s|}{\rho}\right), \]

매끄러움 모수 \(\nu = 3/2\), 척도 \(\rho = 0.5\). 이 형태는 미분 가능하지만 매우 매끄럽지는 않음 — 실제 데이터의 잡음 구조에 가깝다.

7.3 직관: Matérn 잡음의 선택 이유

순수 백색 잡음 (시점 간 독립) 은 비현실적 — 실제 함수 데이터의 잡음은 시점 간 어느 정도 상관됨. Matérn 은 매끄러움을 모수 \(\nu\) 로 조절 가능\(\nu = 1/2\) (지수형) 부터 \(\nu \to \infty\) (가우스형) 까지 연속적 스펙트럼을 표현.

\(\nu = 3/2\) 는 “한 번 미분 가능한 거친 곡선” — 측정 잡음의 자연스러운 모형.

7.4 R 코드 (Figure 6.1 재현)

library(refund); library(MASS)

N <- 200; M <- 50
time <- seq(0, 1, length = M)

# 진짜 효과 함수
mu_f <- function(t) cos(pi * t + pi)
beta_f <- function(t) 2 * t

# Matérn 공분산 (nu = 3/2)
C_f <- function(t, s) {
  sig2 <- 1; rho <- 0.5
  d <- abs(outer(t, s, "-"))
  sig2 * (1 + sqrt(3) * d / rho) * exp(-sqrt(3) * d / rho)
}

# 데이터 생성: 잠재 변수 + 임계화
set.seed(2000)
Sigma <- C_f(time, time)
mu <- mu_f(time)
X <- rnorm(N, mean = 0)            # 스칼라 회귀자
beta <- beta_f(time)
Z <- mvrnorm(N, mu, Sigma) + X %*% t(beta)
Y <- matrix(Z > 0, nrow = N)       # N x M 이진 반응 행렬

# pffr 로 함수-on-스칼라 probit GLM 적합
Xdata <- data.frame(X = X)
pffr_fit <- pffr(Y ~ X,
                 family = binomial(link = "probit"),
                 yind = time, data = Xdata)

# 추정 효과 함수 시각화
par(mfrow = c(1, 2))
plot(pffr_fit, select = 1, xlab = "", ylab = "Intercept",
     ylim = c(-1.25, 1.5), cex.lab = 1.25)
points(time, mu_f(time), typ = "l", lty = 4, lwd = 4)
plot(pffr_fit, select = 2, xlab = "t", ylab = "Slope",
     ylim = c(-0.25, 2.75), cex.lab = 1.25)
points(time, beta_f(time), typ = "l", lty = 4, lwd = 4)

7.5 핵심 인자 해설

  • Y ~ X — 표준 R 수식 인터페이스. Y 는 함수 반응 행렬 (\(N \times M\)), X 는 스칼라 회귀자 벡터.
  • family = binomial(link = "probit") — 분포와 링크 지정. 이 한 줄로 함수 GLM 활성화.
  • yind = time — 반응 곡선의 시점 격자 (각 열의 의미).
  • data = Xdata — 회귀자 데이터프레임.

7.6 결과 해석

전형적 출력 (Figure 6.1):

  • \(\widehat{\alpha}(t)\) — 진짜 \(\cos(\pi t + \pi)\) 의 형태를 잘 잡음. 양 끝 \(-1, +1\) 부근에서 약간의 편차.
  • \(\widehat{\beta}(t)\) — 진짜 \(2t\) 의 직선을 거의 정확히 재현. 점별 신뢰 구간이 시작 부근 (\(t = 0\)) 에서 좁고 끝 (\(t = 1\)) 에서 넓음.

신뢰 구간이 끝에서 넓은 이유: \(X\) 의 평균이 0 이므로 \(X \beta(t)\) 의 시그널이 \(|\beta(t)| = 2t\) 와 같이 끝에서 강함 — 그러나 그 추정의 표준오차도 \(|x| \beta(t)\) 형태로 비례하여 커진다.

7.7 직관: 신뢰 구간 형태 해석

추정량의 표준오차는 보통 회귀자의 영향력에 비례. \(\beta(t)\) 가 큰 영역에서 — 신호 대 잡음비가 큰 영역 — 추정량이 정확하지만, 점별 신뢰 구간은 시그널의 절댓값에 비례하여 넓어진다.

이는 함수 회귀의 일반적 패턴 — 시각화 시 신뢰 구간의 형태가 효과 함수의 형태를 반영하는 경향.


8 함수-on-스칼라 (irregular grid) 시뮬레이션

8.1 동기

실제 데이터에서 모든 단위가 같은 시점에서 관측되지 않을 수 있다 — 종단 임상 데이터, 모바일 센서 등. 각 단위마다 다른 시점, 다른 관측 수.

8.2 Long format 데이터 구조

각 행이 한 관측 (단위 \(i\) 의 한 시점):

.obs .index .value
1 0.123 1
1 0.456 0
1 0.789 1
2 0.234 0
2 0.567 1

.obs — 단위 인덱스, .index — 관측 시점, .value — 반응 값.

8.3 직관: long format 의 자연스러움

전통적 통계에서 종단 데이터의 “tidy” 형식 — 각 행이 한 관측. 함수 데이터의 wide format (\(N \times M\) 행렬) 은 모든 단위가 같은 시점일 때만 효율적.

불규칙 시점 데이터를 wide format 으로 표현하면 결측값(NA) 이 많은 sparse 행렬 — 메모리·계산 비효율. Long format 이 sparse 데이터의 자연스러운 표현.

8.4 R 코드 (Figure 6.2 재현)

library(refund); library(MASS)

N <- 200
M <- 10            # 단위당 관측 수 (regular 의 50 보다 적음)
time_dummy <- seq(0, 1, length = M)

# 진짜 효과 함수 (slight modification)
mu_f <- function(t) cos(2 * pi * t / 2 + pi)
beta_f <- function(t) 2 * t

C_f <- function(t, s) {
  sig2 <- 1; rho <- 0.5
  d <- abs(outer(t, s, "-"))
  sig2 * (1 + sqrt(3) * d / rho) * exp(-sqrt(3) * d / rho)
}

# 단위별 random 시점 + long format 변환
set.seed(2000)
X <- rnorm(N, mean = 0)
Xdata <- data.frame(X = X)
Z <- numeric(0)
time_all <- numeric(0)
for (i in 1:N) {
  time_i <- sort(runif(M))                 # 단위 i 의 random 시점 M 개
  Sigma_i <- C_f(time_i, time_i)
  mu_i <- mu_f(time_i)
  beta_i <- beta_f(time_i)
  Z_i <- mvrnorm(1, mu_i, Sigma_i) + beta_i * X[i]
  Z <- c(Z, Z_i)
  time_all <- c(time_all, time_i)
}
Y <- as.numeric(Z > 0)

# Long format data.frame
Y_all <- data.frame(.obs = rep(1:N, each = M),
                    .index = time_all,
                    .value = Y)

# pffr 호출 — ydata 인자로 long format 전달
pffr_fit <- pffr(Ydummy ~ X,
                 family = binomial(link = "probit"),
                 data = Xdata, ydata = Y_all)

# 추정 효과 함수 시각화
par(mfrow = c(1, 2))
t_pts <- seq(0, 1, length = 50)
plot(pffr_fit, select = 1, xlab = "", ylab = "Intercept",
     ylim = c(-1.25, 1.5), cex.lab = 1.25)
points(t_pts, mu_f(t_pts), typ = "l", lty = 4, lwd = 4)
plot(pffr_fit, select = 2, xlab = "", ylab = "Slope",
     ylim = c(-0.5, 2), cex.lab = 1.25)
points(t_pts, beta_f(t_pts), typ = "l", lty = 4, lwd = 4)

8.5 인터페이스 차이

측면 Regular grid Irregular grid
Y 형식 \(N \times M\) 행렬 data.frame (long format)
데이터 전달 data = Xdata data = Xdata, ydata = Y_all
시점 지정 yind = time .index 컬럼 자동 인식
수식 좌변 Y dummy (예: Ydummy)

8.6 직관: 좌변이 dummy 인 이유

Y 값이 ydata 인자에 들어 있으므로, 수식 좌변의 변수는 사실상 사용되지 않는다 — 단지 R 의 formula 문법을 만족하기 위한 placeholder. Ydummy 라는 이름은 그 의미를 강조하는 컨벤션.

이는 R 의 formula API 의 한 한계 — 좌변 없는 ~ X 형태가 허용되지 않음. 따라서 dummy 변수로 채운다.


9 함수-on-함수 GLM 시뮬레이션

9.1 진짜 핵

\[ \beta(t, s) = 4 |t s|. \]

이변량 함수 — \(t = 0\) 또는 \(s = 0\) 에서 0, \((t, s) = (1, 1)\) 에서 최대값 4. 두 시점이 모두 끝 부근일 때 효과가 크다 는 패턴.

9.2 표본 크기 증가

\(N = 1000\) — 함수-on-스칼라보다 훨씬 큰 표본 필요. 이유: 이변량 핵의 추정이 일변량 효과 함수보다 본질적으로 어렵다 — 자유도가 곱셈적으로 증가.

9.3 Matérn 회귀자 생성

함수 회귀자 \(X_n(t)\) 도 잠재 가우스 과정 — Matérn 공분산.

9.4 R 코드 (Figure 6.3 재현)

library(refund); library(MASS)

N <- 1000; M <- 50
time <- seq(0, 1, length = M)

mu_f <- function(t) cos(2 * pi * t / 2 + pi)

# 이변량 핵
beta_f <- function(t, s) {
  d <- abs(outer(t, s, "*"))
  return(4 * d)
}

# Matérn (regular 와 동일)
C_f <- function(t, s) {
  sig2 <- 1; rho <- 0.5
  d <- abs(outer(t, s, "-"))
  sig2 * (1 + sqrt(3) * d / rho) * exp(-sqrt(3) * d / rho)
}

# 데이터 생성
set.seed(2000)
Sigma <- C_f(time, time)
mu <- mu_f(time)
beta <- beta_f(time, time)        # M x M 핵 행렬
X <- mvrnorm(N, mu, Sigma)        # N x M 함수 회귀자
Xdata <- data.frame(X = X)

# 잠재 변수 + 임계화
# 적분 ∫ X(s) β(t,s) ds 를 Riemann sum 으로 근사 (1/M 곱)
Z <- mvrnorm(N, mu, Sigma) + X %*% t(beta) / M
Y <- matrix(Z > 0, nrow = N)

# pffr 로 함수-on-함수 probit GLM 적합
pffr_fit <- pffr(Y ~ ff(X, basistype = "te", xind = time),
                 family = binomial(link = "probit"),
                 yind = time, data = Xdata)

# 절편 + 핵 시각화
par(mfrow = c(1, 3), mar = c(4, 4, 0, 0))
plot(pffr_fit, select = 1, xlab = "", ylab = "intercept", cex.lab = 1.5)
points(time, mu_f(time), typ = "l", lty = 4, lwd = 4)
plot(pffr_fit, select = 2, pers = TRUE,
     xlab = " ", ylab = " ", main = "Estimated Slope")
persp(time, time, beta_f(time, time),
      xlab = " ", ylab = "", zlab = "True Slope",
      theta = 30, phi = 30)

9.5 핵심 인자 해설

  • ff(X, basistype = "te", xind = time) — 함수 회귀자 \(X\) 를 표시.
    • basistype = "te"텐서 곱(tensor product) 기저: \(B(t, s) = B^t(t) \cdot B^s(s)\).
    • xind = time — 회귀자의 시점 격자.
  • Y ~ ff(X, ...) — 함수 반응을 함수 회귀자로 회귀.
  • /M — 적분의 Riemann sum 근사 (격자 폭 1/M 곱).

9.6 텐서 곱 기저의 의미

이변량 핵 \(\beta(t, s)\)\(K_t \times K_s\) 개의 이변량 기저로 표현:

\[ \beta(t, s) = \sum_{k_t, k_s} \beta_{k_t, k_s} B^t_{k_t}(t) \cdot B^s_{k_s}(s). \]

이변량 자유도가 일변량의 곱 — 큰 모수 수. 라플라시안 벌점으로 매끄러움 강제.

5.3 의 함수-on-함수 회귀와 같은 도구이며, GLM 으로 자연스럽게 확장.

9.7 결과 해석

전형적 출력 (Figure 6.3):

  • 절편 \(\widehat{\alpha}(t)\) — 진짜 \(\cos(2\pi t / 2 + \pi)\) 를 잘 추적. 잡음 약간 있음.
  • 추정 핵 \(\widehat{\beta}(t, s)\) — 진짜 \(4 |t s|\) 의 모서리 패턴(원점에서 0, 끝에서 최대) 를 잘 재현. 텐서 곱 기저의 매끄러움이 표면을 자연스럽게 표현.
  • 핵 추정의 잡음이 함수-on-스칼라보다 시각적으로 큰 편 — 이변량 추정의 본질적 어려움.

9.8 비유: 입체 지형 추정

산악 지대의 등고선을 적은 측량 점에서 복원. 측량 점이 늘어날수록(N 증가) 진짜 지형(true kernel) 에 가까워지지만, 부드러운 표면 가정(라플라시안 벌점) 이 없으면 측량점 잡음에 따라 들쭉날쭉한 표면이 추정된다.

함수-on-함수 GLM 의 핵 추정도 같은 패턴 — 큰 표본 + 강한 매끄러움 가정이 핵심.


10 시각적 검증의 중요성

10.1 자동화의 한계

pffr 는 매끄러움 모수, 기저 수, 벌점 등을 자동 선택하지만, 이변량 핵 추정은 본질적으로 잡음에 민감. 자동 결과를 항상 시각적으로 검증해야 한다.

함수-on-함수 GLM 적합 후 점검 체크리스트
  1. 추정 핵 표면 — persp 또는 contour 그림으로 패턴 시각화. 도메인 지식과 일치하는가?
  2. 점추정 vs 신뢰 구간 — 패턴이 신뢰 구간 안에서 안정적인가?
  3. 다른 기저 시도basistype = "s" (smooth term) 또는 다른 기저로 결과 비교.
  4. 잔차 분석 — 적합값과 관측값의 시각적 비교 (특히 극단값).
  5. 민감도 — 표본 크기를 부분 표본으로 줄여 결과 안정성 확인.

10.2 직관: 시각화는 진단의 1 차 도구

함수 회귀의 결과는 보통 곡선/표면 — 숫자보다 그림이 더 많은 정보를 담는다. 자동 적합 후 항상 시각화, 패턴이 도메인 지식과 모순되면 모형 재검토.

pffrplot 메서드가 표준 시각화를 자동 생성하므로 활용 비용은 낮다.


11 두 절의 통합 시각

11.1 한 줄 요약

함수 반응 GLM 은 무한차원 밀도의 부재로 가능도 framework 가 깨지므로, 시점별 점별 GLM 가정 (함수-on-스칼라: η_n(t) = α(t) + x_n β(t), 함수-on-함수: η_n(t) = α(t) + ∫X_n(s)β(t,s)ds) 으로 환원한다. refund 의 pffr 함수가 family 인자 한 줄로 GLM 활성화하며, 잠재 가우스 변수 + 임계화 패턴으로 시뮬레이션, regular grid 는 행렬 + yind, irregular grid 는 long format + ydata 인터페이스, 함수-on-함수는 ff() + 텐서 곱 기저로 적합한다.

11.2 6.1~6.2 와의 비교

측면 6.1~6.2 (스칼라 반응) 6.3~6.4 (함수 반응)
반응 스칼라 \(Y_n\) 함수 \(Y_n(t)\)
모수 함수 \(\beta(t)\) 함수 \(\alpha(t), \beta(t)\) 또는 핵 \(\beta(t, s)\)
가능도 잘 정의됨 (스칼라 분포) 정의 안 됨 (함수 분포 부재)
추정 토대 MLE 추정 방정식 (점별 GLM)
R 함수 pfr + family pffr + family
시뮬레이션 표준 잠재 변수 + 임계화

핵심 변화: 반응의 차원 + 가능도의 부재. 그러나 인터페이스와 도구는 일관되게 같다.

11.3 Chapter 6 후속 절과의 연결

후속 절 6.3~6.4 의 도구를 어떻게 활용하는가
6.5 DTI 응용 6.2 의 pfr 를 MS 분류에 적용 (반응이 스칼라 이진)
6.6 무한차원 밀도 한계 6.3 의 환원 전략의 이론적 근거 — 측도 직교성
6.7 연습문제 식 (6.3) 평균/분산 검증 등 6.1 의 토대

6.3~6.4 는 함수 GLM 의 가장 일반적이고 실용적인 형태이며, pffr + ff() + family 가 사실상 모든 비정규 함수 회귀의 표준 시작점.


12 관련 주제

선행 지식

후속 주제

관련 개념

Subscribe

Enjoy this blog? Get notified of new posts by email: