1 두 절의 역할
| 절 | 주제 | 핵심 도구 |
|---|---|---|
| 6.3 | 함수 반응 GLM 의 모형 정의 | 시점별 점별 GLM, 이변량 핵, 추정 방정식 접근 |
| 6.4 | refund pffr 구현 | 잠재변수 시뮬레이션, regular/irregular grid, ff() 헬퍼 |
6.3 은 반응이 함수 인 GLM 의 정의와 그 어려움을 다룬다. 핵심 결정: 함수 밀도를 정의하지 않고 시점별 점별 GLM 으로 환원 — 무한차원 밀도의 본질적 한계 (6.6 에서 자세히) 를 우회하는 실용적 전략.
6.4 는 6.3 의 모형들을 R 의 refund::pffr 함수로 적합하는 방법. 잠재 가우스 변수 + 임계화 라는 표준 시뮬레이션 패턴과, regular grid (모든 곡선 같은 시점) / irregular grid (곡선마다 다른 시점) 의 두 인터페이스, 그리고 함수-on-함수 GLM 의 텐서 곱 기저까지 다룬다.
두 절을 합쳐 보면, 이론(6.3) 의 환원 + 실무(6.4) 의 자동화 가 함수 반응 GLM 을 다룰 수 있는 도구로 만든다.
2 함수 반응 GLM 의 도전
2.1 무한차원 밀도의 부재
표준 GLM 의 모든 이론 — 우도, MLE, Fisher 정보, 정보 기준 — 은 반응 변수의 밀도 를 중심으로 전개된다. 그러나 함수 반응의 경우:
이항 분포의 함수 버전은 무엇인가? 포아송 함수의 분포는?
이런 질문에 명확한 답이 없다. 무한차원 공간의 두 확률 측도는 일반적으로 직교 (orthogonal) 이므로 한 측도에 대한 다른 측도의 밀도(라돈-니코딤 도함수) 가 잘 정의되지 않는다 — 자세한 이유는 6.6 에서 다룬다.
2.2 실용적 회피 전략
이 어려움을 우회하기 위해 함수 반응 GLM 은:
- 함수 밀도를 정의하지 않음 — 가능도 함수 자체가 없음.
- 각 시점에서 표준 GLM 가정 — 점별 적률만 사용.
- 추정 방정식 (식 6.6 의 함수 버전) 으로 추정.
이는 GMM (generalized method of moments) 와 비슷한 사고 — 분포 가정 없이 적률 조건만으로 추정.
2.3 직관: 전체보다 점별
함수 \(Y_n(t)\) 의 전체 결합 분포를 모형화하려는 욕심을 버린다. 대신 각 시점 \(t\) 마다 표준 GLM — 그 단순함이 무한차원 어려움을 우회한다.
이 접근의 비용: 시점 간 상관 구조가 모형에 명시되지 않음. 따라서 표준오차·신뢰 구간이 보수적 (또는 부정확) 일 수 있다. 그러나 점추정은 일치 (consistent).
2.4 비유: 영화의 프레임별 분석
영화 한 편을 통째로 분석하려 하지 말고, 각 프레임을 개별 사진으로 분석. 프레임 사이의 시간 연속성은 잃지만, 분석은 표준 사진 분석 도구로 가능. 연속성은 추정된 사진들을 매끄럽게 이어 붙여서 회복.
함수 반응 GLM 도 같은 패턴 — 각 시점은 표준 GLM, 시점들의 매끄러움은 효과 함수의 매끄러움 가정으로 회복.
3 함수-on-스칼라 GLM
3.1 모형 정의
각 시점 \(t \in \mathcal{T}\) 에서 반응 \(Y_n(t)\) 가 같은 형태의 GLM 을 따른다고 가정:
\[ Y_n(t) \sim f(y \mid \eta_n(t)), \]
여기서 모수가 시간에 따라 변함:
\[ \eta_n(t) := g(E[Y_n(t)]) = \alpha(t) + x_n \beta(t). \]
- \(g\) — 시간 무관 링크 함수.
- \(\alpha(t), \beta(t)\) — 시점 의존 효과 함수.
- \(x_n\) — 스칼라 회귀자.
- 시점 간 결합 분포에 대한 가정 없음.
3.2 5.1 의 함수-on-스칼라 회귀와의 관계
| 측면 | 5.1 (LS) | 6.3 (GLM) |
|---|---|---|
| 모형 | \(Y_n(t) = x_n \beta(t) + \varepsilon_n(t)\) | \(g(E[Y_n(t)]) = x_n \beta(t)\) |
| 분포 | 정규 (오차) | 임의 지수족 |
| 링크 | identity | logit·log·probit·… |
| 추정 | 점별 OLS | 점별 추정 방정식 |
| 시점 결합 | 모형은 점별, 정칙화로 시점 결합 | 동일 |
핵심 차이는 분포와 링크의 일반화, 모형 구조와 정칙화 도구는 동일.
3.3 직관: “각 시점에 작은 GLM”
5.1 의 함수-on-스칼라 회귀를 한 줄 요약하면 “각 시점에 표준 다중 회귀”. 함수-on-스칼라 GLM 은 “각 시점에 표준 GLM” — 같은 framework 의 자연스러운 일반화.
차이는 시점 사이의 결합. LS 의 경우 점별 추정이 완전히 분리되지만 (5.1 의 식 5.3), GLM 의 경우 벌점 추정이 시점들을 매끄러움으로 묶는다. 이론적으로는 점별이지만, 실무에서는 \(\alpha(t), \beta(t)\) 가 매끄러운 함수라 가정하고 5.2 와 같은 거칠기 벌점을 부과.
3.4 추정 전략
각 시점 \(t_j\) 에서 표준 GLM 을 적용해 \(\widehat{\alpha}(t_j), \widehat{\beta}(t_j)\) 를 얻을 수 있다 — 점별 GLM. 그러나 이는 잡음에 민감하고 시점 사이의 매끄러움을 활용하지 못한다.
벌점 접근 — 효과 함수를 기저 전개 + 거칠기 벌점:
\[ \alpha(t) = \sum_m \alpha_m B_m(t), \quad \beta(t) = \sum_m \beta_m B_m(t), \]
벌점 우도:
\[ \ell_\lambda = \ell - \frac{\lambda_0}{2} \boldsymbol{\alpha}^T \mathbf{R} \boldsymbol{\alpha} - \frac{\lambda_1}{2} \boldsymbol{\beta}^T \mathbf{R} \boldsymbol{\beta}. \]
pffr 가 mgcv 위에서 벌점 IRLS 로 자동 추정.
4 함수-on-함수 GLM
4.1 모형 정의 (식 6.7)
함수 회귀자 \(X_n(s)\) 가 추가되면:
\[ \eta_n(t) = \alpha(t) + \int_{\mathcal{S}} X_n(s) \beta(t, s) \, ds. \]
여기서 \(\beta(t, s): \mathcal{T} \times \mathcal{S} \to \mathbb{R}\) — 이변량 회귀 핵.
5.3 의 함수-on-함수 회귀와 같은 핵 구조 + GLM 의 링크 함수 한 겹.
4.2 직관: 두 일반화의 결합
함수-on-함수 GLM = (5.3 의 이변량 핵 적분) + (6.1 의 링크 함수). 두 framework 의 직렬 결합 — 어느 한쪽의 도구를 그대로 재사용 가능.
| 단계 | 도구 | 출처 |
|---|---|---|
| 1. 적분 변환 | \(\int X_n(s) \beta(t, s) ds\) | Ch.5.3 |
| 2. 절편 추가 | \(\eta_n(t) = \alpha(t) + (1)\) | Ch.5.3 |
| 3. 링크 역변환 | \(\mu_n(t) = g^{-1}(\eta_n(t))\) | Ch.6.1 |
| 4. 분포 가정 | \(Y_n(t) \sim f(y | \mu_n(t))\) | Ch.6.1 |
4.3 추정: 함수-on-스칼라로의 환원
이변량 핵을 한 시점 기저로 전개:
\[ \beta(t, s) \approx \sum_{k=1}^{K} \beta_k(t) B_k(s). \]
각 \(t\) 에서 \(\beta(t, s)\) 가 \(s\) 의 함수이므로, \(s\)-방향 기저 계수가 \(t\) 의 함수 가 된다.
대입:
\[ \eta_n(t) \approx \alpha(t) + \sum_{k=1}^{K} \beta_k(t) \underbrace{\int X_n(s) B_k(s) \, ds}_{X_{nk}}. \]
\(X_{nk}\) 가 데이터 의존 스칼라이므로, 모형이 함수-on-스칼라 GLM 형태:
\[ \eta_n(t) \approx \alpha(t) + \sum_{k=1}^{K} x_{nk} \beta_k(t). \]
따라서 함수-on-함수 GLM 의 추정 = \(K\) 개 회귀자를 가진 함수-on-스칼라 GLM 의 추정.
4.4 직관: 일관된 환원 패턴
함수 GLM 의 모든 형태가 결국 표준 GLM 으로 환원된다.
함수-on-함수 GLM
↓ (s-방향 기저 전개 → X_{nk})
함수-on-스칼라 GLM
↓ (t-방향 점별 또는 t-방향 기저 전개)
시점별 표준 GLM (점별)
또는
다변량 GLM (기저 + 벌점)
이 환원 사슬의 모든 단계에서 같은 IRLS 알고리즘 이 적용. pffr 가 자동 처리.
4.5 비유: 러시아 인형 (Matryoshka)
가장 큰 인형 = 함수-on-함수 GLM. 그 안에 함수-on-스칼라 GLM, 그 안에 표준 GLM. 각 레벨에서 한 차원씩 환원된다 — 가장 안쪽 인형이 표준 GLM 의 IRLS.
이 중첩 구조 덕에 알고리즘은 가장 안쪽(IRLS) 만 잘 구현하면 모든 레벨에서 작동.
5 refund 패키지의 두 핵심 함수
| 함수 | 반응 | 회귀자 | 6.4 사용 |
|---|---|---|---|
pfr |
스칼라 | 스칼라 + 함수 (lf()) |
6.5 의 DTI 분류 (다음 포스트) |
pffr |
함수 | 스칼라 + 함수 (lf(), ff(), af()) |
6.4 의 모든 시뮬레이션 |
5.4 의 pfr/pffr 가 GLM family 인자(binomial, poisson 등) 를 받으면 자동으로 함수 GLM 으로 적합. 함수 GLM 의 활성화는 family 한 줄 변경뿐 — 이것이 refund 의 가장 큰 매력.
6 잠재 변수 시뮬레이션 패턴
6.1 동기
함수 GLM 데이터를 직접 생성하기 어려운 이유 — 함수 이항/포아송 분포 자체가 정의되지 않음. 표준 우회 기법:
잠재 가우스 과정 \(Z_n(t)\) 를 생성: \[ Z_n(t) = \alpha(t) + x_n \beta(t) + \varepsilon_n(t), \] \(\varepsilon_n(t)\) 는 점별 분산 1 의 가우스 과정 (보통 Matérn 공분산).
임계화 로 이진 반응 생성: \[ Y_n(t) = \mathbb{1}_{Z_n(t) > 0}. \]
결과: \(E[Y_n(t)] = P(Z_n(t) > 0) = \Phi(\alpha(t) + x_n \beta(t))\) — probit GLM.
6.2 왜 이 패턴인가
- 잠재 가우스 과정 은 다변량 정규로 쉽게 시뮬레이션 (mvrnorm).
- 임계화 는 결정적이므로 추가 잡음 없음.
- 결과 분포 는 이항 (각 시점 \(t\) 에서 베르누이).
- 링크 함수가 정확히 probit — \(\Phi\) 가 표준 정규 cdf.
이 패턴은 베이지안 통계의 잠재 변수 모형 (Albert & Chib 1993) 에서 유래했으며, 함수 GLM 시뮬레이션의 사실상 표준이다.
6.3 직관: 가우스를 “이진화” 함
가우스 과정으로 생성한 부드러운 곡선을 0 기준으로 자르면 0 / 1 의 이진 곡선이 된다. 이는 연속 신호를 이진 결정으로 변환 하는 자연스러운 메커니즘 — 의사 결정 이론의 표준 모형.
비유: 환자의 잠재 건강 상태가 연속적으로 변하지만, 의사의 진단은 이진 (질병 유무). 진단 임계값 이상이면 “환자”, 이하면 “건강”. 이 메커니즘이 잠재 변수 패턴이다.
7 함수-on-스칼라 (regular grid) 시뮬레이션
7.1 진짜 효과 함수 (식 6.8)
\[ \alpha(t) = \cos(\pi t + \pi), \quad \beta(t) = 2t. \]
\(\alpha\) 는 코사인 형태 (시작 \(-1\), 끝 \(+1\)), \(\beta\) 는 단순 직선 (기울기 2).
7.2 Matérn 공분산
\[ C(t, s) = \sigma^2 \left(1 + \frac{\sqrt{3} |t-s|}{\rho}\right) \exp\left(-\frac{\sqrt{3} |t-s|}{\rho}\right), \]
매끄러움 모수 \(\nu = 3/2\), 척도 \(\rho = 0.5\). 이 형태는 미분 가능하지만 매우 매끄럽지는 않음 — 실제 데이터의 잡음 구조에 가깝다.
7.3 직관: Matérn 잡음의 선택 이유
순수 백색 잡음 (시점 간 독립) 은 비현실적 — 실제 함수 데이터의 잡음은 시점 간 어느 정도 상관됨. Matérn 은 매끄러움을 모수 \(\nu\) 로 조절 가능 — \(\nu = 1/2\) (지수형) 부터 \(\nu \to \infty\) (가우스형) 까지 연속적 스펙트럼을 표현.
\(\nu = 3/2\) 는 “한 번 미분 가능한 거친 곡선” — 측정 잡음의 자연스러운 모형.
7.4 R 코드 (Figure 6.1 재현)
library(refund); library(MASS)
N <- 200; M <- 50
time <- seq(0, 1, length = M)
# 진짜 효과 함수
mu_f <- function(t) cos(pi * t + pi)
beta_f <- function(t) 2 * t
# Matérn 공분산 (nu = 3/2)
C_f <- function(t, s) {
sig2 <- 1; rho <- 0.5
d <- abs(outer(t, s, "-"))
sig2 * (1 + sqrt(3) * d / rho) * exp(-sqrt(3) * d / rho)
}
# 데이터 생성: 잠재 변수 + 임계화
set.seed(2000)
Sigma <- C_f(time, time)
mu <- mu_f(time)
X <- rnorm(N, mean = 0) # 스칼라 회귀자
beta <- beta_f(time)
Z <- mvrnorm(N, mu, Sigma) + X %*% t(beta)
Y <- matrix(Z > 0, nrow = N) # N x M 이진 반응 행렬
# pffr 로 함수-on-스칼라 probit GLM 적합
Xdata <- data.frame(X = X)
pffr_fit <- pffr(Y ~ X,
family = binomial(link = "probit"),
yind = time, data = Xdata)
# 추정 효과 함수 시각화
par(mfrow = c(1, 2))
plot(pffr_fit, select = 1, xlab = "", ylab = "Intercept",
ylim = c(-1.25, 1.5), cex.lab = 1.25)
points(time, mu_f(time), typ = "l", lty = 4, lwd = 4)
plot(pffr_fit, select = 2, xlab = "t", ylab = "Slope",
ylim = c(-0.25, 2.75), cex.lab = 1.25)
points(time, beta_f(time), typ = "l", lty = 4, lwd = 4)7.5 핵심 인자 해설
Y ~ X— 표준 R 수식 인터페이스.Y는 함수 반응 행렬 (\(N \times M\)),X는 스칼라 회귀자 벡터.family = binomial(link = "probit")— 분포와 링크 지정. 이 한 줄로 함수 GLM 활성화.yind = time— 반응 곡선의 시점 격자 (각 열의 의미).data = Xdata— 회귀자 데이터프레임.
7.6 결과 해석
전형적 출력 (Figure 6.1):
- \(\widehat{\alpha}(t)\) — 진짜 \(\cos(\pi t + \pi)\) 의 형태를 잘 잡음. 양 끝 \(-1, +1\) 부근에서 약간의 편차.
- \(\widehat{\beta}(t)\) — 진짜 \(2t\) 의 직선을 거의 정확히 재현. 점별 신뢰 구간이 시작 부근 (\(t = 0\)) 에서 좁고 끝 (\(t = 1\)) 에서 넓음.
신뢰 구간이 끝에서 넓은 이유: \(X\) 의 평균이 0 이므로 \(X \beta(t)\) 의 시그널이 \(|\beta(t)| = 2t\) 와 같이 끝에서 강함 — 그러나 그 추정의 표준오차도 \(|x| \beta(t)\) 형태로 비례하여 커진다.
7.7 직관: 신뢰 구간 형태 해석
추정량의 표준오차는 보통 회귀자의 영향력에 비례. \(\beta(t)\) 가 큰 영역에서 — 신호 대 잡음비가 큰 영역 — 추정량이 정확하지만, 점별 신뢰 구간은 시그널의 절댓값에 비례하여 넓어진다.
이는 함수 회귀의 일반적 패턴 — 시각화 시 신뢰 구간의 형태가 효과 함수의 형태를 반영하는 경향.
8 함수-on-스칼라 (irregular grid) 시뮬레이션
8.1 동기
실제 데이터에서 모든 단위가 같은 시점에서 관측되지 않을 수 있다 — 종단 임상 데이터, 모바일 센서 등. 각 단위마다 다른 시점, 다른 관측 수.
8.2 Long format 데이터 구조
각 행이 한 관측 (단위 \(i\) 의 한 시점):
.obs |
.index |
.value |
|---|---|---|
| 1 | 0.123 | 1 |
| 1 | 0.456 | 0 |
| 1 | 0.789 | 1 |
| 2 | 0.234 | 0 |
| 2 | 0.567 | 1 |
| … | … | … |
.obs — 단위 인덱스, .index — 관측 시점, .value — 반응 값.
8.3 직관: long format 의 자연스러움
전통적 통계에서 종단 데이터의 “tidy” 형식 — 각 행이 한 관측. 함수 데이터의 wide format (\(N \times M\) 행렬) 은 모든 단위가 같은 시점일 때만 효율적.
불규칙 시점 데이터를 wide format 으로 표현하면 결측값(NA) 이 많은 sparse 행렬 — 메모리·계산 비효율. Long format 이 sparse 데이터의 자연스러운 표현.
8.4 R 코드 (Figure 6.2 재현)
library(refund); library(MASS)
N <- 200
M <- 10 # 단위당 관측 수 (regular 의 50 보다 적음)
time_dummy <- seq(0, 1, length = M)
# 진짜 효과 함수 (slight modification)
mu_f <- function(t) cos(2 * pi * t / 2 + pi)
beta_f <- function(t) 2 * t
C_f <- function(t, s) {
sig2 <- 1; rho <- 0.5
d <- abs(outer(t, s, "-"))
sig2 * (1 + sqrt(3) * d / rho) * exp(-sqrt(3) * d / rho)
}
# 단위별 random 시점 + long format 변환
set.seed(2000)
X <- rnorm(N, mean = 0)
Xdata <- data.frame(X = X)
Z <- numeric(0)
time_all <- numeric(0)
for (i in 1:N) {
time_i <- sort(runif(M)) # 단위 i 의 random 시점 M 개
Sigma_i <- C_f(time_i, time_i)
mu_i <- mu_f(time_i)
beta_i <- beta_f(time_i)
Z_i <- mvrnorm(1, mu_i, Sigma_i) + beta_i * X[i]
Z <- c(Z, Z_i)
time_all <- c(time_all, time_i)
}
Y <- as.numeric(Z > 0)
# Long format data.frame
Y_all <- data.frame(.obs = rep(1:N, each = M),
.index = time_all,
.value = Y)
# pffr 호출 — ydata 인자로 long format 전달
pffr_fit <- pffr(Ydummy ~ X,
family = binomial(link = "probit"),
data = Xdata, ydata = Y_all)
# 추정 효과 함수 시각화
par(mfrow = c(1, 2))
t_pts <- seq(0, 1, length = 50)
plot(pffr_fit, select = 1, xlab = "", ylab = "Intercept",
ylim = c(-1.25, 1.5), cex.lab = 1.25)
points(t_pts, mu_f(t_pts), typ = "l", lty = 4, lwd = 4)
plot(pffr_fit, select = 2, xlab = "", ylab = "Slope",
ylim = c(-0.5, 2), cex.lab = 1.25)
points(t_pts, beta_f(t_pts), typ = "l", lty = 4, lwd = 4)8.5 인터페이스 차이
| 측면 | Regular grid | Irregular grid |
|---|---|---|
Y 형식 |
\(N \times M\) 행렬 | data.frame (long format) |
| 데이터 전달 | data = Xdata |
data = Xdata, ydata = Y_all |
| 시점 지정 | yind = time |
.index 컬럼 자동 인식 |
| 수식 좌변 | Y |
dummy (예: Ydummy) |
8.6 직관: 좌변이 dummy 인 이유
Y 값이 ydata 인자에 들어 있으므로, 수식 좌변의 변수는 사실상 사용되지 않는다 — 단지 R 의 formula 문법을 만족하기 위한 placeholder. Ydummy 라는 이름은 그 의미를 강조하는 컨벤션.
이는 R 의 formula API 의 한 한계 — 좌변 없는 ~ X 형태가 허용되지 않음. 따라서 dummy 변수로 채운다.
9 함수-on-함수 GLM 시뮬레이션
9.1 진짜 핵
\[ \beta(t, s) = 4 |t s|. \]
이변량 함수 — \(t = 0\) 또는 \(s = 0\) 에서 0, \((t, s) = (1, 1)\) 에서 최대값 4. 두 시점이 모두 끝 부근일 때 효과가 크다 는 패턴.
9.2 표본 크기 증가
\(N = 1000\) — 함수-on-스칼라보다 훨씬 큰 표본 필요. 이유: 이변량 핵의 추정이 일변량 효과 함수보다 본질적으로 어렵다 — 자유도가 곱셈적으로 증가.
9.3 Matérn 회귀자 생성
함수 회귀자 \(X_n(t)\) 도 잠재 가우스 과정 — Matérn 공분산.
9.4 R 코드 (Figure 6.3 재현)
library(refund); library(MASS)
N <- 1000; M <- 50
time <- seq(0, 1, length = M)
mu_f <- function(t) cos(2 * pi * t / 2 + pi)
# 이변량 핵
beta_f <- function(t, s) {
d <- abs(outer(t, s, "*"))
return(4 * d)
}
# Matérn (regular 와 동일)
C_f <- function(t, s) {
sig2 <- 1; rho <- 0.5
d <- abs(outer(t, s, "-"))
sig2 * (1 + sqrt(3) * d / rho) * exp(-sqrt(3) * d / rho)
}
# 데이터 생성
set.seed(2000)
Sigma <- C_f(time, time)
mu <- mu_f(time)
beta <- beta_f(time, time) # M x M 핵 행렬
X <- mvrnorm(N, mu, Sigma) # N x M 함수 회귀자
Xdata <- data.frame(X = X)
# 잠재 변수 + 임계화
# 적분 ∫ X(s) β(t,s) ds 를 Riemann sum 으로 근사 (1/M 곱)
Z <- mvrnorm(N, mu, Sigma) + X %*% t(beta) / M
Y <- matrix(Z > 0, nrow = N)
# pffr 로 함수-on-함수 probit GLM 적합
pffr_fit <- pffr(Y ~ ff(X, basistype = "te", xind = time),
family = binomial(link = "probit"),
yind = time, data = Xdata)
# 절편 + 핵 시각화
par(mfrow = c(1, 3), mar = c(4, 4, 0, 0))
plot(pffr_fit, select = 1, xlab = "", ylab = "intercept", cex.lab = 1.5)
points(time, mu_f(time), typ = "l", lty = 4, lwd = 4)
plot(pffr_fit, select = 2, pers = TRUE,
xlab = " ", ylab = " ", main = "Estimated Slope")
persp(time, time, beta_f(time, time),
xlab = " ", ylab = "", zlab = "True Slope",
theta = 30, phi = 30)9.5 핵심 인자 해설
ff(X, basistype = "te", xind = time)— 함수 회귀자 \(X\) 를 표시.basistype = "te"— 텐서 곱(tensor product) 기저: \(B(t, s) = B^t(t) \cdot B^s(s)\).xind = time— 회귀자의 시점 격자.
Y ~ ff(X, ...)— 함수 반응을 함수 회귀자로 회귀./M— 적분의 Riemann sum 근사 (격자 폭 1/M 곱).
9.6 텐서 곱 기저의 의미
이변량 핵 \(\beta(t, s)\) 를 \(K_t \times K_s\) 개의 이변량 기저로 표현:
\[ \beta(t, s) = \sum_{k_t, k_s} \beta_{k_t, k_s} B^t_{k_t}(t) \cdot B^s_{k_s}(s). \]
이변량 자유도가 일변량의 곱 — 큰 모수 수. 라플라시안 벌점으로 매끄러움 강제.
5.3 의 함수-on-함수 회귀와 같은 도구이며, GLM 으로 자연스럽게 확장.
9.7 결과 해석
전형적 출력 (Figure 6.3):
- 절편 \(\widehat{\alpha}(t)\) — 진짜 \(\cos(2\pi t / 2 + \pi)\) 를 잘 추적. 잡음 약간 있음.
- 추정 핵 \(\widehat{\beta}(t, s)\) — 진짜 \(4 |t s|\) 의 모서리 패턴(원점에서 0, 끝에서 최대) 를 잘 재현. 텐서 곱 기저의 매끄러움이 표면을 자연스럽게 표현.
- 핵 추정의 잡음이 함수-on-스칼라보다 시각적으로 큰 편 — 이변량 추정의 본질적 어려움.
9.8 비유: 입체 지형 추정
산악 지대의 등고선을 적은 측량 점에서 복원. 측량 점이 늘어날수록(N 증가) 진짜 지형(true kernel) 에 가까워지지만, 부드러운 표면 가정(라플라시안 벌점) 이 없으면 측량점 잡음에 따라 들쭉날쭉한 표면이 추정된다.
함수-on-함수 GLM 의 핵 추정도 같은 패턴 — 큰 표본 + 강한 매끄러움 가정이 핵심.
10 시각적 검증의 중요성
10.1 자동화의 한계
pffr 는 매끄러움 모수, 기저 수, 벌점 등을 자동 선택하지만, 이변량 핵 추정은 본질적으로 잡음에 민감. 자동 결과를 항상 시각적으로 검증해야 한다.
- 추정 핵 표면 — persp 또는 contour 그림으로 패턴 시각화. 도메인 지식과 일치하는가?
- 점추정 vs 신뢰 구간 — 패턴이 신뢰 구간 안에서 안정적인가?
- 다른 기저 시도 —
basistype = "s"(smooth term) 또는 다른 기저로 결과 비교. - 잔차 분석 — 적합값과 관측값의 시각적 비교 (특히 극단값).
- 민감도 — 표본 크기를 부분 표본으로 줄여 결과 안정성 확인.
10.2 직관: 시각화는 진단의 1 차 도구
함수 회귀의 결과는 보통 곡선/표면 — 숫자보다 그림이 더 많은 정보를 담는다. 자동 적합 후 항상 시각화, 패턴이 도메인 지식과 모순되면 모형 재검토.
pffr 의 plot 메서드가 표준 시각화를 자동 생성하므로 활용 비용은 낮다.
11 두 절의 통합 시각
11.1 한 줄 요약
함수 반응 GLM 은 무한차원 밀도의 부재로 가능도 framework 가 깨지므로, 시점별 점별 GLM 가정 (함수-on-스칼라: η_n(t) = α(t) + x_n β(t), 함수-on-함수: η_n(t) = α(t) + ∫X_n(s)β(t,s)ds) 으로 환원한다. refund 의 pffr 함수가 family 인자 한 줄로 GLM 활성화하며, 잠재 가우스 변수 + 임계화 패턴으로 시뮬레이션, regular grid 는 행렬 + yind, irregular grid 는 long format + ydata 인터페이스, 함수-on-함수는 ff() + 텐서 곱 기저로 적합한다.
11.2 6.1~6.2 와의 비교
| 측면 | 6.1~6.2 (스칼라 반응) | 6.3~6.4 (함수 반응) |
|---|---|---|
| 반응 | 스칼라 \(Y_n\) | 함수 \(Y_n(t)\) |
| 모수 | 함수 \(\beta(t)\) | 함수 \(\alpha(t), \beta(t)\) 또는 핵 \(\beta(t, s)\) |
| 가능도 | 잘 정의됨 (스칼라 분포) | 정의 안 됨 (함수 분포 부재) |
| 추정 토대 | MLE | 추정 방정식 (점별 GLM) |
| R 함수 | pfr + family |
pffr + family |
| 시뮬레이션 | 표준 | 잠재 변수 + 임계화 |
핵심 변화: 반응의 차원 + 가능도의 부재. 그러나 인터페이스와 도구는 일관되게 같다.
11.3 Chapter 6 후속 절과의 연결
| 후속 절 | 6.3~6.4 의 도구를 어떻게 활용하는가 |
|---|---|
| 6.5 DTI 응용 | 6.2 의 pfr 를 MS 분류에 적용 (반응이 스칼라 이진) |
| 6.6 무한차원 밀도 한계 | 6.3 의 환원 전략의 이론적 근거 — 측도 직교성 |
| 6.7 연습문제 | 식 (6.3) 평균/분산 검증 등 6.1 의 토대 |
6.3~6.4 는 함수 GLM 의 가장 일반적이고 실용적인 형태이며, pffr + ff() + family 가 사실상 모든 비정규 함수 회귀의 표준 시작점.
12 관련 주제
선행 지식
- FDA 1.0 — 개요
- FDA 5.0 — 함수 반응 모형 개관
- FDA 5.3~5.4 — 함수-on-함수 회귀와 refund 통합 구현
- FDA 6.0 — 함수 일반화 선형 모형 개관
- FDA 6.1~6.2 — GLM 배경과 스칼라-on-함수 GLM
후속 주제
관련 개념
- Probit 모형 — 잠재 가우스 변수 + 임계화의 일반 framework
- Matérn 공분산 함수 — 가우스 과정 시뮬레이션의 표준
- 텐서 곱 기저 — 이변량 함수 모형화
- Long format vs wide format 데이터 — 종단 데이터 표현
- GMM (일반화 적률 추정) — 추정 방정식 접근의 다변량 원조
- Mixed Model 과 REML —
pffr의 추정 framework