Salamander 교배 실험 — 교차 랜덤효과 GLMM 의 교본 (McCullagh §14.5)

Arnold-Verrell 실험 · 이종 교배 장벽 · 고정효과 \(\pm\infty\) 문제 · 준-우도 = 단순 비율 · \(\sigma_F^2, \sigma_M^2\) 이차 형식 추정

McCullagh & Nelder (1989) §14.5 의 Salamander 교배 실험을 심화한다. Arnold-Verrell (U. Chicago) 이 Rough Butt (RB) vs Whiteside (WS) 두 Appalachian 도롱뇽 개체군의 교배 장벽 을 검증한 실험. 40 마리 × 3 반복 설계에서 각 암컷이 4 종류 수컷 조합 × 3 기회를 얻는 교차 랜덤효과 (crossed random effects) 구조. §14.5.3 의 로지스틱 모형 (14.10) 에서 개별 고정효과 접근이 \(\pm\infty\) 추정 · 부분 aliasing · 과학적 무의미 세 이유로 실패. 랜덤효과 가정 \(\sigma_F^2, \sigma_M^2\) 도입 후 준-우도 추정이 놀랍게도 단순 비율 (14.12) 이 되는 이유와 그 공분산 (14.13) 의 이차항 구조. §14.5.4 의 이차 형식 기반 분산 성분 추정 — \(\widetilde\sigma_F^2 = 0.91, \widetilde\sigma_M^2 = 0.88\). 과학적 결론 — \(\widehat\pi_{WR} = 0.21\) vs 나머지 ≈ 0.67 의 비대칭 장벽, mixed contrast \(0.345 \pm 0.09\) 의 강한 유의성, 수컷 효과 지속 · 암컷 효과 단기라는 부가 발견.

Statistics
GLM
저자

Kwangmin Kim

공개

2026년 04월 21일

1 서론 — 왜 Salamander 가 GLMM 의 교본인가

Ch.14 의 마지막 실전 예제. 이 데이터가 GLMM 문헌 전반에서 가장 많이 인용되는 벤치마크가 된 이유는 네 가지다.

  1. 깨끗한 과학 질문: 두 도롱뇽 개체군 (Rough Butt RB vs Whiteside WS) 사이에 생식 격리 (reproductive isolation) 가 형성됐는가? 진화 생물학의 핵심 문제.
  2. 명시적 교차 랜덤효과: 같은 수컷이 여러 암컷과, 같은 암컷이 여러 수컷과 짝짓기 → 중첩이 아닌 교차 (crossed) 구조. GLMM 의 가장 도전적 설계.
  3. 작은 표본 + 이진 반응: 40 마리 × 3 실험, 각 관측치가 0/1. 과산포 가능성 + 중도절단 없이 이항 구조.
  4. 고정효과 접근의 명확한 실패: 개별 동물 효과가 \(\pm\infty\) 로 추정되거나 완전히 aliased — 랜덤효과 가정이 선택이 아니라 필수 인 상황.

이번 글은 §14.5 의 4 소절을 순서대로 풀어낸다: (1) 실험 배경, (2) 설계, (3) 로지스틱 모형 + 랜덤효과 유도, (4) 분산 성분 추정. 놀라운 발견 — 준-우도 추정이 단순 비율 이 되지만 공분산은 이차 과산포 — 과 과학적 결론까지 다룬다.

2 실험 배경 (§14.5.1-14.5.2)

2.1 생물학적 맥락

대상: mountain dusky salamander (산 어두운 도롱뇽). 남부 Appalachian 고지대의 동종 개체군들이 지리적으로 고립. 자연에서는 서로 만나지 않는 여러 개체군이 존재.

연구 질문: “지리적 격리만으로 교배 장벽이 진화하는가?” — 종분화 (speciation) 의 초기 메커니즘 검증.

실험: Arnold & Verrell (U. Chicago, 1986) 이 Rough Butt (RB)Whiteside (WS) 두 개체군을 선택. 실험실에서 강제로 만나게 하여 짝짓기 성공률 관찰.

2.2 설계 구조

40 마리 × 3 반복: - Summer ’86 (여름), Fall ’86 re-run (가을 재실험), Fall ’86 (가을 신규). - Summer ’86 과 Fall ’86 re-run 은 같은 동물 (이례적 — 장기 영향 평가).

각 실험마다 40 마리: - RBM 1-10 (Rough Butt 수컷 10), RBF 1-10 (Rough Butt 암컷 10) - WSM 1-10 (Whiteside 수컷 10), WSF 1-10 (Whiteside 암컷 10)

2.3 짝 구성 — 교차 설계

각 암컷은 6 번 의 교배 기회 (6 일): - 3 회: 같은 개체군 수컷 (homogamic) - 3 회: 다른 개체군 수컷 (heterogamic)

예: RBF 1 은 - June 4, 12, 20: RBM 1-5 중 1 마리씩 (RB homo) - June 8, 16, 24: WSM 1-5 중 1 마리씩 (RB-WS hetero)

중요한 분리: RBF 1-5 는 RBM/WSM 1-5 만 만남. RBF 6-10 은 RBM/WSM 6-10 만 만남. 즉 데이터가 두 블록 × 2 반복 구조.

직관: 왜 교차 설계가 GLMM 을 요구하는가

중첩 (nested) 설계: 학교 안 학급 안 학생. 각 수준이 유일한 상위 수준에 속함. 교차 (crossed) 설계: 수컷 × 암컷. 같은 수컷이 여러 암컷과, 같은 암컷이 여러 수컷과 짝짓기.

교차 설계에서는: - 수컷 효과와 암컷 효과가 독립 차원 — 한쪽을 제거해도 다른 쪽 정보가 남음. - 계산상 \(\gamma_M, \gamma_F\)따로 적분해야 함 — 고차원 적분. - 중첩보다 식별성 · 계산 모두 어려움.

Salamander 데이터의 \(10 \times 10 = 100\) 짝 조합 을 이진 반응으로 관찰해 두 개체군 랜덤효과를 동시 추정하는 것이 §14.5 의 기술적 도전이다.

2.4 네 가지 교배 유형 (cross type)

암컷 수컷 약어 장벽 예상
RBF RBM R/R 없음 (homogamic)
RBF WSM R/W 있음?
WSF RBM W/R 있음?
WSF WSM W/W 없음 (homogamic)

과학 가설: homogamic (R/R, W/W) > heterogamic (R/W, W/R) 이면 생식 격리 존재. 비대칭 (R/W ≠ W/R) 이면 방향성 있는 장벽.

3 데이터 관찰 (§14.5.2 계속)

3.1 Summer ’86 결과 요약 (Table 14.7)

40 마리 실험의 수집 후 4 블록 × 5 짝 총합:

RBM 1-5 WSM 1-5 RBM 6-10 WSM 6-10
RBF 1-5 15 12
WSF 6-10 5 12
RBF 6-10 7 8
WSF 1-5 2 9

각 cell 은 5 암컷 × 3 기회 = 15 짝짓기 중 성공한 횟수.

3.2 눈으로 본 생식 격리 증거

  • R/R 블록: \(15/15 + 7/15 = 22/30 \approx 73\%\)
  • R/W 블록: \(12/15 + 8/15 = 20/30 \approx 67\%\)
  • W/R 블록: \(5/15 + 2/15 = 7/30 \approx 23\%\) — 현저히 낮음
  • W/W 블록: \(12/15 + 9/15 = 21/30 = 70\%\)

\(W/R\) (WS 암컷 × RB 수컷) 이 다른 세 조합의 1/3 수준. 비대칭 생식 장벽의 강력한 시사.

3.3 표면적 계산의 함정

단순 \(\chi^2\) 검정이나 로지스틱 회귀로 이 차이의 유의성을 평가하면 과대 유의 결과가 나올 위험. 이유: 같은 동물이 여러 번 관측되어 관측치가 독립이 아님. 이것이 표준 방법이 실패하는 지점이고, §14.5 의 나머지가 해결할 문제다.

4 로지스틱 모형 + 랜덤효과 (§14.5.3)

4.1 고정효과 모형 (14.10)

첫 시도 — 모든 효과를 고정으로:

\[ \text{logit}(\pi_{ij}) = \text{individual female effect}_i + \text{individual male effect}_j + \text{cross effect}. \tag{14.10} \]

  • 암컷 효과: 20 수준 (개별 동물 식별).
  • 수컷 효과: 20 수준.
  • Cross 효과: 4 수준 (R/R, R/W, W/R, W/W).

4.2 왜 이 모형이 실패하는가 — 세 가지 이유

실패 1 — 부분 Aliasing: Cross 효과가 암컷 + 수컷 효과의 일부와 별칭 (aliased). 예: “RBF 1 vs WSF 1” 차이는 이미 개별 효과에 담겨있어 “R-암컷 vs W-암컷” 대조가 분리 추정 불가. 대부분의 관심 대조가 식별 불가.

실패 2 — \(\pm\infty\) 추정: Summer ’86 에서 RBF 2, 5 는 \(6/6\) 성공 → 이들의 개별 효과가 \(+\infty\). 로지스틱 회귀가 수렴 실패. 과학적으로 “이 5 번 암컷의 절대 효능” 을 말하는 것도 의미 없음.

실패 3 — 과학적 무의미: “이 특정 RBF 5 의 선호” 가 일반화 가능하지 않음. Arnold-Verrell 연구의 목적은 개체군 (population) 의 특성 — 개별 동물은 표본.

세 실패가 가리키는 공통 해답 — 랜덤효과

세 실패 모두 “개별 효과를 자유 모수로 두는 것 이 잘못된 과학 모형” 임을 말한다. 해답은 §14.3 에서 본 대로 개별 효과에 분포 가정 부과:

\[\gamma_M \sim N(0, \sigma_M^2) \text{ i.i.d.}, \qquad \gamma_F \sim N(0, \sigma_F^2) \text{ i.i.d.}\]

이렇게 하면: - \(\pm\infty\) 문제 해소 (분포가 극단을 축소). - \(20 \times 2 = 40\) 자유도가 \(\sigma_M^2, \sigma_F^2\) 2 자유도 로 축약 — cross 대조의 rank 복원. - 추론 대상이 “개체군 분산” — 과학 질문에 정확히 부합.

4.3 준-우도 추정의 놀라운 단순성 (14.12)

McCullagh-Nelder 가 §14.5.3 에서 유도하는 핵심 결과:

\[ \widehat\pi_{RR} = \sum_{R/R} Y_{ij} / 30, \qquad \widehat\pi_{RW} = \sum_{R/W} Y_{ij} / 30, \qquad \ldots \tag{14.12} \]

단순 비율. “cross type 별 성공 횟수 / 시도 횟수”.

놀라운 사실: \(\widehat\pi\)점 추정치는 \(\sigma_F^2, \sigma_M^2\) 에 의존하지 않는다. 분산 성분이 정확히 추정되든 편향되든 \(\widehat\pi\) 는 고정.

4.4 왜 이렇게 단순한가

점수 방정식 \(U = D^T V^{-1}(y - \mu) = 0\) 에서 설계의 균형 때문에 \(V^{-1}\) 이 상수 벡터에 작용할 때 해가 \(V\) 무관해진다.

구체적으로: 각 cross type 에 정확히 30 짝짓기. 4 cross × 30 = 120 관측. 각 암컷이 4 cross 중 2 개에, 각 수컷도 2 개에 배정. 이 균형이 \(V^{-1}\) 을 “단순 평균” 연산으로 환원.

일반 원칙: 균형 설계 (balanced design) 에서 점 추정이 공분산 구조에 robust. 이것이 \(\widehat\pi_{RW} - \widehat\pi_{WR}\) 같은 대조의 해석 용이성을 보장.

4.5 공분산 (14.13) — 이차 과산포 출현

점 추정은 단순하지만 공분산\(\sigma_F^2, \sigma_M^2\) 에 의존:

\[ 30 \text{cov}(\widehat\pi) = \Pi(I - \Pi) + G \begin{pmatrix} 2(\sigma_F^2 + \sigma_M^2) & 3\sigma_F^2 & 3\sigma_M^2 & 0 \\ 3\sigma_F^2 & 2(\sigma_F^2 + \sigma_M^2) & 0 & 3\sigma_M^2 \\ 3\sigma_M^2 & 0 & 2(\sigma_F^2 + \sigma_M^2) & 3\sigma_F^2 \\ 0 & 3\sigma_M^2 & 3\sigma_F^2 & 2(\sigma_F^2 + \sigma_M^2) \end{pmatrix} G. \tag{14.13} \]

  • 첫 항 \(\Pi(I - \Pi)\): 이항 분산 성분. 관측 수 30 이면 \(\pi(1-\pi)/30\) 정도.
  • 둘째 항: 랜덤효과 기여\(G = \text{diag}(g(\pi))\), \(g(\pi) = \pi(1-\pi)\) 근사.

구조 해석: - 대각: \(2(\sigma_F^2 + \sigma_M^2) \cdot g^2(\pi)\) — 각 cross 의 두 랜덤효과 기여 합. - \((R/R, R/W)\) 대각 외 \(3\sigma_F^2 g(\pi_{RR}) g(\pi_{RW})\): 같은 RBF 여성이 R/R 과 R/W 양쪽에 등장하므로 공분산. - \((R/R, W/R)\) \(3\sigma_M^2\): 같은 RBM 남성이 양쪽에 등장. - \((R/R, W/W)\) = 0: 공유 동물 없음.

4.6 해석 — 랜덤효과가 cross type 간 상관을 만든다

고정효과만 고려하면 4 cross type 이 독립. 랜덤효과 도입으로 공유 동물의 랜덤 효과 가 양의 상관을 유발 — 같은 RBF 가 R/R 에서 성공했다면 R/W 에서도 (그 동물의 고유 효능이 높다면) 성공할 확률 커짐.

이 상관이 cross 대조의 SE 를 키운다. \(\widehat\pi_{RR} - \widehat\pi_{RW}\) 의 분산은 \(\text{var}(\widehat\pi_{RR}) + \text{var}(\widehat\pi_{RW}) - 2\text{cov}\) — 양의 공분산은 SE 를 줄이지만, 랜덤효과 존재 자체는 분산을 키워서 순 효과는 설계에 따라 다름. Salamander 에서는 전체적으로 SE 증가.

5 분산 성분 추정 (§14.5.4)

5.1 이차 형식 접근

§14.4 의 틀을 그대로 적용. 공분산의 가법 분해:

\[ V(\pi) = V_0(\pi) + \sigma_F^2 V_1(\pi) + \sigma_M^2 V_2(\pi). \]

\(V_0\) = 이항 항 (첫 번째 행렬), \(V_1\) = 암컷 랜덤효과 행렬, \(V_2\) = 수컷 랜덤효과 행렬.

이차 형식 두 개 필요. 자연스러운 선택: - \(Q_F\): 암컷별 총합 (충분 통계량 \(S\) 의 여성 marginal) 의 제곱합. - \(Q_M\): 수컷별 총합의 제곱합.

\(E(Q_F), E(Q_M)\)\(\sigma_F^2, \sigma_M^2\) 에 선형 → \(2 \times 2\) 연립방정식.

5.2 Table 14.9 — Summer ’86 분해

McCullagh-Nelder 의 계산:

Source Mean square \(E(\text{Mean square})\) \(\widetilde\sigma^2\)
RBF 2.844 \(1.253 + 1.308 \sigma_F^2 - 0.058 \sigma_M^2\)
WSF 2.844 \(1.167 + 1.133 \sigma_F^2 - 0.051 \sigma_M^2\)
Total F 5.689 \(2.420 + 2.441 \sigma_F^2 - 0.109 \sigma_M^2\) \(\widetilde\sigma_F^2 = 1.370\)
RBM 2.100 \(1.123 + 1.051 \sigma_M^2 - 0.047 \sigma_F^2\)
WSM 1.878 \(1.297 + 1.401 \sigma_M^2 - 0.062 \sigma_F^2\)
Total M 3.978 \(2.420 + 2.452 \sigma_M^2 - 0.109 \sigma_F^2\) \(\widetilde\sigma_M^2 = 0.696\)

해법 (Summer ’86):

\[ \begin{cases} 5.689 = 2.420 + 2.441 \sigma_F^2 - 0.109 \sigma_M^2 \\ 3.978 = 2.420 + 2.452 \sigma_M^2 - 0.109 \sigma_F^2 \end{cases} \]

2 × 2 연립 풀어 \(\widetilde\sigma_F^2 = 1.370\), \(\widetilde\sigma_M^2 = 0.696\).

5.3 세 실험의 pooled 결과 (Table 14.10)

Experiment \(\widehat\pi_{RR}\) \(\widehat\pi_{RW}\) \(\widehat\pi_{WR}\) \(\widehat\pi_{WW}\) \(\widetilde\sigma_F^2\) \(\widetilde\sigma_M^2\)
Summer ’86 0.733 0.667 0.233 0.700 1.370 0.696
Fall ’86 re-run 0.600 0.467 0.233 0.667 0.979 0.600
Fall ’86 0.667 0.533 0.167 0.633 0.395 1.344
Pooled 0.667 0.556 0.211 0.667 0.915 0.880

5.4 음의 추정치 가능성

“negative estimates are not impossible” — §14.4 에서 언급한 MoM 일반 문제. Salamander 데이터에서는 Fall ’86 의 \(\widetilde\sigma_F^2 = 0.395\) 가 다른 두 실험보다 작지만 여전히 양수. 안정적 추정.

5.5 결과 해석

\(\widehat\pi_{WR} = 0.21\) vs 나머지 \(\approx 0.67\)현저한 차이 — 세 실험 모두에서 일관.

\(\widetilde\sigma_F^2 \approx \widetilde\sigma_M^2 \approx 0.9\)개체 간 변동이 상당. 이항 예측의 분산 \(\pi(1-\pi) \approx 0.22\) 에 비해 랜덤효과 기여 \(\sigma^2 g^2(\pi) \approx 0.9 \times 0.22^2 \approx 0.044\). 종합 공분산 (14.13) 에서 두 항이 비슷한 규모.

6 최종 과학적 결론

6.1 Mixed contrast — 생식 격리의 비대칭

핵심 대조:

\[\widehat\pi_{RW} - \widehat\pi_{WR} = 0.556 - 0.211 = 0.345.\]

SE: \(0.0904\) (pooled covariance 식 14.13 에서 계산).

\(t\)-비: \(0.345/0.0904 = 3.81\), \(p < 0.001\). 매우 유의.

생물학적 해석: - RBF × WSM 는 성공 (\(\pi_{RW} = 0.56\)) — WS 수컷이 RB 암컷을 거부하지 않음. - WSF × RBM 는 실패 (\(\pi_{WR} = 0.21\)) — WS 암컷이 RB 수컷을 거부.

비대칭 생식 격리: WS 암컷이 선택적 거부자 (selective rejector). RB 수컷의 구애 행동이 WS 암컷의 선호를 만족시키지 못함. 진화 생물학의 암컷 선택 (female choice) 이론과 일치.

6.2 Homogamic 차이 없음

\(\widehat\pi_{RR} = \widehat\pi_{WW} = 0.667\). 두 개체군의 내부 교배 성공률은 동일. WS 자체가 “까다로운 종” 인 것이 아니라 이종 수컷 을 거부하는 것.

6.3 랜덤효과가 총 변동의 절반

“The random effects account for about half of the total variability in the parameter estimates.”

이항 분산 vs 랜덤효과 분산의 약 1:1 기여. 표준 로지스틱 회귀를 사용하면 SE 를 50% 과소평가 — 즉 유의성을 실제의 2 배로 주장할 위험.

6.4 수컷 효과 지속성 vs 암컷 효과 단기성

Summer ’86 과 Fall ’86 re-run 의 같은 동물 사용으로부터:

수컷 랜덤효과는 수개월 지속하지만 암컷 효과는 단기적.”

생물학적 해석: 수컷의 구애 행동 · 페로몬은 개체 고유의 장기 특성, 암컷의 수용성은 생리 주기 · 맥락 의존적 으로 변동. 부가 과학적 발견.

7 Python 실전 — GLMM 적합

7.1 데이터 구성

import numpy as np
import pandas as pd

# Summer '86 데이터 (Table 14.4 기반 재구성)
# 각 행: (female_id, male_id, female_pop, male_pop, cross_type, success)
# 구체 값은 예시 — 실제 Table 14.4 에서 읽어 와야 함

np.random.seed(42)

data = []
for exp in ['Summer86']:
    # 블록 1: RBF 1-5 × (RBM 1-5, WSM 1-5)
    for f_id in range(1, 6):
        for trial in range(3):  # 3 기회
            data.append({'fid': f'RBF{f_id}', 'mid': f'RBM{np.random.choice(range(1,6))}',
                         'fpop': 'RB', 'mpop': 'RB', 'cross': 'RR',
                         'success': np.random.binomial(1, 0.73)})
            data.append({'fid': f'RBF{f_id}', 'mid': f'WSM{np.random.choice(range(1,6))}',
                         'fpop': 'RB', 'mpop': 'WS', 'cross': 'RW',
                         'success': np.random.binomial(1, 0.67)})
    # 블록 2: WSF 6-10 × (RBM 1-5, WSM 1-5)
    for f_id in range(6, 11):
        for trial in range(3):
            data.append({'fid': f'WSF{f_id}', 'mid': f'RBM{np.random.choice(range(1,6))}',
                         'fpop': 'WS', 'mpop': 'RB', 'cross': 'WR',
                         'success': np.random.binomial(1, 0.23)})
            data.append({'fid': f'WSF{f_id}', 'mid': f'WSM{np.random.choice(range(1,6))}',
                         'fpop': 'WS', 'mpop': 'WS', 'cross': 'WW',
                         'success': np.random.binomial(1, 0.70)})
    # 블록 3, 4 생략 (같은 구조)

df = pd.DataFrame(data)
print(f"n = {len(df)}")
print(df.groupby('cross')['success'].agg(['mean', 'sum', 'count']))

7.2 준-우도 단순 비율 확인

print("\n각 cross type 의 단순 비율 π̂:")
proportions = df.groupby('cross')['success'].mean()
print(proportions)

# Mixed contrast
pi_rw = proportions.get('RW', 0)
pi_wr = proportions.get('WR', 0)
print(f"\nπ_RW - π_WR = {pi_rw - pi_wr:.3f}")

기대: 대략 \(\widehat\pi_{RR} \approx 0.73, \widehat\pi_{WR} \approx 0.23\).

7.3 GLMM 적합 (lme4 스타일 — Python statsmodels / lifelines 제한)

Python 에서 교차 랜덤효과 GLMM 은 statsmodels 가 제한적. R lme4::glmer 를 권장. Python 에서는 pymc 또는 statsmodels.BinomialBayesMixedGLM 으로 근사.

# R 코드 예시 (lme4)
# library(lme4)
# m <- glmer(success ~ cross + (1|fid) + (1|mid),
#            family=binomial, data=df)
# summary(m)
# VarCorr(m)  # σ_F², σ_M² 추정

# Python (statsmodels 는 교차 랜덤효과 제한적)
import statsmodels.api as sm
try:
    from statsmodels.genmod.bayes_mixed_glm import BinomialBayesMixedGLM
    random = {'fid': '0 + C(fid)', 'mid': '0 + C(mid)'}
    # VC (variance component) 구조로 랜덤효과 지정
    # 상세 설정은 statsmodels 문서 참조
except ImportError:
    print("BinomialBayesMixedGLM 필요")

실무 권고: Salamander 같은 교차 랜덤효과 GLMM 은 R lme4::glmer 또는 베이지안 (Stan, PyMC) 이 표준. Python 기본 툴로는 어려움.

7.4 단순 로지스틱 vs GLMM 비교 (개념)

# 단순 로지스틱 (랜덤효과 무시) — SE 과소평가
import statsmodels.formula.api as smf

df_enc = pd.get_dummies(df, columns=['cross'], drop_first=False).astype({'cross_RR': int, 'cross_RW': int, 'cross_WR': int, 'cross_WW': int})
m_simple = smf.logit('success ~ C(cross)', data=df).fit()
print("\n단순 로지스틱 (랜덤효과 무시):")
print(m_simple.summary().tables[1])

# GLMM 은 R 에서 수행 권장
# RR 을 기준으로 했을 때 RW, WR, WW 의 계수와 SE 비교
# 랜덤효과 포함 시 SE 가 약 √2 배 증가 예상 (랜덤효과가 총 변동의 절반)

8 요약 — §14.5 의 네 가지 교훈

8.1 교훈 1 — 교차 랜덤효과는 GLMM 의 가장 도전적 설계

중첩 (nested) 보다 교차 (crossed) 가 계산 · 해석 모두 어렵다. Salamander 가 이 분야의 표준 벤치마크 가 된 이유. 새 추정 방법이 나오면 Salamander 로 먼저 검증.

8.2 교훈 2 — 고정효과 접근의 세 실패 패턴

  1. 개별 효과 \(\pm\infty\) (perfect separation).
  2. 관심 대조의 aliasing.
  3. 과학적 무의미 (개별 개체 효과 vs 모집단 효과).

이 세 패턴이 보이면 랜덤효과가 유일한 해결책. Salamander 는 세 가지 모두 나타나는 교과서적 예.

8.3 교훈 3 — 균형 설계에서 점 추정의 robust 성

(14.12) 가 보여 주듯 잘 균형 잡힌 설계 에서는 점 추정이 공분산 가정에 robust. 분산 성분이 틀려도 \(\widehat\pi\) 는 같다. 실무 함의: 설계 단계에서 균형 확보 가 추정 강건성을 결정.

8.4 교훈 4 — 랜덤효과의 크기 평가

Salamander 에서 “랜덤효과가 총 변동의 절반” 은 흔한 크기. SE 를 2 배 정도 키운다 는 경험칙. 랜덤효과 무시하면 유의성을 쉽게 과대 선언.

8.5 한 줄 정리

Salamander 교배 실험은 “교차 랜덤효과 GLMM 의 모든 도전 — 고정효과 실패 · 준-우도 단순 점 추정 · 이차 과산포 공분산 · 이차 형식 분산 성분 추정 — 을 한 예제에 담은 교본” 이다. 과학적 결론 (WS 암컷 × RB 수컷 의 비대칭 생식 격리) 자체도 진화 생물학에서 중요한 기여.

9 관련 주제

선행 지식

관련 개념

도메인 참고

  • Arnold, S. J., Verrell, P. A., Tilley, S. G. (1993). “The evolution of asymmetry in sexual isolation: a model and a test case.” Evolution 47: 1512-1518.
  • Karim, M. R. & Zeger, S. L. (1992). “Generalized linear models with random effects; salamander mating revisited.” Biometrics 48: 631-644. — MCMC 접근.
  • Booth, J. G. & Hobert, J. P. (1999). “Maximizing generalized linear mixed model likelihoods…” JRSS B 61: 265-285. — Monte Carlo EM.

Salamander 데이터는 GLMM 문헌의 “iris” 에 해당. 사실상 모든 GLMM 방법론 논문이 이 데이터로 벤치마크를 제공.

후속 주제

Subscribe

Enjoy this blog? Get notified of new posts by email: