(Draft, 바쁘니까 일단 대충이라도 적어놓음 ㅠ)
1 Description
Repeated Meausres ANOVA (반복 측정 분산 분석)
- 동일한 대상에 대해 여러 번 반복측정하여 반복측정(3번 이상) 집단 간에 차이가 존재하는지 검정
- 대응 표본 검정은 동일한 대상에 2번 반복 측정함 2개의 대응표본에 대한 검정
- 이 때, 반복 측정 기간은 집단 내 요인이라 부르고 이를 반복측정 일원분산분석-집단내요인이라고 부름
- 반복측정 기간외에 대상을 구분하는 집단 변수가 포함되면 반복측정 이원분산분석- 집단내요인 & 집단간 요인
2 Example
R console에 ?CO2를 입력하면 다음과 같은 설명이 나온다.
The CO2 data frame has 84 rows and 5 columns of data from an experiment on the cold tolerance of the grass species Echinochloa crus-galli.The \(CO_2\) uptake of six plants from Quebec and six plants from Mississippi was measured at several levels of ambient \(CO_2\) concentration. Half the plants of each type were chilled overnight before the experiment was conducted.
즉, 식물이 저온의 환경에서 견디는 정도를 실험한 데이터로 퀘벡 지역의 6개의 나무와 미시시피 지역의 6개 나무의 이산화 탄소 흡수율을 7개의 서로 다른 이산화 탄소 농도 하에서 반복적으로 측정했다.
2.1 Goals
분석의 편의를 위해 저온 처리된 나무에 한정하여 분석
- 두 지역간의 CO2흡수율의 차이를 검정
- 7개의 서로 다른 이산화탄소 농도에 따라서 이산화 탄소의 흡수율 차이를 검정
- 나무의 출신 지역과 이산화 탄소 흡수율 간의 관계가 이산화탄소 농도에 따라 달라지는 지도 검정
2.2 Data Description
2.3 Load Libraries and Data
2.4 EDA
2.5 Descriptive Statistics
data%>%
group_by(Type)%>%
summarise(count=n(),
mean_uptake=mean(uptake),
sd_uptake=sd(uptake)
)%>%knitr::kable()두 지역의 분산과 평균 흡수율이 차이가 남
data%>%
group_by(conc)%>%
summarise(count=n(),
mean_uptake=mean(uptake),
sd_uptake=sd(uptake)
)%>%knitr::kable()농도에 따라서 평균 흡수율과 분산이 약간 차이가 나는 것 같음. 다만, 고농도가 될수록 변화량이 줄어드는 것으로 보임
data%>%
group_by(Type,conc)%>%
summarise(count=n(),
mean_uptake=mean(uptake),
sd_uptake=sd(uptake)
)%>%knitr::kable()농도가 증가함에 따라 지역간 평균 흡수율의 차이가 커지는 것을 관찰할 수 있음
2.6 One-Wway ANOVA
반복 측정 일원분산분석: y~W+Error(subject) where W= a within grouping variable, subject= a sample identifier
aov(uptake~Type+Error(Plant),data=data)%>%summary()
aov(uptake~conc+Error(Plant),data=data)%>%summary()지역간 농도간 평균 흡수율이 차이가 5% 유의수준에서 유의하다.
2.7 Two-Wway ANOVA
반복측정 이원분산 분석: y~B*W+Error(subject/W) where W= within grouping variable, B =Between Group Variable, and subject= a sample identifier
지역간 농도간 집단간에서 흡수율 차이가 유의한것으로 나타나고 둘의 상호작용 또한 5% 유의수준에서 유의하다.