「분산분석. 정의」

 

셋 이상의 집단 간 평균 차이에 대한 통계적 유의성을 검정하는 기법으로 자료간의 차이를 대조시키는 분석기법임. 집단 간 평균을 비교하는 것이 분석의 목적이며 독립변수는 범주형으로 종속변수는 연속형이어야 함

 

「분산분석. 종류」

 

요인의 개수에 따라 일원, 이원, 다원분석분석으로 나뉨.

 

① 【일원분산분석】 하나의 요인과 하나의 종속변수 간의 관계를 분석하는 것

② 【이원분산분석】 두 개의 요인과 하나의 종속변수 간의 관계를 분석하는 것으로, 집단에 1개의 관측치가 있어 주효과를 분석하는 반복 없는 이원분산분석과 집단에 2개 이상의 관측치가 있어 주효과 뿐만 아니라 상호작용효과도 분석하는 반복 있는 이원분산분석이 있음.

③ 【다원분산분석】 세 개 이상의 요인과 하나의 종속변수 간의 관계를 분석하는 것

 

「분산분석. 가정」

 

① 【정규성】 모집단의 분포가 정규분포일 것

② 【독립성】 모집단 간의 오차가 서로 독립이어야 함

③ 【등분산성】 집단 간의 분산이 서로 같다는 것을 의미하며 등분산성 검증시 F값의 p값(유의확률)이 α값보다 크면 귀무가설이 채택되어 일원분산분석이 가능함

 

「분산분석. 분산의 동질성 검정」

 

Levene의 등분산 검정은 귀무가설은 '등분산이다'로 p값이 α값(0.05)보다 크면 채택하고, 연구가설은 '등분산이 아니다'로 p값이 α값(0.05)보다 작으면 채택

 

「분산분석. 가설」

검증통계량 F값은 ‘BV(Between Variance, 그룹간 분산) / WV(With Variance, 그룹내 분산)’으로 그룹내 분산과 그룹간 분산의 차이를 말하며 그룹간 유의미한 차이가 있을 겨우 귀무가설이 채택되지 않으며 F비율은 더 커지게 됨.

 

귀무가설은 모집단의 평균들은 같음을 전제하며 p값이 α값(0.05)보다 클 때 (p값 > 0.05) 채택하며, 연구가설은 모집단의 평균들 중 차이가 존재함 전제하며 p값이 α값(0.05)보다 작을 때(p값 < 0.05) 채택됨.

 

연구가설이 채택되면 적어도 하나의 집단에서 평균 차이가 있다는 의미

 

 

「분산분석. 사후분석」

앞서 연구가설이 채택되면 적어도 하나의 집단에서 평균 차이가 있다고 말했는데, 어떤 집단에서 차이가 있는지 알아보기 위해서는 사후분석을 해야 한다. 집단 간 차이를 보여주는 분석이 사후검정(post-hoc)으로 집단 간 평균값을 비교하여 통계적으로 유의미하게 나온다면 평균값의 대소값이 어떤지 알아보기 위한 분석이다. Scheffe, Duncan, Bonferroni, Tukey 등이 있음.

 

① 【등분산 가정】 Duncan(엄격성 낮음, 변인의 수 비슷), Tukey(변인의 수 비슷), Scheffe(엄격성 높음, 변인의 수 차이)

② 【등분산 미가정】 Dunnett’s T3

 


Comments.

이 내용은 스스로 분산분석을 이해하기 위해 내방식대로 해석했기 때문에, 전문가들이 보기에 틀린 부분도 있을리라 생각한다. 보시는 분들은 큰 맥락만 이해하고 더 자세하고 세부적인 내용은 책이나 다른 분들이 쓰신 글을 참고하기를 바란다.

 

반응형

+ Recent posts