Machine Learning
통계의 그룹별 분석의 기초 - Anova ( 분산 분석 )
흰곰곰
2019. 10. 9. 21:21
통계 및 분석에서 가장 기초가 되는 Anova 분석입니다. (일원분산분석 뿐만아니라 다중분산분석이 있지만 다루지않았습니다. 추후에 추가하겠습니다.)
1. 일원분산분석
1) 정의
- 표본의 분산에 대한 차이를 검정하는 방법은 카이제곱 검정과 F Test(F 검정)으로 구분된다.
- 카이제곱 검정은 단일표본의 모집단이 정규분포를 따르며 분산을 미리 알고 있는 경우에 적용된다.
- 그러나 통계 과정에서 이를 알고 있는 경우는 드물기 때문에 모집단을 알고 있지 않은 경우의 F Test를 중심으로 분석한다.
- F Test는 두 표본의 분산에 대한 차이가 통계적으로 유의한가를 판별하는 검정기법이다.
- 분산의 유의차 분석이기 때문에 var test로도 불린다.
- R2 = SSR / SSE ( 1에 가까울 수록 종속변수가 설명되는 양이 많아서 의미가 있다.)
- F유의수준 ( 1, n-2 ) 검정을 따른다.
- 파이썬에서 p-value 구하는 법 stats.f.sf(F값 ,1, n-2) ==> 0.05(유의수준)보다 작으면 기각