통계 및 분석에서 가장 기초가 되는 Anova 분석입니다. (일원분산분석 뿐만아니라 다중분산분석이 있지만 다루지않았습니다. 추후에 추가하겠습니다.)
1. 일원분산분석
1) 정의
- 표본의 분산에 대한 차이를 검정하는 방법은 카이제곱 검정과 F Test(F 검정)으로 구분된다.
- 카이제곱 검정은 단일표본의 모집단이 정규분포를 따르며 분산을 미리 알고 있는 경우에 적용된다.
- 그러나 통계 과정에서 이를 알고 있는 경우는 드물기 때문에 모집단을 알고 있지 않은 경우의 F Test를 중심으로 분석한다.
- F Test는 두 표본의 분산에 대한 차이가 통계적으로 유의한가를 판별하는 검정기법이다.
- 분산의 유의차 분석이기 때문에 var test로도 불린다.
- R2 = SSR / SSE ( 1에 가까울 수록 종속변수가 설명되는 양이 많아서 의미가 있다.)
- F유의수준 ( 1, n-2 ) 검정을 따른다.
- 파이썬에서 p-value 구하는 법 stats.f.sf(F값 ,1, n-2) ==> 0.05(유의수준)보다 작으면 기각
참고 자료
'Machine Learning' 카테고리의 다른 글
통계 검정방법 - Z검정 (0) | 2019.10.09 |
---|---|
통계 검정방법 - T검정 개념설명 (0) | 2019.10.09 |
예측력이 좋은 XGBoost Regression 개념 및 python 예제 (0) | 2019.10.09 |
서포트 벡터 머신 SVM ( Support Vector Machine)의 개념 및 python예제 (0) | 2019.10.09 |
정규화 선형회귀( Regularization Regression ) - ridge, lasso, elasticnet 개념과 python 예제 (1) | 2019.10.09 |