본문 바로가기

Machine Learning

통계의 그룹별 분석의 기초 - Anova ( 분산 분석 )

통계 및 분석에서 가장 기초가 되는 Anova 분석입니다. (일원분산분석 뿐만아니라 다중분산분석이 있지만 다루지않았습니다. 추후에 추가하겠습니다.)



1. 일원분산분석

1) 정의
  • 표본의 분산에 대한 차이를 검정하는 방법은 카이제곱 검정과 F Test(F 검정)으로 구분된다.
  • 카이제곱 검정은 단일표본의 모집단이 정규분포를 따르며 분산을 미리 알고 있는 경우에 적용된다.
  • 그러나 통계 과정에서 이를 알고 있는 경우는 드물기 때문에 모집단을 알고 있지 않은 경우의 F Test를 중심으로 분석한다.
  • F Test는 두 표본의 분산에 대한 차이가 통계적으로 유의한가를 판별하는 검정기법이다.
  • 분산의 유의차 분석이기 때문에 var test로도 불린다.
    anaova캡쳐1
  • R2 = SSR / SSE ( 1에 가까울 수록 종속변수가 설명되는 양이 많아서 의미가 있다.)
  • F유의수준 ( 1, n-2 ) 검정을 따른다.
  • 파이썬에서 p-value 구하는 법 stats.f.sf(F값 ,1, n-2) ==> 0.05(유의수준)보다 작으면 기각


참고 자료

https://datacookbook.kr/77