본문 바로가기
data analysis, R

R공부- 가설검정:이론

by 데이터 퍼즐 2021. 4. 26.
반응형

*가설검정: '가설'을 '검정(test)'한다

ㄴ1) 가설설정: 귀무가설, 대립가설

ⓐ 귀무가설: 기존 존재, 차이나 영향X, 분석가 주장과 반대

ⓑ 대립가설: 분석가 새롭게 제시, 차이나 영향O, 분석가 채택하고 싶은(주장)가설

ㄴ양측검정, 단측검정(실무)

#단측검정사용이유: 데이터를 먼저 구한 다음 사실을 알고 가실을 세운다.

 

*가설검정 방법: 가설 세운다(귀무, 대립) → 기준 세운다(검정통계량 구한다) 결론을 내린다

ㄴ①분할표인가?(연관성) 카이제곱검정

ㄴ②그룹개수>2 ANOVA검정

ㄴ③데이터갯수>30(대표본):중심극한정리→Z검정

ㄴ④대응표본(A와B가 같은사람)대응표본T검정

ㄴ⑤대응표본 아니라면 T검정

 

* 여러가지 가설 검정 방법

데이터의 출처? 모집단인가(관심대상 전체)? 표본인가(부분)?

#모수(parameter): 모집단을 대상으로 하는 말로 정확하게 표현하기 어려움

#검정통계량: 연산에 대한 결과값

#대표값: 평균, 분산(데이터의 흩어짐 정도)

ㄴⓐT검정: 두 집단의 평균이 똑같더라도 분산이 다르면 집단이설검정: '가설'을 '검정(test)'한다

 

ㄴ1) 가설설정: 귀무가설, 대립가설

 

ⓐ 귀무가설: 기존 존재, 차이나 영향X, 분석가 주장과 반대

ⓑ 대립가설: 분석가 새롭게 제시, 차이나 영향O, 분석가 채택하고 싶은(주장)가설

ㄴ양측검정, 단측검정(실무)

 

 

*가설검정 방법: 가설 세운다(귀무, 대립) → 기준 세운다(검정통계량 구한다)→ 결론을 내린다

ㄴ①분할표인가?(연관성)→ 카이제곱검정

ㄴ②그룹개수>2→ ANOVA검정

ㄴ③데이터갯수>30(대표본):중심극한정리→Z검정

ㄴ④대응표본(A와B가 같은사람)→대응표본T검정

ㄴ⑤대응표본 아니라면 T검정

 

 

 

반응형

댓글