data analysis, R21 R-공부: 여러가지 가설 검정 방법(z검정) *분할표인가? no> 그룹의 개수가 2개 넘는가? no> 데이터 갯수 30개 넘는가?(대표본)= z검정 ㄴ#대표본일 때 쓰는 검정방법이 z검정이다 ㄴ가설설정>Z-test>결론 z=평균차이/루트(각 분산의합/각 갯수합) *t분포 vs z분포(정규분포) : z분포가 꼬리가 더 얇게 나타남, t분포의 꼬리가 더 두터움 *실습: 샘플사이즈=30(대표본) read.csv(file="C:/test/htest03.csv",header=TRUE) groupA3 귀무가설채택 #결론: 어떤 상황에 어떤 테스트를 쓸 것인가가 중요함 2021. 4. 27. R-공부: 여러가지 가설 검정 방법(대응 표본 T검정) 데이터의 출처? 모집단인가(관심대상 전체)? 표본인가(부분)? #모수(parameter): 모집단을 대상으로 하는 말로 정확하게 표현하기 어려움 #검정통계량: 연산에 대한 결과값 #대표값: 평균, 분산(데이터의 흩어짐 정도) ⓐ대응표본 t검정: 전후 비교처럼 같은 표본이 다른 집단에 속해져 있는 경우를 말한다.(집단비교보다는 차이의 분포) t값=(difference/차이의 표준편차 루트 데이터갯수) #가설설정>데이터 정규성 검정> T-test >결론 ㄴ 분산동질성 검정을 안하는 이유? 집단이 두 개가 있어야 비교가 가능한데 대응표본 테스트는 d라는 집단 하나를 보기 때문에 동질성 검정을 할 대상이 없음 ①데이터정규성 검정 read.csv(file="C:/test/htest02d.csv",header=TR.. 2021. 4. 27. R공부- 가설검정:이론 *가설검정: '가설'을 '검정(test)'한다 ㄴ1) 가설설정: 귀무가설, 대립가설 ⓐ 귀무가설: 기존 존재, 차이나 영향X, 분석가 주장과 반대 ⓑ 대립가설: 분석가 새롭게 제시, 차이나 영향O, 분석가 채택하고 싶은(주장)가설 ㄴ양측검정, 단측검정(실무) #단측검정사용이유: 데이터를 먼저 구한 다음 사실을 알고 가실을 세운다. *가설검정 방법: 가설 세운다(귀무, 대립) → 기준 세운다(검정통계량 구한다)→ 결론을 내린다 ㄴ①분할표인가?(연관성)→ 카이제곱검정 ㄴ②그룹개수>2→ ANOVA검정 ㄴ③데이터갯수>30(대표본):중심극한정리→Z검정 ㄴ④대응표본(A와B가 같은사람)→대응표본T검정 ㄴ⑤대응표본 아니라면 T검정 * 여러가지 가설 검정 방법 데이터의 출처? 모집단인가(관심대상 전체)? 표본인가(부분).. 2021. 4. 26. 가설검정-실습(ⓐT검정) ⓐT검정: 두 집단의 평균이 똑같더라도 분산이 다르면 집단이 다르다 ㄴ평균(/n) ㄴ분산(편차(데이터값-평균)제곱의 합/n-1) ㄴ표준편차: 루트분산 ㄴ가설설정→데이터정규성 검정(ㅇ:t-test,X:비모수검정)→분산동질성 검정(=?)→T-test→결론 #정규분포를 따라야만 t-test 사용 가능 ㄴT값=(그룹1평균-그룹2평균/표준편차), 분산같은 경우 합동분산사용, 분산 다를 경우 각자 분산사용 #p-value? 귀무가설 참일 경우 표본데이터 수집될 확률이 낮다, P-value가 낮을 수록 대립가설 채택 통상적으로 P-value평균>가설설정>정규성검정(shapiro.test, qqplot(qqnorm,qqline)>분산 동질성 검정>t-test>결론 # 데이터수가 달라졌을 때 단순한 평균비교로 가설을 채.. 2021. 4. 26. 이전 1 2 3 4 5 6 다음