반응형
데이터의 출처? 모집단인가(관심대상 전체)? 표본인가(부분)?
#모수(parameter): 모집단을 대상으로 하는 말로 정확하게 표현하기 어려움
#검정통계량: 연산에 대한 결과값
#대표값: 평균, 분산(데이터의 흩어짐 정도)
ⓐ대응표본 t검정: 전후 비교처럼 같은 표본이 다른 집단에 속해져 있는 경우를 말한다.(집단비교보다는 차이의 분포)
t값=(difference/차이의 표준편차 루트 데이터갯수)
#가설설정>데이터 정규성 검정> T-test >결론
ㄴ 분산동질성 검정을 안하는 이유? 집단이 두 개가 있어야 비교가 가능한데 대응표본 테스트는 d라는 집단 하나를 보기 때문에 동질성 검정을 할 대상이 없음
①데이터정규성 검정
read.csv(file="C:/test/htest02d.csv",header=TRUE)
groupAd <- raw_d[,1]
groupBd <- raw_d[,2]
mean(groupAd)
mean(groupBd)
ㄴW = 0.88826, p-value = 0.1621 > 0.05(귀무가설채택)
②t.test
ㄴt.test(groupAd,groupBd,alternative="less",paired=TRUE)
#paired=TRUE: 쌍=대응표본
반응형
'data analysis, R' 카테고리의 다른 글
R-공부: 여러가지 가설 검정 방법(ANOVA검정) (0) | 2021.04.28 |
---|---|
R-공부: 여러가지 가설 검정 방법(z검정) (0) | 2021.04.27 |
R공부- 가설검정:이론 (0) | 2021.04.26 |
가설검정-실습(ⓐT검정) (0) | 2021.04.26 |
R공부- 데이터 정제(결측치) (0) | 2021.04.24 |
댓글