본문 바로가기
data analysis, R

R-공부: 여러가지 가설 검정 방법(대응 표본 T검정)

by 데이터 퍼즐 2021. 4. 27.
반응형

 

데이터의 출처? 모집단인가(관심대상 전체)? 표본인가(부분)?

 

#모수(parameter): 모집단을 대상으로 하는 말로 정확하게 표현하기 어려움

#검정통계량: 연산에 대한 결과값

#대표값: 평균, 분산(데이터의 흩어짐 정도)

 

ⓐ대응표본 t검정: 전후 비교처럼 같은 표본이 다른 집단에 속해져 있는 경우를 말한다.(집단비교보다는 차이의 분포)

t값=(difference/차이의 표준편차 루트 데이터갯수)

 

#가설설정>데이터 정규성 검정> T-test >결론

ㄴ 분산동질성 검정을 안하는 이유? 집단이 두 개가 있어야 비교가 가능한데 대응표본 테스트는 d라는 집단 하나를 보기 때문에 동질성 검정을 할 대상이 없음

 

①데이터정규성 검정

read.csv(file="C:/test/htest02d.csv",header=TRUE)

groupAd <- raw_d[,1]
groupBd <- raw_d[,2]

mean(groupAd)
mean(groupBd)

ㄴW = 0.88826, p-value = 0.1621 > 0.05(귀무가설채택)

 

 

②t.test

ㄴt.test(groupAd,groupBd,alternative="less",paired=TRUE)

#paired=TRUE: 쌍=대응표본

 

 

반응형

댓글