본문 바로가기
data analysis, R

R-공부: 여러가지 가설 검정 방법(z검정)

by 데이터 퍼즐 2021. 4. 27.
반응형

*분할표인가? no> 그룹의 개수가 2개 넘는가? no> 데이터 갯수 30개 넘는가?(대표본)= z검정

#대표본일 때 쓰는 검정방법이 z검정이다

가설설정>Z-test>결론

 

z=평균차이/루트(각 분산의합/각 갯수합)

 

*t분포 vs z분포(정규분포) : z분포가 꼬리가 더 얇게 나타남, t분포의 꼬리가 더 두터움

 

*실습: 샘플사이즈=30(대표본)

read.csv(file="C:/test/htest03.csv",header=TRUE)

groupA3 <- rawN30[rawN30$group=='A',1:2]
groupB3 <- rawN30[rawN30$group=='B',1:2]

mean(groupA3[,2])
mean(groupB3[,2])

 

ⓐ가설설정: 대립가설(181.(B)>179(A))

ⓑz테스트 설정 :z.test <- function(x1, x2){
n_x1 = length(x1)
n_x2 = length(x2)
mean_x1 = mean(x1)
mean_x2 = mean(x2)
cat("\n")
cat("\tTwo Sample z-test\n")
cat("\n")
cat("mean of x1:", mean_x1, "\n")
cat("mean of x2:", mean_x2, "\n")
var_x1 = var(x1)
var_x2 = var(x2)
z = (mean_x1 - mean_x2)/sqrt((var_x1/n_x1)+(var_x2/n_x2))
abs_z = abs(z)
cat("z =", abs_z, "\n")
p_value = 1-pnorm(abs_z)
cat("p-value =", p_value)
}

 

z.test(groupA3[,2],groupB3[,2])

=> 대립가설 채택

ⓒ결론: 대립가설 채택

 

# z테스트가 아닌 t테스트를 쓸 경우

var.test(groupA3[,2],groupB3[,2])-> 귀무가설채택

#결론: 어떤 상황에 어떤 테스트를 쓸 것인가가 중요함

반응형

댓글