r공부하기2 R공부- 데이터 정제(결측치) 1. 결측치 찾기 ㄴ대문자 NA(결측치) data.frame(sex=c("M","F",NA,"M","F"),score=c(5,4,3,4,NA)) ㄴNA 앞 뒤에 겹 따옴표가 없음 ㄴis.na(df) #결측치 확인 ㄴtable(is.na(df)) #결측치 빈도 * filter로 분류 시 : 어떤 변수에 결측치가 있는지 알 수 없음 ㄴ#table(is.na(df$sex) / table(is.na(df$score)로 빈도 출력하여 확인 *결측치 포함상태로 출력 ㄴmean(df$score) / sum(df$score) ㄴ#어떤 함수에서 NA라는 결과값이 나왔다면 결측치를 확인해봐야겠다는 것을 인지 *결측치 반영 : df%>%filter(is.na(score)) 2. 결측치 제외 *#결측치 제외하고 출력 : df.. 2021. 4. 24. R공부- 데이터 다듬기(그래프 그리기) 1.산점도(Scater Plot): 데이터 x,y축에 점으로 표현한 그래프(연속적 두 변수 관계 표현 시 사용) # ggplot 함수 구조: ggplot(data= mpg, aes(x=displ, y=hwy))+ geom_point()+ xlim(3,6)+ ylim(10,30) ㄴ(쓸 데이터, aes=축)+ 그래프 종류 + 세부 설정 ㄴxlim, ylim : x리밋, y리밋(제한) #표를 지정할 때 파이프기호를 썼던 것처럼 ggplot그래프에서는 '+' 기호로 연결 #ggplot()은 본격적으로 (세부지정) vs qplot은 퀵(단순하게) 2.막대 그래프(Bar Chart): 데이트 크기 막대의 길이로 표현한 그래프(성별 등 집단 간 차이 표현) *ⓐ평균막대그래프 #ggplot(data=df_mpg,ae.. 2021. 4. 23. 이전 1 다음