본문 바로가기
data analysis, R

R공부- 데이터 다듬기(그래프 그리기)

by 데이터 퍼즐 2021. 4. 23.
반응형

1.산점도(Scater Plot): 데이터 x,y축에 점으로 표현한 그래프(연속적 두 변수 관계 표현 시 사용)

# ggplot 함수 구조: ggplot(data= mpg, aes(x=displ, y=hwy))+ geom_point()+ xlim(3,6)+ ylim(10,30)

ㄴ(쓸 데이터, aes=축)+ 그래프 종류 + 세부 설정

ㄴxlim, ylim : x리밋, y리밋(제한)

#표를 지정할 때 파이프기호를 썼던 것처럼 ggplot그래프에서는 '+' 기호로 연결

 

#ggplot()은 본격적으로 (세부지정) vs qplot은 퀵(단순하게)

 

2.막대 그래프(Bar Chart): 데이트 크기 막대의 길이로 표현한 그래프(성별 등 집단 간 차이 표현)

*ⓐ평균막대그래프

 

#ggplot(data=df_mpg,aes(x=drv,y=mean_hwy))+geom_col()

ㄴ숫자가 먼저 나오고 A,B,C순으로 추출

ㄴx축 내림차순 순으로 변경원할 시 : reorder(drv,y=-mean_hwy))

 

*ⓑ빈도막대그래프

#ggplot(data=mpg,aes(x=drv))+geom_bar()

ㄴx축 범주 변수 입력시 y축은 빈도를 세서 그래프가 직접 지정을 해줌(y축 지정x)

 

3. 선그래프(Line Chart): 데이터를 선으로 표현

ㄴ시계열 그래프(Time Series Chart): 일정 시간 간격을 두고 나열된 시계열 데이터가 시간에 따라 어떻게 변하는지 표현

ㄴggplot(data=economics, aes(x=date,y=psavert))+geom_line()

 

4. 상자 그림(Box Plot): 데이터 분포를 직사각형 상자 모양으로 표현한 그래프(해석 용이, 극단값과 그 외 값들을 한눈에 비교)

ㄴggplot(data=class_mpg,aes(x=class,y=cty))+geom_boxplot()

반응형

댓글