본문 바로가기
data analysis, R

R공부- 데이터 프레임(변수, 평균값, 저장)

by 데이터 퍼즐 2021. 4. 17.
반응형

데이터 프레임

데이터 프레임(Data Frame): Row(행), Column(열)

빅데이터(데이터가 크다): Row가 많다, Column이 많다

 

문제

Row가 많을 경우 > 고사양 장비 구축(upgrade)

Column이 많을 경우 > 고급 분석 방법(machine learning)

 

#데이터 안 특정 변수 지칭: $

소스: #read_excel("finalexam.xlsx",sheet=1,col_names=T)

 

#평균값구하기

ㄴdf_finalexam <- mean(history,english)(x)

ㄴmean(df_finalexam$math) : 평균함수(파일$구하려는값) (ㅇ)

 

*excel파일: readxl 파일을 설치한 다음 파일을 불러들여야함

 csv파일: comma.. 엑셀에서 불러들이는 속도가 빠르고 용량이 작음, 패키지 설치 없이 바로 불러들이는 것이 가능

 

ex) finalexam.xlsx",sheet=1,col_names=F) / read.csv("csv_exam.csv",header=T)

ㄴ 데이터 파일을 불러온 후 변수에 꼭 할당할 것 df_finalexam <-finalexam.xlsx",sheet=1,col_names=F

 

#저장

write.csv(df_finalexam,file="output_newdata.csv")

 

 

반응형

댓글