반응형
데이터 프레임
데이터 프레임(Data Frame): Row(행), Column(열)
빅데이터(데이터가 크다): Row가 많다, Column이 많다
문제
Row가 많을 경우 > 고사양 장비 구축(upgrade)
Column이 많을 경우 > 고급 분석 방법(machine learning)
#데이터 안 특정 변수 지칭: $
소스: #read_excel("finalexam.xlsx",sheet=1,col_names=T)
#평균값구하기
ㄴdf_finalexam <- mean(history,english)(x)
ㄴmean(df_finalexam$math) : 평균함수(파일$구하려는값) (ㅇ)
*excel파일: readxl 파일을 설치한 다음 파일을 불러들여야함
csv파일: comma.. 엑셀에서 불러들이는 속도가 빠르고 용량이 작음, 패키지 설치 없이 바로 불러들이는 것이 가능
ex) finalexam.xlsx",sheet=1,col_names=F) / read.csv("csv_exam.csv",header=T)
ㄴ 데이터 파일을 불러온 후 변수에 꼭 할당할 것 df_finalexam <-finalexam.xlsx",sheet=1,col_names=F
#저장
write.csv(df_finalexam,file="output_newdata.csv")
반응형
'data analysis, R' 카테고리의 다른 글
R공부- 데이터 전처리(조건에 맞는 데이터 가공하기) (0) | 2021.04.19 |
---|---|
R공부- 데이터 파악, 쉽게 수정하기 (0) | 2021.04.18 |
R공부- R studio의 기초 (3) 함수 (0) | 2021.04.16 |
R공부- R studio의 기초 (2) 변수 (0) | 2021.04.16 |
R공부- R studio의 기초 (1) (0) | 2021.04.15 |
댓글