-
[R] 데이터 읽어오기 (pdf, csv,txt, clipboard, xlxs)program_language 및 궁금한것/R 빅데이터 2019. 12. 7. 16:29
pdf 파일을 읽어올때 아래 패키지를 install해준다.
install.packages('pdftools') library(pdftools)
개행문자를 제거하고 조회해본다
txt_pdf <- strsplit(pdf1, '\r\n') txt_pdf[[1]][2] txt_pdf[[1]]
내 pc에 있는 txt 읽어오기
read.table('data/member_no_title.txt') # ()안에는 파일 경로
인터넷에 올라와 있는 파일 읽기 ( skip = 잡음제거)
read.table('https://raw.githubusercontent.com/luxdolorosa/data_set/master/etc/member_noise.txt',skip = 3,header = T,nrows = 3)
구분자(; , 등) 를 띄어쓰기로 변환하여 읽기
csv(comma-separated values) 는 엑셀이 아니라 파일형식이다.
쉼표로 구분한 텍스트 데이터 이다.
옵션값이 없어도 구분자를 알아서 파악하여 잘~ 읽어들인다.
read.csv('https://raw.githubusercontent.com/luxdolorosa/data_set/master/etc/member_yes_sep2.txt')
클립보드 불러오기
클립보드에 저장한 내역을 불러올 수 있다. 데이터 전처리시 유용하게 사용가능하다.
read.table('clipboard', header = T, sep = ';')
엑셀 불러오기
install.packages('xlsx') library(xlsx) df_web <- read.csv('https://www.data.go.kr/comm/file/download.do?atchFileId=FILE_000000001507043&fileDetailSn=3')
엑셀저장하기
install.packages('dplyr') library(dplyr) write.xlsx(as.data.frame(cnt), 'lib_cnt.xls', row.names = F)
반응형'program_language 및 궁금한것 > R 빅데이터' 카테고리의 다른 글
[ 파이썬 ] 웹페이지 크롤링 방법 (0) 2019.12.21 [아나콘다] 주피터 초기 경로 세팅 (0) 2019.06.11 [R] numpy, pandas 사용하기 (0) 2019.06.08 [R] date package install 하기 (0) 2019.06.08 [R] 주피터노트북 폰트(글씨체) 변경 (0) 2019.06.08