program_language 및 궁금한것/R 빅데이터
-
R 연산기능 정리!program_language 및 궁금한것/R 빅데이터 2019. 5. 11. 20:02
# 사칙연산 7%/%3 # 몫구하기 7%%3 # 나머지 구하기 7/3 # /는 몫과 나머지 구함 # 제곱구하기 2**2 2^2 # R이 0을 처리하는 방법 10000 # 0의 자리를 지수로 바꿔버린다 ex) e+x로 왜? 금융권에서 만들었기 때문에 0의 단위가 길다. 10000000000000000000000000000000000000000000000000000000000000000000 # 1e+67출력 5e3 # 5000 출력 # 변수만들기 var1
-
R 패키지 설치 삭제 방법program_language 및 궁금한것/R 빅데이터 2019. 5. 11. 19:46
# R 기본사용법 # 패키지 사용하기 # 스마트폰의 마켓을 떠올려 보라 # R에서는 Cran이라는 마켓(생태계)에서 필요한 패키지를 받을 수 있다. # 1. 패키지 설치하기 # 사용자 계정에 한글이 포함되어 있다면 꼭 하여야 한다. # KoNLP를 설치해보기 (한글처리하는 녀석) # install은 한번만 하면 된다. install.packages('KoNLP') # 2. 패키지 사용하기 # 스튜디오가 재시작 할 때마다 재호출 해야 한다. # 프로그램을 끄기 전까지 사용가능하다. 왜? 메모리에 올라가기 때문에( 다른 파일에서도 사용 가능 ) library(KoNLP) # 에러가 나오면 자바가 설치되지 않거나 Path설정이 안되었기 때문이다. 또는 UTF-8설정 # 3. 패키지 업데이트 하기 update...
-
R사용법 - Printprogram_language 및 궁금한것/R 빅데이터 2019. 5. 11. 18:16
print("Hello World") # cntrl + 엔터: 한라인 실행시 다음라인 이동 # alt+엔터: 해당 라인만실행 # cntrl + 엔터: 한라인 실행시 다음라인 이동 # Files - ...클릭 - 폴더 지정 - Set As Working Directory # 그럼 콘솔창에 setwd("D:/Anaconda3/dev/workspace") 이렇게 뜬다. print('Hello, siri') "siri야 이것도 된다?" # cat방법 cat('Hello! im cat!') print(1,2,3) # 1 출력 == println cat(1,2,3) # 1 2 3출력 == print # 반복문 for (i in c(1:4)) { print(i) } for (i in c(1:4)) { cat(i) }..
-
빅데이터란?program_language 및 궁금한것/R 빅데이터 2019. 5. 11. 17:27
빅데이터란? 정형데이터 - 계산이 가능한 수치성 데이터 비정형데이터 - 우리생활에서 만들수 있는 형태가 없는 모든 데이터들 뜻한다. 데이터 수집 - 가공 - (분석 - 시각화) - 예측 활용 분석 시각화는 계속 반복된다. 데이터 분석은 열로 나눈다. 아나콘다 설치시 자바 파일이 없다면 자바도 다운받아야 한다. (jre- 자바 실행환경) * 꼭 8버젼을 설치. 왜? 이후버젼은 돈을 지불해야 할 수도 있다. R프로그래밍 그래핑에 대한 장점 많은 패키지를 가지고 있고, CRAN이 존재한다. 데이터 분석에만 특화되어있다. 파이썬의 pandas가 R과 비슷하다. 왜? R이 OpenSourse니까. 무료다! 통계분석 시에는 cpu보다 그래픽 카드(gpu)가 중요하다.
-
R의 자료구조 정리요약program_language 및 궁금한것/R 빅데이터 2019. 3. 23. 19:38
R의 자료구조는 다른 언어들과 다르다.데이터 유형을 지정하지 않는다.데이터 유형과 구조를 구분해 생각한다.numeric, Date, logical R에는 총 7가지의 자료구조가 존재한다.스칼라(Scala)단순히 데이터 하나 넣는것이다.문자, 숫자, 논리등의 데이터 유형이 존재한다. 벡터(Vector)데이터가 많으면 관리를 위해 묶는것같은 데이터 유형만 가능하다.일렬로 나열한다. 행렬(Matrx)행열이 있는것같은 데이터 유형만 가능하다.ex) 엑셀 배열(Array)행렬을 층으로 나눈것파이썬의 판다스에서는 나오지 않음 데이터프레임(DataFrame)다른 데이터 유형도 가능하다. 리스트(List)리스트에는 모든 데이터 형이 다 들어올 수 있다.리스트도 차원을 가지고 있다.층으로 구분해서 모든 자료형을 담을 수..