1. 편리한 기능
- R의 작업환경 설정 : R단축 아이콘 우측 클릭 -> 속성 -> 바로가기 -> 시작 위치에 현재 작업위치를 입력 -> 저장
- 프로그램에서 작업환경 설정 : setwd("작업디렉토리")
- 도움말 : help(함수),? 함수, RSiteSearch("함수명")
- 히스토리 : history(), savehistory(file="파일명"), loadhistory(file="파일명")
- 콘솔 청소 : Ctrl+L
2. 스크립트 사용하기
- 한 줄 실행 : Ctrl+R
- 여러 줄 실행 : 드래그 후 Ctrl+R
- 주석처리 : #
3. 패키지
- 패키지 : R 함수, 데이터 및 컴파일 코드의 모임
- 패키지 자동 설치 : install.packages("패키지명")
- 패키지 수동 설치 : install.packages("패키지명", "패키지 위치")
4. 배치 실행
- 매일 실행되어야 하는 프로그램을 시스템에서 프로세스에서 자동으로 구동하는 작업
- 배치파일 실행 명령 : 윈도우 창에서 bach.R 실행파일이 있는 위치에서 R CMD BATCH batch.R
- Path 지정 : 내 컴퓨터에 오른쪽 마우스를 클릭 -> 속성 -> 고급 시스템 설정 -> 환경변수 클릭
-> 변수명이 path를 클릭 -> R프로그램의 실행파일의 위치를 찾아서 추가 -> 저장
5. 변수 다루기
- R에서는 변수명만 선언하고 값을 할당하면 자료 형태를 스스로 인식하고 선언한다.
- 화면에 프린트하고자 할 때, print()를 사용해도 되지만 변수 값만 표현해도 내용을 출력해준다.
- 변수에 값을 할당할 때는 대입 연산자(<-, <<-, ->, ->>)를 사용할 수 있으나 <-를 추천한다.
- 메모리에 불필요한 변수가 있는지 확인하기 위해서는 ls()를 활용하고 삭제는 rm()을 활용한다.
6. 기본적인 통계량 계산
기능 | 함수 | 기능 | 함수 |
평균 | mean() | 중간값 | median() |
표준편차 | sd() | 분산 | var() |
공분산 | cov() | 상관계수 | cor() |
7. 함수의 생성 및 활용
- R은 함수형 언어이기 때문에 프로그래머가 직접 활용 가능한 함수를 생성하여 활용할 수 있다.
- 함수는 function(매개변수1, 매개변수2, ...) 선언하고 표현식이 2줄 이상인 경우는 {}로 묶어서 함수의 범위를 설정한다.
- 표현식은 변수 할당, 조건문 (if)과 반복문(for문, while문, repeat문) 그리고 전달 값(return)으로 구성된다.
8. 연산자의 우선순위
연산자 우선순위 | 뜻 | 사용 예시 |
[ [[ | 인덱스 | a[1] |
$ | 요소 뽑아내기, 슬롯 뽑아내기 | a$coef |
^ | 지수 | 5^2 |
-+ | 단항 마이너스와 플러스 부호 | -3, +5 |
: | 수열 생성 | 1:10 |
%any% | 특수 연산자 | %/% 나눗셈 몫, %% 나눗셈 나머지, %*% 행렬의 곱 |
*/ | 곱하기, 나누기 | 3*5 |
+- | 더하기, 빼기 | 3+5 |
== != <> <= >= | 비교 | 3==5 |
! | 논리 부정 | |
& | 논리 "and", 단축(short-circuit) "and" | TRUE & TRUE |
| | 논리 "or", 단축(short-circuit) "or" | TRUE | TRUE |
~ | 식(formula) | |
-> ->> | 오른쪽 대입 | 3 -> a |
= | 대입(오른쪽을 왼쪽으로) | a=3 |
<- <<- | 대입(오른쪽을 왼쪽으로) | a <- 3 |
? | 도움말 | ?lm |
'데이터분석' 카테고리의 다른 글
데이터구조와 데이터 프레임 (0) | 2021.11.03 |
---|---|
입력과 출력 (0) | 2021.11.02 |
R소개 (0) | 2021.10.31 |
데이터 분석 기법의 이해 (0) | 2021.10.30 |
KDD vs CRISP-DM의 비교 (0) | 2021.10.15 |