본문 바로가기
데이터분석

R기초

by 쓱쓱기획 2021. 11. 1.
반응형

1. 편리한 기능
- R의 작업환경 설정 : R단축 아이콘 우측 클릭 -> 속성 -> 바로가기 -> 시작 위치에 현재 작업위치를 입력 -> 저장
- 프로그램에서 작업환경 설정 : setwd("작업디렉토리")
- 도움말 : help(함수),? 함수, RSiteSearch("함수명")
- 히스토리 : history(), savehistory(file="파일명"), loadhistory(file="파일명")
- 콘솔 청소 : Ctrl+L




2. 스크립트 사용하기 
- 한 줄 실행 : Ctrl+R
- 여러 줄 실행 : 드래그 후 Ctrl+R
- 주석처리 : #

3. 패키지 
- 패키지 : R 함수, 데이터 및 컴파일 코드의 모임
- 패키지 자동 설치 : install.packages("패키지명")
- 패키지 수동 설치 : install.packages("패키지명", "패키지 위치")

4. 배치 실행 
- 매일 실행되어야 하는 프로그램을 시스템에서 프로세스에서 자동으로 구동하는 작업
- 배치파일 실행 명령 : 윈도우 창에서 bach.R 실행파일이 있는 위치에서 R CMD BATCH batch.R
- Path 지정 : 내 컴퓨터에 오른쪽 마우스를 클릭 -> 속성 -> 고급 시스템 설정 -> 환경변수 클릭
                  -> 변수명이 path를 클릭 -> R프로그램의 실행파일의 위치를 찾아서 추가 -> 저장

5. 변수 다루기 
- R에서는 변수명만 선언하고 값을 할당하면 자료 형태를 스스로 인식하고 선언한다. 
- 화면에 프린트하고자 할 때, print()를 사용해도 되지만 변수 값만 표현해도 내용을 출력해준다. 
- 변수에 값을 할당할 때는 대입 연산자(<-, <<-, ->, ->>)를 사용할 수 있으나 <-를 추천한다. 
- 메모리에 불필요한 변수가 있는지 확인하기 위해서는 ls()를 활용하고 삭제는 rm()을 활용한다.

6. 기본적인 통계량 계산

기능 함수 기능 함수
평균 mean() 중간값 median()
표준편차 sd() 분산 var()
공분산 cov() 상관계수 cor()


7. 함수의 생성 및 활용
- R은 함수형 언어이기 때문에 프로그래머가 직접 활용 가능한 함수를 생성하여 활용할 수 있다. 
- 함수는 function(매개변수1, 매개변수2, ...) 선언하고 표현식이 2줄 이상인 경우는 {}로 묶어서 함수의 범위를 설정한다. 
- 표현식은 변수 할당, 조건문 (if)과 반복문(for문, while문, repeat문) 그리고 전달 값(return)으로 구성된다.  


8. 연산자의 우선순위 

연산자 우선순위 사용 예시
[ [[ 인덱스 a[1]
$ 요소 뽑아내기, 슬롯 뽑아내기 a$coef
^ 지수 5^2
-+ 단항 마이너스와 플러스 부호 -3, +5
: 수열 생성 1:10
%any% 특수 연산자 %/% 나눗셈 몫, %% 나눗셈 나머지,
%*% 행렬의 곱
*/ 곱하기, 나누기 3*5
+- 더하기, 빼기 3+5
== != <> <= >= 비교 3==5
! 논리 부정  
& 논리 "and", 단축(short-circuit) "and" TRUE & TRUE
| 논리 "or", 단축(short-circuit) "or" TRUE | TRUE
~ 식(formula)  
-> ->> 오른쪽 대입 3 -> a
= 대입(오른쪽을 왼쪽으로) a=3
<- <<- 대입(오른쪽을 왼쪽으로) a <- 3
? 도움말 ?lm

 

반응형

'데이터분석' 카테고리의 다른 글

데이터구조와 데이터 프레임  (0) 2021.11.03
입력과 출력  (0) 2021.11.02
R소개  (0) 2021.10.31
데이터 분석 기법의 이해  (0) 2021.10.30
KDD vs CRISP-DM의 비교  (0) 2021.10.15