반응형
1. 기술 통계
- 기술통계 : 자료의 특성을 표, 그림, 통계량 등을 사용해 쉽게 파악할 수 있도록 정리/요약하는 것
1) 통계량에 의한 자료 정리
- 중심 위치의 측도 : 평균, 중앙값, 최빈값
- 산포의 측도 : 분산, 표준편차, 범위, 사분위 범위, 변동 계수, 표준오차
- 분포의 형태 : 왜도, 첨도
https://youtu.be/-AyjMFFkdzA
2) 그래프를 통한 자료 정리
- 범주형 자료 : 막대그래프, 파이차트, 모자이크 플릿 등
- 연속형 자료 : 히스토그램, 줄기-잎 그림, 상자 그림 등
2. 인과관계의 이해
1) 용어
- 종속변수(반응변수, y), 독립변수(설명변수, x), 산점
- 산점도에서 확인 할 수 있는 것
* 두 변수 사이의 선형 관계가 성립하는가?
* 두 변수 사이의 함수관계가 성립하는가?
* 이상값의 존재 여부와 몇 개의 집단으로 구분되는지를 확인
2) 공분산(covariance)
- 두 변수간의 상관 정도를 상관계수를 통해 확인할 수 있음
3. 상관분석
1) 정의와 특성
- 상관분석 : 두 변수 간의 관계를 상관계수를 이용하여 알아보는 분석 방법
- 상관계수가 1에 가까울수록 강한 양의 상관관계, 상관계수가 -1에 가까울수록 강한 음의 상관관계를 가짐
- 상관계수가 0인 경우 데이터 간의 상관이 없음
2) 유형
구분 | 피어슨 | 스피어만 |
개념 | 등간척도 이상으로 측정된 두 변수의 상관관계 측정 |
순서, 서열 척도인 두 변수들 간의 상관관계를 측정 |
특징 | 연속형 변수, 정규성 가정 | 순서형 변수, 비모수적 방법 |
상관계수 | 피어슨 y(적률상관계수) | 순위상관계사 p(로우) |
R코드 | cor(x, y, method=c("pearson", "kendall", "spearman")) |
반응형