본문 바로가기
데이터분석

기초 통계분석

by 쓱쓱기획 2021. 11. 8.
반응형

1. 기술 통계
- 기술통계 : 자료의 특성을 표, 그림, 통계량 등을 사용해 쉽게 파악할 수 있도록 정리/요약하는 것

1) 통계량에 의한 자료 정리 
- 중심 위치의 측도 : 평균, 중앙값, 최빈값
- 산포의 측도 : 분산, 표준편차, 범위, 사분위 범위, 변동 계수, 표준오차
- 분포의 형태 : 왜도, 첨도

https://youtu.be/-AyjMFFkdzA 


2) 그래프를 통한 자료 정리
- 범주형 자료 : 막대그래프, 파이차트, 모자이크 플릿 등
- 연속형 자료 : 히스토그램, 줄기-잎 그림, 상자 그림 등 

 

2. 인과관계의 이해
1) 용어 
- 종속변수(반응변수, y), 독립변수(설명변수, x), 산점
- 산점도에서 확인 할 수 있는 것 
  * 두 변수 사이의 선형 관계가 성립하는가?
  * 두 변수 사이의 함수관계가 성립하는가?
  * 이상값의 존재 여부와 몇 개의 집단으로 구분되는지를 확인 


2) 공분산(covariance)
- 두 변수간의 상관 정도를 상관계수를 통해 확인할 수 있음


3. 상관분석
1) 정의와 특성 
- 상관분석 : 두 변수 간의 관계를 상관계수를 이용하여 알아보는 분석 방법
- 상관계수가 1에 가까울수록 강한 양의 상관관계, 상관계수가 -1에 가까울수록 강한 음의 상관관계를 가짐
- 상관계수가 0인 경우 데이터 간의 상관이 없음 

2) 유형

구분 피어슨 스피어만
개념 등간척도 이상으로 측정된 두 변수의
상관관계 측정
순서, 서열 척도인 두 변수들 간의 상관관계를 측정
특징 연속형 변수, 정규성 가정 순서형 변수, 비모수적 방법
상관계수 피어슨 y(적률상관계수) 순위상관계사 p(로우)
R코드 cor(x, y, method=c("pearson", "kendall", "spearman"))

 

반응형

'데이터분석' 카테고리의 다른 글

시계열 분석  (0) 2021.11.10
회귀분석  (0) 2021.11.09
통계분석의 이해  (0) 2021.11.07
기초분석 및 데이터 관리  (0) 2021.11.06
변수의 구간화  (0) 2021.11.05