본문 바로가기
데이터분석

회귀분석

by 쓱쓱기획 2021. 11. 9.
반응형

1. 회귀분석의 개요 

1) 정의 
- 하나 또는 그 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계 기법
- 독립 변수가 1개 : 단순 선형 회귀분석, 독립 변수가 2개 이상 : 다중 선형 회귀분석
- 최소 제곱 법 : 측정값을 기초로 제곱 합을 만들고 그것의 최소인 값을 구하여 처리하는 방법, 잔차 제곱이 가장 작은 선을 선택 


2) 회귀분석의 검정
- 회귀식(모형)에 대한 검증 : F-검정 
- 회귀계수들에 대한 검증 : t-검정
- 모형의 설명력은 결정계수(R2)로 알 수 있음
- 단순 회귀분석의 결정계수는 상관계수 값의 제곱과 같음

3) 선형 회귀분석
- 가정

선형성 입력변수와 출력변수의 관계가 선형
독립성 잔차와 독릭변인은 관련성이 없음
등분산성 독립변인의 모든 값에 대한 오차들의 분산이 일정
비상관성 관측치들의 잔차들끼리 상관이 없어야 함
정상성 잔차항이 정규분포를 이뤄야 함

- 다중 선형 회귀분석의 다중 공선 성
*다중회귀분석에서 설명변수들 사이에 선형 관계가 존재하면 회귀계수의 정확한 추정이 곤란

- 다중공선성 검사 방법
*분산 팽창 요인 : 10 보다 크면 심각한 분제
*상태 지수 : 10 이상이면 문제가 있다고 보고, 30보다 크면 심각, 선형 관계가 강한 변수는 제거

4. 회귀분석의 종류 
- 단순 회귀, 다중회귀, 로지스틱 회귀, 다항 회귀, 곡선 회귀, 비선형 회귀 

5. 변수 선택법
- 모든 가능한 조합 : 모든 가능한 독립변수들의 조합에 대한 회귀모형을 분석해 가장 적합한 모형 선택 

전진선택법 절편만 있는 상수모형으로부터 시작해 중요하다고 생각되는 설명변수부터 차례로 모형에 추가
-> 이해 쉬움, 많은 변수에서 활용 가능, 변수 값의 작은 변동에 결과가 달라져 안정성이 부족
후진소거법 독립변수 후보 모두를 포함한 모형에서 가장 적은 영향을 주는 변수부터 하나씩 제거
-> 전체 변수들의 정보를 이용 가능, 변수가 많은 경우 활용이 어려움, 안정성 부족
단계별방법 전진선택법에 의해 변수를 추가하면서 새롭게 추가된 변수에 기인해 기존 변수가 그 중요도가 약화되면 해당 변수를 제거하는 등 단계별로 추가 또는 삭제되는 변수를 검토해 더 이상 없을 땐 중단

 

반응형

'데이터분석' 카테고리의 다른 글

다차원 척도법과 주성분분석  (0) 2021.11.11
시계열 분석  (0) 2021.11.10
기초 통계분석  (0) 2021.11.08
통계분석의 이해  (0) 2021.11.07
기초분석 및 데이터 관리  (0) 2021.11.06