본문 바로가기
데이터분석

다차원 척도법과 주성분분석

by 쓱쓱기획 2021. 11. 11.
반응형

1. 다차원 척도법

1) 정의 및 목적
- 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후, 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 또는 3차원 공간에서 점으로 표현하는 분석방법
- 목적 : 개체들의 비유사성을 이용하여 2차원 공간상에 점으로 표시하고 개체들 사이의 집단화를 시각적으로 표현

 

2) 방법
- 개체들의 거리 계산은 유클리드 거리행렬을 활용
- STRESS : 개체들을 공간상에 표현하기 위한 방법으로 STRESS나 S-STRESS를 부족합도 기준으로 사용
*최적모형의 적합은 부적합도를 최소로 하는 방법으로 일정 수준 이하로 될 때까지 반복해서 수행

3) 종류 

계량적 MDS - 데이터가 구간척도나 비율척도인 경우 활용 (전통적인 다차원척도법) 
- N개의 케이스에 대해 p개의 특정변수가 있는 경우, 각 개체들 간의 유클리드 거리행렬을 계악하고 개체들 간의 비유사성 S(거리제곱 행렬의 선형함수) 를 공간상에 표현
비계량적 MDS - 데이터가 순서척도인 경우 활용, 개체들 간의 거리가 순서로 주어진 경우에는 순서척도를
거리의 속성과 같도록 변환 하여 거리를 생성한 후 적용



2. 주성분분석 

1) 정의 및 목적
- 상관관계가 있는 변수들을 결합해 상관관계가 없는 변수로 분산을 극대화하는 변수로, 선형결합으로 변수를 축약, 축소하는 기법
- 목적 : 여러 변수들을 소수의 주성분으로 축소하여 데이터를 쉽게 이해하고 관리 주성분 분석을 통해 차원을 축소하여 군집분석에서 군집화 결과와 연산 속도 개선, 회귀분석에서 다중공선성 최소화

2) 주성분분석 vs 요인 분석
- 요인 분석 : 등간 척도(혹은 비율 척도)로 두 개 이상의 변수들을 잠재되어 있는 공통 인자를 찾아내는 기법
- 공통점 : 모두 데이터를 축소하는데 활용, 몇 개의 새로운 변수들로 축소

차이점 생성된 변수의 수와 이름 생성된 변수들 간의 관계 목표변수와의 관계
요인분석 몇 개로 지정할 수 없으나, 
이름을 붙일수 있음
생성된 변수들이 기본적으로 대등한 관계 목표변수를 고려하지 않고 주어진 변수들간 비슷한 성격들을 묶음 
주성분분석 제1주성분, 제2주성분 ...을 생성(보통 2개), 이름은 제1주성분과 같이 정해짐 제1주성분, 제2주성분 순으로 중요함 목표변수를 고려하여 주성분 변수 생성

 

3) 주성분의 선택법
- 누적 기여율이 85% 이상이면 주성분의 수로 결정할 수 있음
- Scree plot에서 고유값이 수평을 유지하기 전 단계로 주성분의 수를 선택 

반응형

'데이터분석' 카테고리의 다른 글

군집분석  (0) 2021.11.13
데이터 마이닝 개요  (0) 2021.11.12
시계열 분석  (0) 2021.11.10
회귀분석  (0) 2021.11.09
기초 통계분석  (0) 2021.11.08