반응형
1. 다차원 척도법
1) 정의 및 목적
- 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후, 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 또는 3차원 공간에서 점으로 표현하는 분석방법
- 목적 : 개체들의 비유사성을 이용하여 2차원 공간상에 점으로 표시하고 개체들 사이의 집단화를 시각적으로 표현
2) 방법
- 개체들의 거리 계산은 유클리드 거리행렬을 활용
- STRESS : 개체들을 공간상에 표현하기 위한 방법으로 STRESS나 S-STRESS를 부족합도 기준으로 사용
*최적모형의 적합은 부적합도를 최소로 하는 방법으로 일정 수준 이하로 될 때까지 반복해서 수행
3) 종류
계량적 MDS | - 데이터가 구간척도나 비율척도인 경우 활용 (전통적인 다차원척도법) - N개의 케이스에 대해 p개의 특정변수가 있는 경우, 각 개체들 간의 유클리드 거리행렬을 계악하고 개체들 간의 비유사성 S(거리제곱 행렬의 선형함수) 를 공간상에 표현 |
비계량적 MDS | - 데이터가 순서척도인 경우 활용, 개체들 간의 거리가 순서로 주어진 경우에는 순서척도를 거리의 속성과 같도록 변환 하여 거리를 생성한 후 적용 |
2. 주성분분석
1) 정의 및 목적
- 상관관계가 있는 변수들을 결합해 상관관계가 없는 변수로 분산을 극대화하는 변수로, 선형결합으로 변수를 축약, 축소하는 기법
- 목적 : 여러 변수들을 소수의 주성분으로 축소하여 데이터를 쉽게 이해하고 관리 주성분 분석을 통해 차원을 축소하여 군집분석에서 군집화 결과와 연산 속도 개선, 회귀분석에서 다중공선성 최소화
2) 주성분분석 vs 요인 분석
- 요인 분석 : 등간 척도(혹은 비율 척도)로 두 개 이상의 변수들을 잠재되어 있는 공통 인자를 찾아내는 기법
- 공통점 : 모두 데이터를 축소하는데 활용, 몇 개의 새로운 변수들로 축소
차이점 | 생성된 변수의 수와 이름 | 생성된 변수들 간의 관계 | 목표변수와의 관계 |
요인분석 | 몇 개로 지정할 수 없으나, 이름을 붙일수 있음 |
생성된 변수들이 기본적으로 대등한 관계 | 목표변수를 고려하지 않고 주어진 변수들간 비슷한 성격들을 묶음 |
주성분분석 | 제1주성분, 제2주성분 ...을 생성(보통 2개), 이름은 제1주성분과 같이 정해짐 | 제1주성분, 제2주성분 순으로 중요함 | 목표변수를 고려하여 주성분 변수 생성 |
3) 주성분의 선택법
- 누적 기여율이 85% 이상이면 주성분의 수로 결정할 수 있음
- Scree plot에서 고유값이 수평을 유지하기 전 단계로 주성분의 수를 선택
반응형