본문 바로가기
데이터분석

k-평균 군집분석

by 쓱쓱기획 2021. 5. 22.
반응형


대표적인 비계층적인 군집분석으로 원하는 군집 수만큼(k개) 초기값을 지정하고
각 개체(데이터)를 가까운 초기값에 할당하여 군집을 형성한 뒤
각 군집의 평균을 재계산하여 초기 값을 갱신함

비계층적인 군집분석

 

갱신된 값에 대해 위의 할당 과정을 반복하여 K개의 최종 군집을 형성
대상들의 특성에 기초하여 유사한 성질을 갖는 대상들을
동일한 집단으로 분류하는 기법이다.


K-means clustering의 동작



개별 데이터들이 얼마나 유사한지를 측정하기 위하여
가장 보편적인 방법인 거리(distance) 함수를 사용하는 분석 방법이다. 


k-평균 군집(k-means clustering)은 원하는 군집 수만큼(k개) 초기값을 지정하고,
각 개 체(데이터)를 가까운 초기값에 할당하여 
군집을 형성한 뒤,
 
군집 평균을 재계산하여 초기값을 갱신한다.
갱신된 값에 대해 위의 할당 과정을 반복하여 
k개의 최종 군집을 형성한다.

 

거리(distance) 함수를 사용

 

k-평균 군집분석 장/단점 

k-평균 장/단점

반응형

'데이터분석' 카테고리의 다른 글

데이터의 이해  (0) 2021.09.19
데이터 분석 개요  (0) 2021.08.06
데이터분석 준전문가 ADsP 도전  (0) 2021.05.09
빅데이터의 유형  (0) 2021.04.03
빅데이터의 개요 및 특징  (0) 2021.03.27