반응형
대표적인 비계층적인 군집분석으로 원하는 군집 수만큼(k개) 초기값을 지정하고
각 개체(데이터)를 가까운 초기값에 할당하여 군집을 형성한 뒤
각 군집의 평균을 재계산하여 초기 값을 갱신함
갱신된 값에 대해 위의 할당 과정을 반복하여 K개의 최종 군집을 형성
대상들의 특성에 기초하여 유사한 성질을 갖는 대상들을
동일한 집단으로 분류하는 기법이다.
개별 데이터들이 얼마나 유사한지를 측정하기 위하여
가장 보편적인 방법인 거리(distance) 함수를 사용하는 분석 방법이다.
k-평균 군집(k-means clustering)은 원하는 군집 수만큼(k개) 초기값을 지정하고,
각 개 체(데이터)를 가까운 초기값에 할당하여 군집을 형성한 뒤,
각 군집의 평균을 재계산하여 초기값을 갱신한다.
갱신된 값에 대해 위의 할당 과정을 반복하여
k개의 최종 군집을 형성한다.
k-평균 군집분석 장/단점
반응형
'데이터분석' 카테고리의 다른 글
데이터의 이해 (0) | 2021.09.19 |
---|---|
데이터 분석 개요 (0) | 2021.08.06 |
데이터분석 준전문가 ADsP 도전 (0) | 2021.05.09 |
빅데이터의 유형 (0) | 2021.04.03 |
빅데이터의 개요 및 특징 (0) | 2021.03.27 |