WIKI


클러스터링(Clustering)

blaire

빅데이터 안에서 특성을 가진 군집을 찾는 분석 방법이다. DAVinCI LABS로 구현되는 분석 방법 중 하나로 데이터 특성의 유사도를 측정해서 유사도가 높은 집단끼리 묶어주는 방법을 의미한다. 클러스터링 방법을 사용하면 사용자는 모든 데이터를 전부 확인하지 않아도 클러스터링 기법으로 유사한 집합들의 대표값을 확인해 특징을 빠르게 파악할 수 있어서 매우 효율적이다. 클러스터링의 종류에는 지도학습 클러스터링과 비지도학습 클러스터링이 있다. 지도학습 클러스터링은 정확한 타겟을 정하고 군집을 찾아내는 방법이며, 비지도학습 클러스터링은 데이터에 의해서 특징을 묶어주는 방법을 일컫는다.