목록birch (2)
My Data Story

◈ '군집' 목차 ◈ 1. K-평균 2. DBSCAN 3. HDBSCAN 4. 병합군집 5. 평균-이동 6. BIRCH BIRCH 군집 알고리즘에 대해 알아보자. 7. 유사도 전파 8. 스펙트럼 군집 9. 가우시안 혼합 모델 10. 베이즈 가우시안 혼합 모델 1. BIRCH BIRCH는 특별히 대규모 데이터 셋을 위해 고안되었다. BIRCH는 한 번만 데이터에 대해 검사하여 클러스터를 만들며 새로운 데이터에 대해 클러스터링할 때, 모든 데이터나 클러스터를 스캔하지 않고도 클러스터링할 수 있다. 훈련 과정에서 새로운 샘플을 클러스터에 빠르게 할당할 수 있는 정보를 담은 트리 구조 CF-tree 를 만든다. 특성 개수가 너무 많지 않다면(20개 이하) 배치 k-평균보다 빠르고 비슷한 결과를 만든다. 설정한 ..

◈ '군집' 목차 ◈ 1. K-평균 2. DBSCAN 3. HDBSCAN 4. 병합군집 5. 평균-이동 평균-이동 군집 알고리즘에 대해 알아보자. 6. BIRCH 7. 유사도 전파 8. 스펙트럼 군집 9. 가우시안 혼합 모델 10. 베이즈 가우시안 혼합 모델 1. 평균-이동 평균-이동은 임의의 포인트에서 시작해 특정 대역폭을 가지고 데이터가 모여 있는 곳으로 중심을 이동시키며 군집화를 수행한다. step1 원 반경을 설정해 각 샘플을 중심으로 하는 원을 그린다. step2 그 다음 원 안에 포함된 모든 샘플의 평균을 구한다. step3 원의 중심을 평균점으로 이동시킨다. step4 모든 원이 이동하지 않을 때까지 평균-이동을 계속한다(원의 중심이 포함된 샘플의 평균점일 때 까지) 평균-이동은 지역의 최대..