목록Cluster (3)
My Data Story
◈ '군집 활용' 목차 ◈ 1. 개요 2. 이미지 분할, 전처리, 준지도 학습 사이킷런에서 군집을 활용해 이미지 분할, 데이터 전처리, 준지도 학습에 활용하는 방법에 대해 알아보자. 3. 이상치 탐지, 특이치 탐지 1. 군집을 사용한 이미지 분할 이미지 분할은 이미지를 세그먼트 여러 개로 분할하는 작업이다. 시맨틱 분할에서는 동일한 종류의 물체에 속한 모든 픽셀은 같은 세그먼트에 할당한다. 예를 들어 자율 주행 자동차의 비전 시스템에서 보행자 이미지를 구성하는 모든 픽셀을 '보행자' 세그먼트에 할당될 것이다. 이 경우 각 보행자는 다른 세그먼트가 될 수 있다. 여기서는 훨씬 쉬운 작업인 색상 분할을 수행해보도록 하겠다. from matplotlib.image import imread image = imr..

◈ '군집' 목차 ◈ 1. K-평균 2. DBSCAN 3. HDBSCAN 4. 병합군집 5. 평균-이동 평균-이동 군집 알고리즘에 대해 알아보자. 6. BIRCH 7. 유사도 전파 8. 스펙트럼 군집 9. 가우시안 혼합 모델 10. 베이즈 가우시안 혼합 모델 1. 평균-이동 평균-이동은 임의의 포인트에서 시작해 특정 대역폭을 가지고 데이터가 모여 있는 곳으로 중심을 이동시키며 군집화를 수행한다. step1 원 반경을 설정해 각 샘플을 중심으로 하는 원을 그린다. step2 그 다음 원 안에 포함된 모든 샘플의 평균을 구한다. step3 원의 중심을 평균점으로 이동시킨다. step4 모든 원이 이동하지 않을 때까지 평균-이동을 계속한다(원의 중심이 포함된 샘플의 평균점일 때 까지) 평균-이동은 지역의 최대..

◈ '군집' 목차 ◈ 1. K-평균 2. DBSCAN DBSCAN 알고리즘에 대해 이해하고 사이킷런에서 DBSCAN을 구현해보자 3. HDBSCAN 4. 병합 군집 5. 평균-이동 6. BIRCH 7. 유사도 전파 8. 스펙트럼 군집 9. 가우시안 혼합 모델 10. 베이즈 가우시안 혼합 모델 1. DBSAN 알고리즘 이 알고리즘은 밀집된 연속 지역을 클러스터로 정의한다. step1 (자기 자신을 포함해) ∈(epsilon) 만큼의 이웃 내에 적어도 min samples 이 있다면 이를 핵심 샘플로 간주한다. 즉 핵심 샘플은 밀집된 지역에 있는 샘플이다. step2 핵심 샘플의 이웃에 있는 모든 샘플은 동일한 클러스터에 속한다. 핵심 샘플의 이웃에 대해서도 ∈(epsilon) 거리 조사하여 이웃의 이웃으로..