이번 글에서는 비지도 학습의 대표적 알고리즘인 K-means Clustering을 파이썬 사이킷런에서 구현해보는 예제를 다루어보겠습니다. 클러스터링 데이터 불러오기 먼저, 데이터를 불러오도록 하겠습니다. 이번 글에서는 kaggle의 Mall Customers Clustering Analysis 데이터 셋을 사용했습니다. 데이터프레임의 생김새는 아래와 같습니다. 저희는 이 중에서 Annual Income 정보와 Spending Score 정보 두 가지만을 이용하여 고객들을 클러스터링 해보도록 하겠습니다. K-평균 군집화 알고리즘 전처리 먼저, 필요한 column만 골라낸 뒤에 k-means 클러스터링에 필수적인 정규화를 진행해보도록 하겠습니다. 여기서는 각 column의 최소값을 0, 최대값을 1에 매핑한..