본문 바로가기

K-Means Clustering2

ML #13 : 머신러닝 k-means Clustering 특징, 장단점, 적용 예시 (비지도학습) k-means Clustering 개요k평균 클러스터링은 앞 포스팅에서 설명한 자율학습(비지도학습)의 분류기법 입니다. k평균 클러스터링의 분류 절차는 아래와 같은 순서대로 이루어집니다. 1. 중심값 선정2. 중심값과 다른 데이터 간 거리로 분류3. 분류 완료 때까지 반복 k평균 클러스터링은 모집단 또는 범주에 대한 사전 정보가 없을 때, 주어진 관측값들 사이의 거리를 측정함으로써 유사성을 이용해서 분석할 수 있습니다. 또한, 전체 데이터를 여러 개의 집단으로 그룹화하는데, 이는 각 집단의 성격을 파악하며 데이터 전체 구조를 이해하기 위함입니다. k평균 클러스터링의 핵심은 새로운 데이터와 기존 데이터 간의 유클리디안 거리가 최소가 되도록 분류하는 것입니다. 기존 데이터를 기준점으로 유클리디안 거리를 측정.. 2020. 4. 25.
통계 분석 #11 : 군집분석의 개념, 유형, 종류선택 with R (k-means clustering) 군집분석 이란?군집분석은 동일한 성격을 가진 여러 개의 그룹으로 대상을 분류하는 것을 말합니다. 군집화 혹은 군집분석이라고 말하는 분석 방법은 대상 개체를 유사하거나 서로 관련있는 항목끼리 묶어서 몇 개의 집단으로 그룹화하거나, 각 집단의 성격을 파악함으로써 데이터 전체의 구조에 대한 이해를 돕고자하는 탐색적 분석방법 입니다. 통계 분석 #7 : 회귀모델 적합도 평가 방법 with R 통계 분석 #8 : 교차 유효성 검사 Cross-Validation with R통계 분석 #9 : 혼동행렬 개념 및 성능 평가 방법 with R 통계 분석 #10 : 머신러닝 분류회귀, ROC 곡선의 개념 군집분석의 특징군집 분석은 종속변수에 대한 독립변수의 영향과 같이 사전에 정의된 특수한 목적이 없으며, 데이터 자체에 .. 2020. 3. 29.