정의2 ML #6 : 머신러닝 지도학습 기본 개념 (분류, 예측) 지도학습 이란?지도학습이란, 컴퓨터에게 어떤 것이 맞는 답인지를 지정해줌으로써 모델을 생성했을 때, 컴퓨터는 지정해 준 답과 비슷한 것을 판단해서 맞는 것이 무엇인지 판단하게 됩니다. 맞는 답이란 목적 값인 Target Value 입니다. 지도학습을 위해서는 세가지를 따져봐야 합니다. 무엇을 분석할 것인지, 분석을 위한 준비 사항은 무엇인지에 대해 정의되어야하며, 머신러닝에 사용하기 위한 데이터 준비가 필요합니다. 학습을 위한 데이터는 최대한 정답에 가까운 데이터가 필요합니다. 지도학습의 방법에는 크게 분류(Classification)와 예측(Regression)이 있습니다. 예측은 Continuous Value가 목적 값이며, 분류는 Ordinal Data가 목적 값으로 머신러닝을 수행합니다. 간단하게.. 2020. 4. 10. 통계 분석 #5 : 집단 간 평균 비교, ANOVA 분산분석의 정의 및 가정 분산분석 이란?두 개 이상의 집단의 평균을 비교하여 집단의 평균 차이가 있는지를 통계적으로 분석하는 기법을 분산분석이라고 정의합니다. 예를 들면 약을 섭취한 집단과 섭취하지 않은 집단의 몸무게 차이를 비교하여 약이 몸무게에 영향을 줬는지에 대해 비교 할 수 있습니다. - 분산분석 : 두 개 이상 집단들의 평균을 비교하는 통계적 분석 기법- 분산분석 이유 : 집단들의 평균 차이 비교- t검정 : 두집단 강의 평균 차이를 검증- F검정 : 집단간 변화량과 집단내 변화량을 이용하여 세집단 이상을 비교 집단 간 평균 차이 = 집단 간 분산이 크다 → 집단간 분산이 클수록 집단 간 평균이 서로 다를 가능성이 높다. 통계 분석 #1 : 가설 설정, 표본 추출, 확률 분포, 검정 통계량통계 분석 #2 : 빅데이터 분.. 2020. 3. 19. 이전 1 다음