통계 분석 #7 : 회귀모델 적합도 평가 방법 with R (잔차, 결정계수, F, T)
앞서 회귀모델 만드는 방법에 대한 포스팅의 연장선에서 회귀 모델 적합도를 평가하는 방법에 대해 여러분과 공유하고자 합니다. 회귀모델 적합도 평가는 말 그대로 회귀 모델이 얼마나 잘 생성되었는지를 통계량으로 평가하는 방법입니다. 즉, 모델이 예측력이 얼마나 되는지 평가하는 방법입니다. 평가 방법에는 다양한 통계량이 사용되는데, 이번 포스팅에서 관련 통계량을 공유하며, R을 이용해 실습해보겠습니다. [추천글] 통계 분석 #3 : 상관분석 정의, 상관계수 해석 기준[추천글] 통계 분석 #4 : 변수 간 인과관계, 회귀분석의 정의 및 단계[추천글] 통계 분석 #5 : 집단 간 평균 비교, ANOVA 분산분석의 정의[추천글] 통계 분석 #6 : 범주형 자료 분류 방법, 로지스틱 회귀분석 회귀 모델 적합도 평가 방..
2020. 3. 25.
통계 분석 #4 : 변수 간 인과관계, 회귀분석의 정의 및 단계 with R
회귀분석이란?회귀분석은 독립변수가 종속변수에 어느정도의 영향을 미치는지 확인하는 분석방법입니다. 회귀분석의 어원은 19세기의 우생학자가 발견한 현상에서 기인합니다. 부모의 키가 커지면 커질수록 자식의 키도 증가할 것이라고 예상했지만, 실제로는 평균키로 회귀한다는 뜻에서 '회귀(Regression)' 라는 이름이 붙었습니다. 통계 분석 #1 : 가설 설정, 표본 추출, 확률 분포, 검정 통계량통계 분석 #2 : 빅데이터 분석 및 활용 (데이터 저장, 처리, 분석, 시각화)통계 분석 #3 : 상관분석 정의, 상관계수 해석 기준 with R 회귀분석에는 두가지 형태의 변수가 있는데, 독립변수와 종속변수 입니다. 독립변수는 설정값이며, 종속변수는 반응 값과 결과 값으로 나누어집니다. 반은 값은 최적화 문제에 제..
2020. 3. 19.
통계 분석 #2 : 빅데이터 분석 및 활용 (데이터 저장, 처리, 분석, 시각화)
빅데이터 유형, 분석, 활용빅데이터는 데이터 형식에 따라 정형 데이터와 비정형 데이터로 나눌 수 있습니다. 물론, 정형 데이터와 비정형 데이터도 더 많은 데이터 형식으로 잘게 나눌 수 있습니다. 정형 데이터인지, 비정형 데이터인지에 따라 데이터 분석 기술이 다르게 적용됩니다. 결국 데이터를 분석하고 활용하는 이유는 수익실현을 위함입니다. 따라서, 빅데이터의 활용에서 시장을 예측함으로써 주식이나 비트코인의 가격을 예측하고 수익실현을 할 수 있습니다. 또한, 신제품/마케팅 전략의 활용도 결국 물건을 파는 행위이기 때문에 동일한 목적입니다. - 빅데이터 유형정형데이터 : 고객 데이터, 상품 판매 데이터비정형데이터 : SNS 활동 기록, 영상 정보, 위치 정보 - 빅데이터 분석정형데이터 : 데이터 마이닝, 회귀..
2020. 3. 17.