데이터 준비 절차1 ML #4 : 머신러닝 데이터 준비 방법 (데이터 누락 값 처리, 정규화, 분할) 데이터 준비 필요 이유머신러닝에 활용하기 위한 데이터는 다양한 환경에서 수집되기 때문에 다양한 문제점이 발생합니다. 불완전한 데이터, 손상된 데이터, 일치하는 값이 없는 데이터 등 문제점이 있는 데이터가 수집되게 되는데 데이터의 품질이 나쁘면 머신러닝의 수행 결과도 나빠지게 됩니다. 즉, 머신러닝 결과를 통해 우수한 예측 시스템을 만들려면 데이터가 우수해야 합니다. 따라서, 좋은 데이터를 얻기 위한 데이터 준비가 필요합니다. 머신러닝을 위한 좋은 데이터는 아래와 같습니다. - 머신러닝 목적에 맞는 데이터- 손상되지 않은 데이터- 충돌하는 레코드가 없는 데이터- 누락 값이 없는 데이터- 충분한 양의 데이터 데이터 준비 절차우수한 품질의 입력 데이터를 위해 데이터 정리, 데이터 변환, 데이터 감소, 데이터 .. 2020. 4. 6. 이전 1 다음