파이썬을 이용해 데이터 정규화를 해야 하는 일이 자주 있습니다. 대표적으로, 텐서플로우를 활용한 머신러닝 혹은 딥러닝이 이에 해당합니다. 이번 포스팅에서는 파이썬을 사용한 최대 최소 데이터 정규화 방법에 대해 여러분과 공유하고자합니다.
최대 최소 데이터 정규화는 sklearn 패키지의 MinMaxScaler를 사용하여 간단하게 구현 가능합니다. 바로 본론 및 예제에 적용해보겠습니다.
예제 데이터
최대 최소 정규화를 예제로 구현해보기 위해서는 데이터가 필요합니다. Numpy를 사용해서 예제 데이터를 생성하겠습니다. 아시겠지만, 데이터 엔지니어링을 위해서 Numpy의 사용은 필수적입니다. 많은 패키지와 연동이 잘 되어있기 때문입니다.
최대 최소 정규화 예제 적용을 위한 데이터는 아래와 같습니다.
# 예제 데이터 선언
import numpy as np
Input_data = np.array([[1,1], [2,2], [3,3], [4,4], [5,5], [6,6], [7,7], [8,8]])
Output_data = np.array([[1], [2], [3], [4], [5], [6], [7], [8]])
최대 최소 정규화 예제 코드
예제 데이터를 사용해서 최대 최소 정규화 예제 코드를 구현해보겠습니다. sklearn의 MinMaxScaler를 사용해서 코드를 구현했으며, 세부 코드는 아래와 같습니다.
# Max-min Normalization
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(Input_data)
Normalized_Values = scaler.transform(Input_data)
최대 최소 정규화 코드를 구현하면 아래와 같이 출력됩니다. 정상적으로 예제 코드가 동작한 것을 확인할 수 있습니다.
array([[0. , 0. ],
[0.14285714, 0.14285714],
[0.28571429, 0.28571429],
[0.42857143, 0.42857143],
[0.57142857, 0.57142857],
[0.71428571, 0.71428571],
[0.85714286, 0.85714286],
[1. , 1. ]])
마치며
이번 포스팅에서는 머신러닝 혹은 딥러닝을 위해 최대 최소 정규화 방법에 대해 여러분과 공유했습니다. 파이썬의 sklearn 패키지를 사용하면 해당 방법을 간단하게 구현할 수 있습니다.
댓글