Posts 스케일러(Scaler)
Post
Cancel

스케일러(Scaler)

1. MinMax, Standard 스케일러

1.1 스케일러(Scaler)

  • 실수(숫자, 소수점)으로 된 데이터들을 일정한 범위를 가진 수치로 변경하기 위해 필요함
  • 예를들어 어떤 데이터에서 A컬럼은 0 ~ 100의 값을 가지고, B의 컬럼은 0.1 ~ 1을 가진다고 하면 두 컬럼의 데이터들은 간격이 너무 큰 수치들로 이루어져있음
  • 컬럼들의 최대/최소 범위가 각각 다르고, 평균과 분산이 각각 다름
  • 해당 이슈를 처리하기 위해서 스케일러(Scaler)를 사용함
  • 주로 Cost Function을 최적화 할때 유효함
  • sklearn을 사용하여 할수 있음
1
2
3
4
5
6
7
8
9
10
11
12
13
from sklearn.preprocessing import MinMaxScaler, StandardScaler

# 스케일러 객체 생성
mms = MinMaxScaler()
ss = StandardScaler()

# 적용
ss.fit(X)
mms.fit(X)

# 변환
X_ss = ss.transform(X)
X_mms = mms.transform(X)

1.1.1 MinMax Scaler?

  • 최소값과 최대값을 0과 1로 맞춰주는 스케일러

1.1.2 Standard Scaler?

  • 평균을 0으로 표준편차를 1로 맞춰주는 스케일러
This post is licensed under CC BY 4.0 by the author.

Git Contribution(잔디) 안올라갈때

파이프라인(Pipeline)