Feature Transformer
Import Libraries
|
|
ColumnTransformer
|
|
OneHotEncoder()
의 handle_unknown
설정
error
: 숫자로 변환된 분류형 범주에 새로운 문자열 데이터가 들어올 경우 에러를 발생시킴ignore
: 카테고리에 해당되는 번호가 없으면 자동으로 0으로 바꿈
Preprocessing-Only
|
|
steps
: 전처리 도구를 순서대로 적용 (모델도 입력 가능)
Model Fitting
|
|
- Numeric Variables에 대한 11개의 열,
Categorical Variables에 대한 2개의 열,
카테고리 별 One-Hot Encoding이 적용된 9개의 열을 함께 표시 - Pipeline을 통해 전처리를 진행할 경우 데이터를 원래대로 되돌리는
inverse_trasnform
불가능
Preprocessing + Training
|
|
- Preprocessing과 Training을 같이 묶을 경우 다른 모델을 끼워넣기 어려움
- 위 단점 떄문에 전처리만을 사용하는 것을 권장
Preprocessing + Training + HPO
|
|