Posts 2022-09-05 TIL
Post
Cancel

2022-09-05 TIL

Today

  • 자기소개서 모델 3번 구축을 제대로 시작했다.
  • 성능이 잘 나오지 않아 우선 2가지 방법을 시도해 보았다
  • 1) Smote: 불균형 데이터를 증강하여 데이터를 맞춰주는 기법으로 생각보다 성능 향상이 있어서 좋았다. (예쓰!)
  • 2) Label : 총 4개의 자기소개서 평가 항목을 3번을 제외하고 모두 Input으로 넣어보았다. 하지만 생각보다 성능이 좋아지지 않아 그냥 패스하기로 했다.
    • 더군다나 해당 input을 쓰려면 결국엔 예측모델의 결과값을 input으로 써야하는데 성능 향상이 별로라면 코드 만들고 하는게 더 효율이 낮을듯 했다.
  • 3) Param tune : 베이지안 서치로 파라미터를 튜닝했는데, 이것도 성능 향상이 좀 있었다.
  • 4) XGB ensemble : XGboost를 사용하여 앙상블을 시도했는데, 약시 앙상블은 성능향상에 대부분 답이 되나보다. 이것도 사용하기로 (LGBM 0.5 + XGB 0.5)
  • 명일은 smote + param tune + ensemble로 최적의 모델을 찾아내어 끝내는 걸로

TIL

  • 베이지안 서치를 하는것을 하나 블로깅 해야겠다.
  • 생각보다 쓸만했음

오늘의 결론

  • 내일은 오늘보다 더 나은 내일이 되기를
This post is licensed under CC BY 4.0 by the author.