Posts
기록
Cancel

Today 자기소개서 5번째 모델링이 데이터 불균형으로 인해 성능이 좋게 나오지 않는다. 데이터가 충분했다면 언더샘플링하여 균형을 맞추었을텐데, 데이터가 충분하지 않기에 오버샘플링을 고려하였다. 결국 Smote, BorderLine Smote, ADASYN을 고려하였고, 셋중 ADASYN을 선택하였다. 증강된 데이터를 ...

Weekend 토요일은 딸램을 데리고 광교 아쿠아플라넷에 다녀왔다. 이곳은 2번째? 3번째 간것 같은데, 갈때마다 아이가 커서 그런지 반응이 달라진다. 처음에는 아무것도 모르고 보기만 하다가 지금은 펭귄을 보고 멈머! 멈머! 하던지, 상어를 보고 우와~ 한다. 점점 아이가 커가는게 느껴진다. 그리고...

Today 드디어 자기소개서 채점 자동화 Phase 1의 마무리인 4개의 평가항목 모델링을 완료했다. 이번에 개강하는 캠프에 채점한 결과를 전달하였고, 결과발표 후 한번 잘 채점되었는지 담당자가 체크할 예정이다. 이제 학습 데이터 다시 설정해서 나머지 2개 모델도 구축하면 대략적으로 모델링은 끝나는것 같다. TIL 드디어 수학의 ...

Today 화요일, 날씨도 많이 선선해지고 하늘도 맑았다. 나는 재택이라 밖에 나가지 못해 아쉬웠다. 내가 하는 일이 제대로 된건지, 그리고 내가 이렇게 하는게 맞는지 계속 의문이 든다. 자기소개서 4번 평가 항목 개발부분 모델링을 거의 완료하였다. LGBM의 파라미터 중에 L1, L2 규제가 있어 이를 사용하여 과적합을 줄였다. ...

Today 즐거운 월요일, 출근을 하였다. 오늘은 재택 근무였고 업무에 집중을 하려 노력했다. 자소서 모델링 4번에 집중하였으며, 어느정도 성능이 나와주어야 할듯 하다. TIL 성능을 파악할때 F1, Precision, Recall, Accuracy를 보기는 하지만 FN, FP의 확률의 평균과 분포도 좀 봐야할듯 하다. 틀리는 것...

Weekend 돌아온 주말, 토요일은 집에만 있기 뭐하고 밖에 날씨도 우중충해서 파미어스몰의 거북이 카페를 갔다. 거북이 카페는 입장료 인당 만원, 간단한 커피를 주고 끝나는 시간까지 자유롭게 재입장이 가능하다. 딸램은 거북이를 보고 우와 하고 소리를 질렀다. 동물에 자주 노출이되니 동물을 좋아하는것 같다 ...

Today and weeks 추석 연휴를 보내고 출근을 하였다. 이번주는 화, 금 두번 오피스 출근이였다. 화요일은 강남 6호점으로, 금요일은 원래 오피스인 강남 2호점에 갔다. 강남빌딩 침수때문에 아직도 사무실 복구가 안되어 에어컨이 안나왔다. 엄청 더웠다 결국. 진짜 사람이 쪄죽을정도로.. ...

Today and weekend 추석연휴였다. 항상 명절은 쉽지 않은것 같다. 다행히 코로나니 뭐니 해서 다 같이 한번에 모이는건 많지 않았지만, 처갓댁 식구들을 집에 초대해서 고기를 구워먹는건 참 쉽지 않았다. LA 갈비를 먹었는데, 생각보다 들어가지 않았음.. 이번 추석 연휴에는 처제들이 아기를 2번이...

Today 자기소개서 모델링 3번 완료하였다. 어차피 생각보다 성능이 잘 나오지 않는 모델이라 과감히 시간 투자를 조금 적게 가져갔다. 우선적으로 smote를 통해서 성능을 올릴수 있었으며, 어느정도 일반화는 되는것 같다. 하지만 이게 정답인지는 아무도 알수없다. 이제 추석연휴이므로 푹 쉬고 돌아오도록 하겠다. TIL 여태까지...

Today 자기소개서 모델 3번 구축을 제대로 시작했다. 성능이 잘 나오지 않아 우선 2가지 방법을 시도해 보았다 1) Smote: 불균형 데이터를 증강하여 데이터를 맞춰주는 기법으로 생각보다 성능 향상이 있어서 좋았다. (예쓰!) 2) Label : 총 4개의 자기소개서 평가 항목을 3번을 제외하고 모두 Input으로 넣어보았다. 하...