Posts
기록
Cancel

0. 들어가며 파이썬을 사용하여 개발이나 데이터분석을 진행한다면 필수로 셋팅하는것 중에 하나가 가상환경 일것이다. 요즘은 도커를 많이 사용하지만, 아직 나는 도커가 익숙하지 않기에 프로젝트를 할때마다 매번 가상환경을 셋팅한다. 하지만 문제점이 하나 있는데 가상환경에 매번 주피터랩을 설치해야 한다는 것이다. 각 가상환경에 주피터랩을 설치하면 가상환...

Today 아침에 일찍 나와 토르를 보고 강남 교보문고에서 책을 샀다. 글쓰기가 부작하고 수학에 대한 개념이 낮은것 같아 문장력과 수학에 관련된 책으로 구매하였다. 회사 복지비를 이런곳에 쓰다니 좀 아깝기도 한것 같은데 잘 모르겠다 생각보다 토르는 그렇게 기대하고 볼 정도는 아니였던것 같다. 그래도 난 N회차를 할 생각이다. Wee...

Today Konlpy보다 kiwi가 사용자 정의 사전도 좋고 나름 형태소 분석을 잘하는것으로 보여 이것으로 진행하기로 함 합격, 불합격 자소서 모두 딱히 뭔가 차이가 나는 단어가 없어서 걱정임 이거 어떻게 분석을 해야하나.. IR 자료 요청으로 또 글쓰기를 해야함. 우선 어떻게 할지 고민을 해봐야겠음 ...

Today Konlpy의 사용자 사전을 추가하는 할때 변수 설정을 잘못해주고 있었다. 다행히 금방 찾아내고 변경했음 어쩐지 모두 명사로 나오더라. 텍스트 전처리할떄 일단, 특수문자를 제거 한뒤에 뭔가 하나 더 전처리를 하고 명사를 뽑아야 할듯 하다. 내일 찾아봐야지 IR ...

Today Konlpy에서 사용자 정의 사전을 추가하는 스크립트를 완성했다. 형태소 분석과 토큰화에 대해서 정의가 헷갈린것을 제대로 정리하였다. 선발 타당성 템플릿에 대해 팀 크루와의 의견을 나누고 정리하는 시간을 가졌다. 굉장히 유익했으나, 다른 분들도 그럴지..의문이다 TIL 토큰화 : 자연어...

Today KoalaNLP는 여러 형태소 분석기를 같은 API로 사용할수 있다는 장점이 있다. 근데 명사를 추가하려고하니, Java 에러가 나서 포기.. 사전 구축을 할수 없다면 다른 패키지를 찾아야한다. Konlpy를 설치 하였음 M1 mac에는 설치하는데 Java sdk가 특...

Today 자기소개서 분석을 위해 KoalaNLP를 설치 하였다. KoalaNLP : OKT, KKMA, eunjun 등 한국어 형태소 분석기를 모아놓은 패키지 각 패키지가 다른 API를 쓰고 명령어도 다른것을 통일 시켜주는 장점이 있다. Asana에 내 할일을 잊지 말고 적기 ...

Week 일요일이니까, 일주일을 돌아본다. 팀에 신규 입사자분이 오셨고 열렬히 환영하였다. 상반기를 정리하고 하반기를 준비하는데 일주일을 보냈다. 시용 기간을 정리하는 2차 리뷰도 있었으며 하반기를 준비하는데 내가 해보고 싶은 업무도 태스크로 넣을수 있었다. 잘 되야 될텐데.. 보고서 글쓰기에 대해...

Today 장마 및 감기 몸살로 인한 컨디션 저하로 인한 몇일간 회고를 작성하지 않은 나를 반성해 본다. 회사 크루분이 그간 내가 진행한 데이터 분석의 출처(스프레드시트)를 궁금해 하셨다. (아마도 내가 한것이 이상해서가 아니라 본인일 때문이겠지.) 사실 데이터 정리하면서도 이거 나 말고 누가 보겠나 란 마인드로 메모도 하...

TIL 통계적으로 유의미 하진 않지만, 그래도 눈에 많고 적음이 보인다면 이를 보고서에 작성할 때도 있다는것. 사실 이건 보여주고 싶은, 보고 싶은것만 보여주게 되는게 아닌가 싶음 결론과 결과 결과 : 연구의 결과만 작성, 표, 차트 등 실제 수치적 결과 결론 : 논리적인 전개를...