무슨 생각을 해 그냥 하는거지

[학습정리] 2021-09-10 본문

Naver AI Tech 2기/Today I Learned

[학습정리] 2021-09-10

빛나는콩 2021. 9. 12. 00:18

※ 정보전달이 목적인 포스트가 아니라 개인 학습 기록 및 정리가 목적인 포스트입니다 ※

해당 포스트는 네이버 커넥트 재단의 부스트캠프 마스터님이신 주재걸 교수님의 강의를 바탕으로 작성되었습니다.

 

1. 강의 복습 내용

NLP 이번 주차 강의는 목요일까지 다 듣고 정리를 마쳤다.

오늘은 시각화 강의를 봤는데, 이에 대한 정리는 따로 포스트를 작성 중이다😁

 

 


2. 과제 수행 과정 / 결과물 정리

[필수과제4 번역 모델 전처리]

Preprocess

  • 하나의 문장을 여러 단어로 분리 → 각각의 단어를 index로 변환 (word2index dictionary, 같은 단어는 같은 index를 갖게 됨)
  • dictionary에 해당 단어가 없는 경우 unknown token을 넣어줘야 한다.

Bucketing

  • 모델 학습 시간을 단축하기 위해, 문장의 길이에 따라 데이터를 그룹화해 padding을 하는 기법
  • pad 최대 길이(max_pad_len) 단위로 묶어주기 위해 (문장의 길이)-(최소 문장 길이)를 max_pad_len으로 나눈 몫을 이용한다.

 

 


3. 피어세션 정리

스페셜 피어세션

  • 캐글에서 xgboost를 많이 사용한다는 정보를 공유해주셨다.
  • Name2nat 이라는 신기한 프로젝트를 공유해주셨다. (이름으로 국적을 예측하는..)
  • 이외에도 정말 다양한 이야깃거리를 나눴다... 부캠 내에서 이름이 많이 알려진 분도 계셨고 진짜 활발한 스페셜 피어세션이었다. 모두 정보를 거리낌없이 공유해주셔서 정말 유익한 시간이었다. 감사합니다 :)

피어세션

  • 팀회고를 통해 앞으로의 피어세션 활용 방향에 대해 얘기를 나눴다.

 

 


4. 학습 회고

  • 이번주는 좋은 팀원분들 덕분에 좀 더 깊게 공부해보는 시간을 가졌다.
  • 주재걸 교수님께서 강의가 정말 완벽하셔서 그동안 잘 이해가 되지 않았던 것들이 정리되었다.
  • 하지만, 다른 캠퍼님께서 말씀하신대로 강의 외에도 추가적으로 공부해야 한다... 주말에는 꼭 딥러닝을 이용한 자연어처리를 읽고 공부해야지!
  • 이렇게 부실한 학습 정리 처음이다...^^ 오늘은 나 혼자 공부해서 얻은 것보다는 다른 분들께 공유받은 자료들을 모아놓는 글을 쓰고 싶었다. 이렇게 쌓아두면 안되는데 적어도 필요할 때 찾아볼 수는 있으니까...

 

멘토링에서 얻은 자료

  • 뭔가 더 공부하고 싶을 때는, stanford cs224n의 course materials를 더 공부해봐도 좋을 것 같다고 추천해주셨다.
  • 논문 읽는 법
  • 논문 정리할 때 사용하면 좋은 툴: Mendeley (처음 보는 거였는데 앞으로 읽은 논문들을 정리할 때 정말 좋을 것 같다. 자동으로 카테고리 나눠주는 것도 좋은 듯..)

 

'Naver AI Tech 2기 > Today I Learned' 카테고리의 다른 글

[학습정리] 2021-09-23/24 특강  (1) 2021.10.07
[학습정리] 2021-09-13 ~  (0) 2021.09.23
[학습정리] 2021-09-09  (0) 2021.09.11
[학습정리] 2021-09-08  (0) 2021.09.09
[학습정리] 2021-09-07  (1) 2021.09.08