일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- error
- GRU
- ai tech
- tril
- 네이버 부스트캠프
- RNN
- band_part
- Linux
- kernel density estimation
- Til
- Chrome Remote Desktop
- nn.Sequential
- tensorflow
- forward
- LSTM
- triu
- pytorch
- 크롬 원격 데스크톱
- ubuntu
- kde
- Today
- Total
무슨 생각을 해 그냥 하는거지
[학습정리] 2021-08-27 본문
※ 정보전달이 목적인 포스트가 아니라 개인 학습 기록 및 정리가 목적인 포스트입니다 ※
해당 포스트는 네이버 커넥트 재단의 부스트캠프 마스터님이신 최성철 교수님의 강의를 바탕으로 작성되었습니다.
1. 강의 복습 내용
[Ensemble]
Model Averaging (Voting)
- Hard Voting : 각각의 모델들의 prediction label (class값) 중 가장 많은 class를 최종 result로 선정
- Soft Voting : 각각의 모델들의 prediction 값을 모두 더해 그 중 최댓값을 최종 result로 선정
Stratified K-Fold Cross Validation
: Train/Validation dataset을 나눌 때 class의 분포까지 고려하는 것
sklearn에서 제공하는 패키지가 있다.
- n_splits: fold의 개수 (default=True)
- shuffle: batch로 나누기 전에 각 class의 샘플들을 섞을 것인지 (default=False)
TTA (Test Time Augmentation)
: Test 할 때 test 이미지에 augmentation을 한 데이터들을 train한 모델에 넣고, 그 예측값들의 평균을 내어 좀 더 confident한 result를 만들어내는 것.
2. 과제 수행 과정 / 결과물 정리
[P-stage: Mask-Classification Day5]
진행상황) age, gender, mask로 label을 나누고 각각의 label을 예측하는 모델 3개를 만들었는데 단일 모델을 쓰는 것보다 성능이 좋지 못했다.
문제1) 이때까지 validation f1 score는 높은데 리더보드의 결과는 낮은 것에 대해 굉장히 의문을 품었었는데, 다른 캠퍼분께서 올려주신 글을 보고 답을 찾았다. train/validation 데이터셋을 나눌 때 그냥 이미지를 무작위로 나누면 같은 사람이 train dataset과 validation dataset에 들어가기 때문에 validation 결과가 좋을 수 밖에 없다. 분명 피어세션에서 이런 얘기를 나눴던 것 같은데 놓쳐버렸다..ㅠ
→ 해결방안) 사람을 기준으로 validation set을 나누면 해결 될 것.. 다행히 오늘 공개된 베이스라인에 있다^_ㅠ
해 볼 것)
- 18 class를 예측하는 모델을 여러 개 만들어 앙상블
- 외부 데이터셋 사용 (license가 괜찮다면..)
3. 피어세션 정리
- 다른 캠퍼님의 수업 정리 발표!
- 팀 제출 횟수가 한정적이므로 어떻게 제출할지 논의
- 협업을 위해 git 활용 + 구글 스프레드시트를 이용해 실험 결과 정리
4. 학습 회고
- 학습 정리는 매일 다 써놓고 자야겠다.. 이틀 전에 어떤 모델로 어떤 성능을 냈는지 기억이 잘 안난다. (당장 오늘 것도 기억 안남ㅎ)
- 매번 다른 캠퍼님들께서 공유해주는 글을 보고 놀란다. 어떻게 저런 생각을 하는거지? 나도 번뜩이는 생각을 해서 공유할 수 있는 기회가 왔으면 좋겠다.
- 오늘 오피스아워에서 김보찬 멘토님께서 베이스라인 코드에 대한 자세한 설명을 해주셨다. 이때까지 vscode를 쓰면서 코드 템플릿이 있는지는 몰랐는데, 멘토님께서 pycharm을 잘 활용하시는 것을 보면서 혹했다.. (어떤 캠퍼분께서 유료 광고 포함이라고 채팅하셔서 너무 웃겼다ㅋㅋㅋ) Snippets(코드 자동완성) 하는 법, github 코드트리 등 여러가지를 배울 수 있는 알찬 시간이었다.
'Naver AI Tech 2기 > Today I Learned' 카테고리의 다른 글
[학습정리] 2021-09-07 (1) | 2021.09.08 |
---|---|
[학습정리] 2021-09-06 (4) | 2021.09.07 |
[학습정리] 2021-08-25 (0) | 2021.08.27 |
[학습정리] 2021-08-24 (0) | 2021.08.24 |
[학습정리] 2021-08-23 (0) | 2021.08.24 |