본문 바로가기
공부하는 중~~/인공지능

[학습 일지] 오버피팅(overfitting)을 방지해보기 - 1

by 임대추 2021. 1. 11.

 

안녕하세요 오랜만입니다.

 

요즘 사업을 진행하며 모델을 학습하고 적합한 모델을 만들어보라는 미션을 맡게 되었는데요

이번에 2만장 데이터를 학습했는데 다 비슷한 데이터라 심한 오버피팅이 발생했습니다. 답을 외워서 조금만 다른

데이터가 주어지면 틀린 답을 내놓더라구요

그래서 석박사가 아니라 정확히는 모르지만 조사해본 결과 크게 3가지의 방법을 사용한다고 합니다.

 

1. 데이터의 양을 늘린다.

2. 모델의 복잡도를 줄인다

3. 가중치 규제를 적용한다.

 

여기서 1번은 충분한 데이터가 이미 있기때문에 패스하고 2번도 기존의 SOTA 모델의 백본을 가져와 사용하기 때문에 

3번을 적용시키기로 하였습니다.

 

제가 사용하는 모델은 efficientDet으로 2019 SOTA인 efficientNet을 사용하는 모델입니다.

그 중 빠르게 결과를 먼저 확인하려고 D0 백본을 사용했고 config 파일을 수정하여 학습을 하기로 했습니다.

 

기존의 4.0e-5로 weight decay를 했을 경우의 그래프인데 그래프가 튀는 현상이 줄어들기를 바라며 weight decay 4.0e-3으로 학습을 돌리겠습니다.

 

 

반응형

댓글