Cross validation이란 오버피팅을 방지하는 여러 기법 중 하나입니다.
저희가 모델을 만들어서 데이터로 학습을 시켰는데
학습시킨 데이터에 대해서는 loss(예측값 - 정답값)값이 적게 잘나오지만 학습시키지 않은 데이터를 넣으면 loss가 엉청 큰 경우 오버피팅이 난것입니다.
그럼 모델 만들면 test를 해봐야겟구나 하면서 나온게 train / test였습니다.
test를 통해 오버피팅을 확인해 볼 수 있었는데,
train을 다돌리고 test하니까 엉청오래걸리는 문제점이 있었습니다.
그리고 어디서부터 오버피팅이 난건지 명확하지가 않았습니다.
test/ train/ val 이렇게 3개로 나누는것이 필요하다고 느끼게 되었고 매 에포크마다 val data를 통해 매번매번 test를 하게 되었습니다.
그래서 val과 test는 차이점이 매 에포크마다 하는것인지, 다 끝나고하는것인지 이 차이밖에없기에 같은 trans를 쓰는겁니다
ex) 아래 사진을 보면 만약 val data가 없으면 어느 에포크에서 오버피팅이 시작되는지 모르기때문에 중단할수가 없습니다. 그래서 val을 도입함으로써 오버피팅 전까지만 학습시킬수 있게되며 시간절약을 할수 있게 되었습니다.
추가로 보면 좋은 사이트 :
https://wooono.tistory.com/105
### 원유승님 ####
교차 검증 관련 자료
- https://velog.io/@pppanghyun/6.-%EA%B5%90%EC%B0%A8-%EA%B2%80%EC%A6%9DCross-Validation
- https://yeong-jin-data-blog.tistory.com/entry/%ED%8C%8C%EC%9D%B4%ED%86%A0%EC%B9%98-%EC%8A%A4%ED%84%B0%EB%94%94-%EA%B8%B0%EB%B3%B8-%EC%8B%A0%EA%B2%BD%EB%A7%9D%EC%9C%BC%EB%A1%9C-%ED%9A%8C%EA%B7%80%EB%B6%84%EC%84%9D
- https://continuous-development.tistory.com/166
'공부 정리 > 면접 준비' 카테고리의 다른 글
[데이터베이스] Transaction, ACID에 대해서 설명해 보세요. (0) | 2023.03.16 |
---|---|
[ 인공지능 ] 모델의 성능 평가 지표에는 무엇이 있는가? (0) | 2023.03.09 |
[ 운영체제 ] Context Switching 과정에 대해서 설명해 보세요. (0) | 2023.03.09 |
[ 인공지능 ] Loss Surface란? (0) | 2023.03.01 |
[ 데이터 베이스 ] RDBMS와 NOSQL의 특징에 대해서 설명해 보세요. (0) | 2023.02.26 |