1. 학습률의 크기에 따른 특성과 동적 학습률의 필요성

Untitled

→ 초반에는 크게 후반에는 작게 학습률을 변경시키는 방법이 좋음

Untitled

: 동적 학습률 적용하는 것.

→ 가장 많이 쓰이는 알고리즘은 아담

Untitled

2. 모멘텀

: 최적화 기법 중 하나

  1. 이점

→ 모멘텀은 시작부터 매번 계산된 그래디언트를 누적하는 형태로 구현됨