상태 비저장 옵티마이저
모멘텀이나 분산과 같은 이전 그래디언트의 통계량을 저장하지 않는 최적화 알고리즘이다. 추가적인 메모리 오버헤드 없이 파라미터 업데이트를 수행하므로 VRAM 사용량을 획기적으로 줄일 수 있다.