시간 기반 역전파
시계열 데이터나 학습 궤적을 따라 오차를 역전파하는 기법이다. 학습된 옵티마이저에서는 긴 훈련 과정 전체를 하나의 계산 그래프로 처리해야 하므로 계산 비용이 극도로 높다.