스트레이트 스루 에스티메이터
이산적인 결정(토큰 선택 등)을 포함하는 연산에서 미분 불가능한 구간을 건너뛰어 그래디언트를 전달하는 기법이다. 이를 통해 불연속적인 라우팅 결정 과정에서도 역전파를 통한 학습이 가능해진다.