Soft Thinking
연속적 소프트 토큰을 내부 사고 상태로 사용하여 디코딩 전 추론 과정을 대체하는 기법으로서 Gumbel 노이즈 유무와 스텝 수에 따라 표현의 성격이 달라진다.