자기회귀 디코딩
이전 토큰을 기반으로 다음 토큰을 하나씩 순차적으로 생성하는 추론 단계이다. 병렬 처리가 가능한 프리필 단계와 달리 연산 집약도보다 메모리 대역폭에 의해 성능이 제한되는 경향이 있다.