디코드 단계
프리필 이후 토큰을 하나씩 순차적으로 생성하며 이전 단계의 KV 캐시를 참조하는 과정이다. 생성되는 토큰이 늘어날수록 참조해야 할 컨텍스트가 길어지므로, 효율적인 캐시 관리가 추론 지연 시간 제어에 핵심적이다.