다중 토큰 예측
다음 단어 하나만 예측하는 대신 여러 개의 미래 토큰을 동시에 예측하는 기법이다. 이를 통해 추론 과정에서의 병렬성을 높여 전체적인 생성 속도를 약 3배 가속화한다.