자기 추측
확산 모델로 다수의 후보 토큰을 빠르게 생성(drafting)하고, AR 모델로 이를 검증하는 기법입니다. 속도와 정확성을 동시에 확보할 수 있는 하이브리드 추론 방식입니다.