수락률
투기적 디코딩에서 초안 모델이 제안한 토큰을 타겟 모델이 실제로 채택하는 비율로, 이 수치가 높을수록 추론 가속 효과가 커집니다.
투기적 디코딩 수락률 10% 향상으로 LLM 추론 속도 극대화