본문으로 건너뛰기
SlimSpec: 가속된 Speculative Decoding을 위한 저랭크 드래프트 LM-head | AI Trends