본문으로 건너뛰기
Draft Less, Retrieve More: Speculative Decoding을 위한 하이브리드 트리 구성 | AI Trends