본문으로 건너뛰기
Turbo-Lossless: BF16을 12비트로 무손실 압축하여 vLLM보다 최대 2.93배 빠른 추론 구현 | AI Trends