본문으로 건너뛰기
Gemma 2 9B의 FP8 양자화 대 비양자화 성능·지연·품질 벤치마크 (NVIDIA L4, vLLM) | AI Trends