본문으로 건너뛰기
vLLM의 AMD ROCm 전용 어텐션 백엔드: MHA 및 MLA 최적화 가이드 | AI Trends