본문으로 건너뛰기
vLLM: PagedAttention 기반의 고성능 대규모 언어 모델 서빙 라이브러리 | AI Trends