본문으로 건너뛰기
Amazon SageMaker 및 Bedrock에서 vLLM을 활용한 효율적인 Multi-LoRA MoE 모델 서빙 최적화 | AI Trends