본문으로 건너뛰기
컨티뉴어스 배칭(Continuous Batching): LLM 추론 처리량 극대화를 위한 가이드 | AI Trends