본문으로 건너뛰기
Qwen 27B 모델 프롬프트 처리 속도 최적화: GPU L3 캐시 기반 ubatch-size 설정법 | AI Trends