본문으로 건너뛰기
M5 Max에서 Qwen3.5-397B 모델 추론 속도 20.34 tok/s 달성 및 최적화 논문 공개 | AI Trends