본문으로 건너뛰기
SlimQwen: 대형 MoE 모델 pre-training에서의 structured pruning 및 knowledge distillation 탐구 | AI Trends