본문으로 건너뛰기
RAMP: 효율적인 온디바이스 LLM 추론을 위한 강화학습 기반 적응형 혼합 정밀도 양자화 | AI Trends