본문으로 건너뛰기
강화학습이 LLM 에이전트의 일반화 능력을 향상시킬 수 있는가? 실증적 연구 | AI Trends