본문으로 건너뛰기
강화학습 롤아웃 (rl-rollout) 용어 설명 | AI Trends