본문으로 건너뛰기
KL 정규화 강화학습 (kl-regularized-rl) 용어 설명 | AI Trends