본문으로 건너뛰기
비미분 가능 보상 (non-differentiable-reward) 용어 설명 | AI Trends