본문으로 건너뛰기
조밀한 보상 (dense-reward) 용어 설명 | AI Trends