본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
보상 검증기 (reward-validator) 용어 설명 | AI Trends
reward-validator
보상 검증기
중급
태스크 성공 여부를 결정하는 자동 검증 로직으로, 환경 상태를 재설정해도 일관된 보상을 제공하도록 설계된다.
비슷한 개념
deterministic-verifier
agentic-verifier
validation-logic
verifiable-rewards
task-verifier
verifier-reward
verifiable-reward
reinforcement-learning-with-verifiable-rewards
← 용어 사전 전체 보기