본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티

홈 트렌딩 검색 커뮤니티 프로필

검증 가능한 보상 (verifiable-reward) 용어 설명 | AI Trends

verifiable-reward

검증 가능한 보상

중급

에이전트의 행동 결과가 정답인지 여부를 LLM의 주관적 판단이 아닌, 데이터베이스 상태나 코드 실행 결과를 통해 객관적으로 확인하는 신호이다. 학습 과정의 신뢰도를 높이고 모호한 평가로 인한 성능 저하를 방지하는 역할을 한다.

비슷한 개념

verifiable-rewards reinforcement-learning-with-verifiable-rewards verifier-reward agentic-reinforcement-learning agentic-verifier agent-as-a-judge verifiable-task deterministic-feedback-loop

← 용어 사전 전체 보기