본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
보상 기반 실행 (reward-driven-execution) 용어 설명 | AI Trends
reward-driven-execution
보상 기반 실행
중급
활용 가능한 편집 도구의 조합을 선택하고 지역을 지정하는 실행 정책이 VLM judge의 점수(R)를 최대화하도록 학습된다.
비슷한 개념
Reasoning Enhancement
VLM-derived rewards
vision-language-judge
two-stage-fine-tuning
progressive-planning
Proxy Prompt Reinforcement Learning
vlm-as-a-judge
execution-grounded-feedback
← 용어 사전 전체 보기