본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
대리 손실 (surrogate-loss) 용어 설명 | AI Trends
surrogate-loss
대리 손실
중급
최적화하기 어려운 원래의 목적 함수 대신 계산이 용이하고 미분 가능한 형태로 설계된 대체 함수로, 강화학습에서 정책 업데이트를 안정적으로 수행하기 위해 활용된다.
비슷한 개념
surrogate-objective
surrogate-reward-learning
surrogate-model
imitation-learning
loss-function
optimization
m-grpo
optimizer
← 용어 사전 전체 보기