본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
어드밴티지 재추정 (advantage-re-estimation) 용어 설명 | AI Trends
advantage-re-estimation
어드밴티지 재추정
고급
강화학습에서 특정 행동이 평균보다 얼마나 더 좋은지를 나타내는 어드밴티지 값을 새로운 정보나 시각을 바탕으로 다시 계산하는 과정입니다.
비슷한 개념
advantage-estimation
advantage-function
advantage-baseline
gae
value-function
q-value
a2c
advantage-conditioned-policy
← 용어 사전 전체 보기