비평가(critic)이란 무엇인가요?

Question

Accepted Answer

Actor-Critic 구조에서 에이전트가 취한 행동의 가치를 평가하는 역할을 한다. 상태 가치 함수를 학습하여 정책(Actor)이 더 나은 방향으로 업데이트되도록 가이드한다.

critic