감정가
심리학에서 자극의 긍정적 또는 부정적 가치를 나타내는 용어이다. 이 시스템에서는 에이전트의 행동에 대한 사용자의 피드백을 수치화(예: 긍정 0.8, 부정 -0.7)하여 학습 신호로 활용하는 핵심 메커니즘이다.