보상 설계
에이전트가 달성해야 할 목표를 수학적 점수(보상)로 정의하는 과정이다. 단순한 성공/실패를 넘어 지연 시간, 비용, 안전 가드레일 준수 여부 등 여러 비즈니스 제약 조건을 가중치로 결합하여 에이전트가 기업의 의도에 맞게 행동하도록 유도하는 핵심 설계 단계이다.