결정론적 정책 평가(deterministic-policy-evaluation)이란 무엇인가요?

Question

Accepted Answer

확률에 기반한 LLM의 판단과 달리, 사전에 정의된 명확한 규칙 세트에 따라 도구 실행의 허용 여부를 예/아니오로 판별하는 보안 메커니즘이다. 모델의 가변적인 행동을 통제하기 위해 실행 직전 단계에서 강제적인 검증 절차를 거치게 하여 안전성을 확보하는 것이 핵심이다.

deterministic-policy-evaluation