deterministic-policy-evaluation
결정론적 정책 평가
확률에 기반한 LLM의 판단과 달리, 사전에 정의된 명확한 규칙 세트에 따라 도구 실행의 허용 여부를 예/아니오로 판별하는 보안 메커니즘이다. 모델의 가변적인 행동을 통제하기 위해 실행 직전 단계에서 강제적인 검증 절차를 거치게 하여 안전성을 확보하는 것이 핵심이다.
결정론적 정책 평가
확률에 기반한 LLM의 판단과 달리, 사전에 정의된 명확한 규칙 세트에 따라 도구 실행의 허용 여부를 예/아니오로 판별하는 보안 메커니즘이다. 모델의 가변적인 행동을 통제하기 위해 실행 직전 단계에서 강제적인 검증 절차를 거치게 하여 안전성을 확보하는 것이 핵심이다.