행동 안정성
외부 노이즈나 환경 변화와 같은 스트레스 상황에서도 모델의 정책이 급격하게 변하지 않고 일관되게 유지되는 정도를 의미한다. 단순히 높은 점수를 얻는 것보다 실제 환경 배포 시 예측 가능한 동작을 보장하는 데 필수적인 요소이다.