위반율
테스트 시나리오 중 모델이 사전에 정의된 안전 원칙이나 헌법을 어기고 부적절한 답변을 생성한 비율이다. 이 수치가 낮을수록 모델이 개발자의 의도와 가이드라인에 더 잘 정렬되어 있음을 의미한다.