콘텐츠 차단율
모델이 안전 가이드라인이나 기술적 오류로 인해 답변 생성을 거부하거나 중단하는 비율을 의미한다. 토론의 논리력과는 별개로 모델의 운영 안정성과 신뢰도를 평가하는 중요한 지표로 활용된다.