안전성 평가
모델이 민감하거나 고위험 상황에서 적절히 거부하거나 안전하게 대응하는지 측정하는 절차로서 시나리오 설계, 정성적 검토, 정량적 지표 수집을 통해 거부율과 위험 노출 정도를 평가하는 일련의 과정이다.