벤치마크 없는 비교 안전성 점수화
정답 레이블이 있는 기존 벤치마크 데이터셋이 존재하지 않는 특정 언어나 도메인에서 두 개 이상의 LLM 안전성을 상대적으로 비교하여 점수를 산출하는 평가 방식이다. 정답과의 일치도 대신 도구의 타당성을 검증하는 체인을 통해 평가 결과의 신뢰성을 확보한다.