블라인드 판정
평가자가 평가 대상의 생성 주체나 순서 등 부가 정보를 모르는 상태에서 오직 결과물의 품질만으로 우열을 가리는 평가 방식이다. AI 에이전트 시스템에서 수치화하기 어려운 주관적 작업의 성능을 객관적으로 측정하기 위한 지표로 활용된다.