고정 체크리스트
각 질문마다 한 번 생성한 구체적 채점 기준을 고정하여 모든 심사자가 동일한 항목으로 채점하게 하는 루브릭 방식이다. 항목별 가중치와 판정(1, 0.5, 0)을 사용해 점수를 0~1로 정량화하고, must_mention·must_acknowledge·must_ground·must_avoid 같은 타입을 포함한다. 체크리스트를 고정함으로써 LLM-대-LLM 채점에서의 재현성과 심사자간 상관을 크게 향상시켰다.