에이전트 기반 평가
LLM 에이전트가 평가자가 되어 자율적으로 도구를 사용하고 판단을 내리는 평가 방식이다. 단순히 정답지와 비교하는 것이 아니라 외부 검색 등을 통해 사실 관계를 검증하므로 평가의 객관성과 심층성을 높이는 데 기여한다.