평가기
LLM이 생성한 답변의 품질을 사전에 정의된 기준(정확성, 안전성, 형식 등)에 따라 점수화하거나 통과 여부를 판정하는 도구이다. 자동화된 QA 루프에서 테스트 성공 여부를 결정하는 핵심 요소이다.