환각 지표
모델이 제공된 컨텍스트에 근거하지 않은 허위 사실을 생성했는지 여부를 판별하는 기준이다. RAG 시스템의 신뢰성을 보장하는 핵심 지표로 활용된다.
사람보다 빠른 AI 평가자? LLM-as-a-Judge로 평가 자동화하기