답변 관련성
모델의 답변이 사용자의 질문에 얼마나 직접적이고 적절하게 대응하는지를 평가하는 지표이다. 질문의 의도를 정확히 파악했는지 측정하며, 불필요한 정보나 중언부언을 배제하는 성능을 확인하는 데 중요하다.
수동 체크는 이제 그만, RAG 성능 회귀를 잡는 자동화 평가 전략