평가 지표
LLM이나 RAG 시스템의 성능을 정량적으로 측정하기 위한 기준이다. 검색의 정확도를 측정하는 Hit Rate나 MRR, 생성된 답변의 품질을 측정하는 Faithfulness 등 실무적인 성능 검증에 사용된다.