본문으로 건너뛰기
reference-based-evaluation
참조 기반 평가
중급
모델의 출력을 정답(Gold Answer)과 비교하여 평가하는 방식. 정답 데이터셋이 확보된 경우 정확한 성능 측정이 가능하다.
비슷한 개념
golden-dataset
gold-standard
golden-comment
answer-relevancy
golden-comments
retrieval-benchmark
llm-judge
golden-example
← 용어 사전 전체 보기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지