본문으로 건너뛰기

reference-based-evaluation

참조 기반 평가

중급

모델의 출력을 정답(Gold Answer)과 비교하여 평가하는 방식. 정답 데이터셋이 확보된 경우 정확한 성능 측정이 가능하다.