판정 모델
다른 언어 모델이 생성한 응답의 품질을 평가하기 위해 사용되는 고성능 LLM이다. 사전에 정의된 평가 지표(정확도, 논리성 등)를 바탕으로 후보 모델들의 결과물에 점수를 부여하여 객관적인 비교를 가능하게 한다.