G-Eval
사고의 사슬 기법을 활용하여 모델이 점수를 매기기 전 평가 이유를 먼저 서술하게 하는 프레임워크이다. 단순 점수 부여보다 인간의 판단과 더 높은 상관관계를 보인다.
사람보다 빠른 AI 평가자? LLM-as-a-Judge로 평가 자동화하기