LLM 평가
사람의 정답지 없이도 LLM이 다른 모델의 출력물이나 사용자의 응답을 논리적 기준에 따라 채점하고 피드백을 제공하는 기법이다. 정성적인 뉘앙스를 수치화하여 시스템의 성능을 측정하는 데 필수적이다.