위치 편향
LLM 판독기가 여러 답변을 비교할 때 답변의 내용보다 제시된 순서에 따라 더 높은 점수를 주는 경향이다. 답변 순서를 바꿔 재평가하는 방식으로 이를 완화한다.
사람보다 빠른 AI 평가자? LLM-as-a-Judge로 평가 자동화하기
GPT-5.2보다 15배 저렴하고 14배 빠른 AI 판사, 오픈소스로 직접 만들기