판사로서의 멀티모달 대형 언어 모델
멀티모달 모델의 성능을 평가하기 위해 다른 고성능 멀티모달 모델을 평가자로 사용하는 기법이다. 인간의 평가와 높은 상관관계를 가지면서도 대규모 평가를 빠르고 저렴하게 수행할 수 있다.