비전-언어 판단자
edited 이미지의 결과를 평가하는 멀티모달 judge로, instruction adherence, identity preservation, 시각적 품질을 점수화한다.