두 단계 파인튜닝
VLM에 대해 먼저 선호 관계를 학습하고(sampling), 이후 점수화에 필요한 절대 점수를 학습하도록 두 단계로 파인튜닝하여 추상적 차원의 평가 기준을 정량화한다.