AbstractEdit 벤치마크
다양한 실제 장면에서 추상적 이미지 편집 능력을 측정하는 최초의 벤치마크로, 여러 모델의 추상 지시 이행 능력을 인간 판단과의 상관 관계로 평가한다.