지시 이행도
사용자의 편집 지시사항을 모델이 얼마나 충실히 이행했는지를 측정하는 지표이다. 단순히 텍스트를 바꾸는 것을 넘어, 위치 변경이나 스타일 수정 등 복잡한 다중 명령을 정확히 수행했는지 평가하며, WeEdit은 이를 위해 VLM 기반의 자동 평가 시스템을 활용한다.