instruction-adherence
지시 이행도
사용자의 편집 지시사항을 모델이 얼마나 충실히 이행했는지를 측정하는 지표이다. 단순히 텍스트를 바꾸는 것을 넘어, 위치 변경이나 스타일 수정 등 복잡한 다중 명령을 정확히 수행했는지 평가하며, WeEdit은 이를 위해 VLM 기반의 자동 평가 시스템을 활용한다.
지시 이행도
사용자의 편집 지시사항을 모델이 얼마나 충실히 이행했는지를 측정하는 지표이다. 단순히 텍스트를 바꾸는 것을 넘어, 위치 변경이나 스타일 수정 등 복잡한 다중 명령을 정확히 수행했는지 평가하며, WeEdit은 이를 위해 VLM 기반의 자동 평가 시스템을 활용한다.