비전 평가 벤치마크
비전 평가 벤치마크는 이미지·문서·장면 이해 등 다양한 시각 과제를 동일한 조건으로 테스트하는 평가 집합으로, 입력 이미지와 프롬프트를 모델에 주고 정답 비율로 성능을 측정한다. 이 문맥에서는 Roboflow가 만든 67개 프롬프트 세트를 사용해 모델 간 상대 성능과 약점을 비교하는 기준 역할을 한다.