시각적 표식 세트
이미지 위에 숫자나 바운딩 박스 같은 시각적 표식을 덧씌워 모델의 이해를 돕는 기법이다. 모델이 복잡한 화면 구조를 더 쉽게 파악하고 특정 요소를 식별할 수 있게 한다.
RTX 4070으로 구현하는 로컬 GUI 자동화: 최적의 VLM과 런타임은?