경계 상자 주석
이미지 내에서 특정 객체나 텍스트 필드의 위치를 사각형 좌표(x, y, 가로, 세로)로 정의하는 작업이다. 문서 이해 모델(VLM) 학습 시 텍스트의 내용뿐만 아니라 시각적 위치 정보를 함께 학습시켜 문서 구조 파악 능력을 높이는 데 필수적인 데이터이다.