레이아웃 사고 기법
모델이 최종 텍스트를 생성하기 전 문서의 바운딩 박스, 요소 유형, 읽기 순서 등을 먼저 추론하는 단계이다. 텍스트 모델의 Chain-of-Thought와 유사하게 문서 구조를 먼저 파악함으로써 복잡한 레이아웃에서의 추출 정확도를 높인다.