레이아웃 분석
문서 내 텍스트, 표, 이미지 등의 위치와 구조적 관계를 파악하는 기술이다. 인보이스처럼 복잡한 양식에서 항목 간의 논리적 연결을 이해하는 데 필수적이다. 단순 텍스트 추출보다 고차원의 정보를 제공한다.
단일 OCR의 한계 극복, 멀티 모델 융합으로 송장 인식 정확도 높인다
할루시네이션 없는 인보이스 추출: 오픈소스 하이브리드 OCR 파이프라인