docling
IBM에서 개발한 오픈소스 문서 파싱 도구로, PDF나 이미지 등 복잡한 문서를 AI가 처리하기 좋은 마크다운 형식으로 변환한다. 레이아웃 분석과 OCR을 결합하여 문서의 구조를 정확하게 파악하는 것이 특징이다.
PDF 파싱의 혁명: Langflow와 Docling으로 지저분한 문서를 깔끔한 마크다운으로