PDF 파싱
PDF 문서 내의 텍스트, 이미지, 레이아웃 구조를 추출하여 기계가 처리할 수 있는 데이터로 변환하는 과정이다. 이 도구에서는 시각적 근거 제시를 위해 텍스트 추출뿐만 아니라 특정 좌표를 기반으로 이미지를 크롭하는 기술이 결합됐다.