구조화된 데이터 추출
송장이나 영수증 같은 비정형 텍스트에서 JSON과 같이 기계가 읽을 수 있는 특정 형식의 데이터를 뽑아내는 과정이다. 데이터 타입(숫자 vs 문자열)의 미세한 변화가 전체 파이프라인을 중단시킬 수 있어 엄격한 검증이 필요하다.