비정형 데이터 파이프라인
PDF, 이미지, 오디오 등 고정된 형식이 없는 데이터를 처리하여 유의미한 정보를 추출하는 과정이다. 정형 데이터와 달리 버전 관리가 까다롭지만, DVC를 통해 각 단계의 에셋을 체계적으로 관리할 수 있다.