데이터 수집 및 처리
데이터 수집 및 처리(Ingestion)는 비정형 데이터인 PDF 등을 텍스트로 추출하고 의미 단위로 분할하여 벡터 데이터베이스에 저장하는 과정이다. 33,000페이지에 달하는 대규모 문서를 검색 가능한 형태로 변환하는 RAG 시스템의 핵심적인 전처리 단계이다.