지식 베이스 구축
비정형 데이터에서 구조화된 지식을 추출하여 기계가 이해할 수 있는 형태로 저장하는 과정이다. PDF와 같은 문서에서 핵심 정보를 추출하고 Q&A 쌍을 합성하여 모델이 학습 가능한 지식 자산으로 변환하는 일련의 파이프라인을 의미한다.