말뭉치
언어 연구나 모델 학습을 위해 수집된 대규모 텍스트 데이터의 집합이다. 웹 페이지, 책, 뉴스 등 다양한 출처에서 수집되며 AI 모델이 언어의 구조와 지식을 학습하는 원천이 된다.