CC News 데이터셋
CC News는 웹에서 수집된 뉴스 기사 텍스트를 모은 대규모 코퍼스로, 벡터 테스트셋 구축 워크플로에서는 원본 텍스트 소스로 사용되어 임베딩 생성의 입력 데이터 역할을 한다.