데이터셋 정제
학습 데이터에서 중복, 오류, 편향 또는 민감 정보를 제거하여 모델의 학습 효율과 안전성을 높이는 과정이다. 고품질 모델 생성을 위한 전처리 단계로, 데이터의 무결성을 보장하는 역할을 한다.