데이터 클리닝
원천 데이터에 포함된 오류, 중복, 누락, 부정확한 형식 등을 식별하고 수정하여 데이터의 품질을 개선하는 전처리 과정이다. 분석이나 모델 학습 전 단계에서 데이터의 신뢰성을 확보하기 위해 필수적으로 수행된다.