데이터 품질
데이터가 의도한 목적에 얼마나 적합한지를 나타내는 척도로, 머신러닝에서는 결측치, 중복, 이상치 등이 없는 깨끗한 상태를 의미한다. 모델의 성능과 신뢰성을 결정짓는 핵심 요소이다.
모델 학습 전 데이터 결함을 잡는 무료 도구 DataSanity
if/else 지옥 탈출! 도메인 프로필로 데이터 파이프라인 확장하기