이상치
관측된 데이터 범위에서 다른 값들과 현저하게 차이가 나는 값을 의미한다. 측정 오류나 드문 사건으로 발생하며, 모델의 예측력을 왜곡하거나 통계적 분석 결과를 편향되게 만들 수 있다. 따라서 이를 탐지하고 적절히 처리하는 과정이 필수적이다.
모델 학습 전 데이터 결함을 잡는 무료 도구 DataSanity
지저분한 데이터가 고민인가요? 파이썬 전처리 효율을 높이는 8가지 팁