이상치 클리핑
데이터의 극단적인 값을 제거하는 대신 특정 범위(예: 1~99 백분위) 내의 최대/최소값으로 강제 고정하는 방법이다. 데이터 분포를 안정화하면서도 샘플 수를 유지할 수 있다.
지저분한 데이터 전처리, 파이썬 한 줄 코드로 끝내는 8가지 비법