표준 점수
데이터가 평균으로부터 표준편차의 몇 배만큼 떨어져 있는지 나타내는 지표이다. 평균을 0, 표준편차를 1로 변환하여 계산하며 보통 ±3을 벗어나면 이상치로 간주한다. 데이터셋의 분포를 표준화하여 극단적인 값을 식별하는 데 필수적이다.
"나쁜 데이터가 모델을 망치기 전에" 파이썬으로 자동화하는 데이터 품질 검사 5선