사분위수 범위
데이터의 중간 50% 범위를 나타내는 척도로 제3사분위수에서 제1사분위수를 뺀 값이다. 이 범위의 1.5배를 벗어나는 데이터를 이상치로 판별하는 데 사용된다. 정규분포를 따르지 않는 데이터에서도 안정적으로 이상치를 찾을 수 있는 방법이다.
"나쁜 데이터가 모델을 망치기 전에" 파이썬으로 자동화하는 데이터 품질 검사 5선