class-imbalance
데이터셋에서 특정 클래스의 샘플 수가 다른 클래스에 비해 현저히 적은 상태를 의미한다. 추천 시스템에서는 클릭이나 구매 같은 양성 샘플이 매우 적어 모델이 다수 클래스에 편향되는 문제를 야기한다.
반도체 DS가 겪은 빅테크 ML 인터뷰의 충격: 모델보다 제품 이해도가 핵심
데이터가 부족해도 괜찮을까? 희귀 결함 잡아내는 9가지 실전 전략