능동 선택
전체 데이터셋 중 모델 학습에 가장 기여도가 높거나 정보량이 많은 샘플을 전략적으로 선택하는 방법이다. 무작위 학습보다 적은 데이터로도 높은 성능을 낼 수 있게 한다.
음성 인식 LLM 성능 저하 문제, 10배 적은 데이터로 해결한 애플의 SALAD