과잉 학습
특정 모델 크기에 대해 권장되는 최적 데이터 양보다 훨씬 더 많은 데이터를 사용하여 학습하는 기법이다. 학습 단계에서는 연산 효율이 떨어질 수 있으나, 결과적으로 모델의 지식 밀도를 높여 추론 시 더 작은 모델로도 높은 성능을 내게 함으로써 전체 서비스 비용을 절감하는 전략으로 활용된다.