어휘 사전 가지치기
추론 시 연산량을 줄이기 위해 출력 레이어의 어휘 사전 중 사용 빈도가 낮은 토큰들을 제거하는 최적화 기법이다. 연산 효율은 높아지지만, 다국어나 특수 도메인 같은 롱테일(Long-tail) 데이터에서 예측 정확도가 떨어지는 부작용이 발생할 수 있다.