토큰 희소성
모델이 출력할 수 있는 토큰의 양을 제한하여 정보 밀도를 높이는 기법이다. 불필요한 수식어나 페르소나 설정을 배제하고 핵심 논리에만 어텐션 메커니즘이 집중되도록 강제하여 출력의 품질을 개선한다.