출력 팽창
프롬프트가 과도하게 압축되어 맥락을 잃은 모델이 불필요하게 길거나 반복적인 답변을 생성하여 출력 토큰이 급증하는 현상이다. 이는 입력 토큰을 줄여서 얻은 비용 절감 효과를 상쇄하며, 오히려 전체 추론 비용을 증가시키는 역효과를 낳는다.