추론 예산
모델이 문제 해결을 위해 사용하는 컴퓨팅 자원이나 시간의 할당량을 의미한다. 작업의 중요도나 단계에 따라 추론 강도를 조절하여 효율성과 성능의 균형을 맞춘다.
모델 변경 없이 코딩 에이전트 성능을 13.7% 끌어올린 하네스 엔지니어링의 비밀